Llama 3.2 Instruct 11B (Vision)

Unknown Size

By Meta • Released 2024-09-25

Capability Radar

Avg Score

17

Across all benchmarks

Participated

13

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MATH-500	Reasoning	51.6
MMLU-Pro	Knowledge	46.4
IFBench	Agent	30.4
GPQA Diamond	Knowledge	22.1
𝜏²-Bench Telecom	Reasoning Knowledge	14.6
LCR	Long-Context Reasoning	11.7
SciCode	Reasoning Knowledge	11.2
LiveCodeBench	Coding	11
Artificial Analysis Intelligence Index	Knowledge	10.9
HLE	Knowledge Multi-Modal	5.2
Artificial Analysis Coding Index	Coding	4.3
AIME 2025	Reasoning	1.7
Terminal-Bench Hard	Agent Coding	0.8