Llama 3.2 Instruct 1B

Unknown Size

By Meta • Released 2024-09-25

Capability Radar

Avg Score

9

Across all benchmarks

Participated

13

Benchmarks

Benchmark Performance

Benchmark	Category	Score
IFBench	Agent	22.8
MMLU-Pro	Knowledge	20
GPQA Diamond	Knowledge	19.6
MATH-500	Reasoning	14
𝜏²-Bench Telecom	Reasoning Knowledge	12.3
Artificial Analysis Intelligence Index	Knowledge	9.1
HLE	Knowledge Multi-Modal	5.3
LCR	Long-Context Reasoning	5
LiveCodeBench	Coding	1.9
SciCode	Reasoning Knowledge	1.7
Artificial Analysis Coding Index	Coding	0.6
AIME 2025	Reasoning	0
Terminal-Bench Hard	Agent Coding	0