Llama 3.2 Instruct 3B

Unknown Size

By Meta • Released 2024-09-25

Capability Radar

Avg Score

17

Across all benchmarks

Participated

11

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MATH-500	Reasoning	48.9
MMLU-Pro	Knowledge	34.7
IFBench	Agent	26.2
GPQA Diamond	Knowledge	25.5
𝜏²-Bench Telecom	Reasoning Knowledge	21.1
Artificial Analysis Intelligence Index	Knowledge	9.7
LiveCodeBench	Coding	8.3
HLE	Knowledge Multi-Modal	5.2
SciCode	Reasoning Knowledge	5.2
AIME 2025	Reasoning	3.3
LCR	Long-Context Reasoning	2