Llama 3 Instruct 8B

Unknown Size

By Meta • Released 2024-04-18

Capability Radar

Avg Score

17

Across all benchmarks

Participated

11

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MATH-500	Reasoning	49.9
MMLU-Pro	Knowledge	40.5
GPQA Diamond	Knowledge	29.6
IFBench	Agent	24.6
SciCode	Reasoning Knowledge	11.9
LiveCodeBench	Coding	9.6
Artificial Analysis Intelligence Index	Knowledge	8.7
HLE	Knowledge Multi-Modal	5.1
Artificial Analysis Coding Index	Coding	4
LCR	Long-Context Reasoning	0
Terminal-Bench Hard	Agent Coding	0