OLMo 2 7B

Unknown Size

By Allen Institute for AI • Released 2024-11-26

Capability Radar

Avg Score

9

Across all benchmarks

Participated

12

Benchmarks

Benchmark Performance

Benchmark	Category	Score
GPQA Diamond	Knowledge	28.8
MMLU-Pro	Knowledge	28.2
IFBench	Agent	24.4
Artificial Analysis Intelligence Index	Knowledge	9.3
HLE	Knowledge Multi-Modal	5.5
LiveCodeBench	Coding	4.1
SciCode	Reasoning Knowledge	3.7
Artificial Analysis Coding Index	Coding	1.2
AIME 2025	Reasoning	0.7
LCR	Long-Context Reasoning	0
𝜏²-Bench Telecom	Reasoning Knowledge	0
Terminal-Bench Hard	Agent Coding	0