Olmo 3 7B Instruct

Unknown Size

By Allen Institute for AI • Released 2025-11-20

Capability Radar

Avg Score

19

Across all benchmarks

Participated

12

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MMLU-Pro	Knowledge	52.2
AIME 2025	Reasoning	41.3
GPQA Diamond	Knowledge	40
IFBench	Agent	32.8
LiveCodeBench	Coding	26.6
𝜏²-Bench Telecom	Reasoning Knowledge	12.6
SciCode	Reasoning Knowledge	10.3
Artificial Analysis Intelligence Index	Knowledge	8.1
HLE	Knowledge Multi-Modal	5.8
Artificial Analysis Coding Index	Coding	3.4
LCR	Long-Context Reasoning	0
Terminal-Bench Hard	Agent Coding	0