GPT-4o (ChatGPT)

Unknown Size

By OpenAI • Released 2025-02-15

Capability Radar

Avg Score

Across all benchmarks

Participated

Benchmarks

Benchmark	Category	Score
MATH-500	Reasoning	79.7
MMLU-Pro	Knowledge	77.3
LCR	Long-Context Reasoning	53
GPQA Diamond	Knowledge	51.1
SciCode	Reasoning Knowledge	33.4
Artificial Analysis Intelligence Index	Knowledge	14.1
HLE	Knowledge Multi-Modal	3.7