GPT-5 (high)

Unknown Size

By OpenAI • Released 2025-08-07

Capability Radar

Avg Score

68

Across all benchmarks

Participated

14

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MATH-500	Reasoning	99.4
AIME 2025	Reasoning	94.3
MMLU-Pro	Knowledge	87.1
GPQA Diamond	Knowledge	85.4
𝜏²-Bench Telecom	Reasoning Knowledge	84.8
LiveCodeBench	Coding	84.6
τ-bench	Agent Knowledge	80
LCR	Long-Context Reasoning	75.6
IFBench	Agent	73.1
Artificial Analysis Intelligence Index	Knowledge	44.6
SciCode	Reasoning Knowledge	42.9
Artificial Analysis Coding Index	Coding	36
Terminal-Bench Hard	Agent Coding	32.6
HLE	Knowledge Multi-Modal	26.5