GPT-5 (low)

Unknown Size

By OpenAI • Released 2025-08-07

Capability Radar

Avg Score

61

Across all benchmarks

Participated

13

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MATH-500	Reasoning	98.7
MMLU-Pro	Knowledge	86
𝜏²-Bench Telecom	Reasoning Knowledge	84.2
AIME 2025	Reasoning	83
GPQA Diamond	Knowledge	80.8
LiveCodeBench	Coding	76.3
IFBench	Agent	66.6
LCR	Long-Context Reasoning	58.7
SciCode	Reasoning Knowledge	39.1
Artificial Analysis Intelligence Index	Knowledge	39
Artificial Analysis Coding Index	Coding	30.7
Terminal-Bench Hard	Agent Coding	26.5
HLE	Knowledge Multi-Modal	18.4