GPT-5.2 (medium)

Unknown Size

By OpenAI • Released 2025-12-11

Capability Radar

Avg Score

64

Across all benchmarks

Participated

12

Benchmarks

Benchmark Performance

Benchmark	Category	Score
AIME 2025	Reasoning	96.7
LiveCodeBench	Coding	89.4
GPQA Diamond	Knowledge	86.4
MMLU-Pro	Knowledge	85.9
𝜏²-Bench Telecom	Reasoning Knowledge	74.3
IFBench	Agent	65.2
LCR	Long-Context Reasoning	63.3
Artificial Analysis Intelligence Index	Knowledge	46.6
SciCode	Reasoning Knowledge	46.2
Artificial Analysis Coding Index	Coding	44.2
Terminal-Bench Hard	Agent Coding	43.2
HLE	Knowledge Multi-Modal	24.9