GPT-5.2 (xhigh)

Unknown Size

By OpenAI • Released 2025-12-11

Capability Radar

Avg Score

70

Across all benchmarks

Participated

13

Benchmarks

Benchmark Performance

Benchmark	Category	Score
AIME 2025	Reasoning	99
GPQA Diamond	Knowledge	90.3
LiveCodeBench	Coding	88.9
MMLU-Pro	Knowledge	87.4
𝜏²-Bench Telecom	Reasoning Knowledge	84.8
IFBench	Agent	75.4
LCR	Long-Context Reasoning	72.7
SWE-bench (Bash Only)	Coding Agent	71.8
SciCode	Reasoning Knowledge	52.1
Artificial Analysis Intelligence Index	Knowledge	51.2
Artificial Analysis Coding Index	Coding	48.7
Terminal-Bench Hard	Agent Coding	47
HLE	Knowledge Multi-Modal	35.4