GPT-5.2 Codex (xhigh)

Unknown Size

By OpenAI • Released 2025-12-11

Capability Radar

Avg Score

61

Across all benchmarks

Participated

9

Benchmarks

Benchmark Performance

Benchmark	Category	Score
𝜏²-Bench Telecom	Reasoning Knowledge	92.1
GPQA Diamond	Knowledge	89.9
IFBench	Agent	77.6
LCR	Long-Context Reasoning	75.7
SciCode	Reasoning Knowledge	54.6
Artificial Analysis Intelligence Index	Knowledge	49
Artificial Analysis Coding Index	Coding	43
Terminal-Bench Hard	Agent Coding	37.1
HLE	Knowledge Multi-Modal	33.5