GLM-4.7 (Reasoning)

Unknown Size

By Z AI • Released 2025-12-22

Capability Radar

Avg Score

64

Across all benchmarks

Participated

12

Benchmarks

Benchmark Performance

Benchmark	Category	Score
𝜏²-Bench Telecom	Reasoning Knowledge	95.9
AIME 2025	Reasoning	95
LiveCodeBench	Coding	89.4
GPQA Diamond	Knowledge	85.9
MMLU-Pro	Knowledge	85.6
IFBench	Agent	67.9
LCR	Long-Context Reasoning	64
SciCode	Reasoning Knowledge	45.1
Artificial Analysis Intelligence Index	Knowledge	42
Artificial Analysis Coding Index	Coding	36.3
Terminal-Bench Hard	Agent Coding	31.8
HLE	Knowledge Multi-Modal	25.1