GLM-5 (Reasoning)

Unknown Size

By Z AI • Released 2026-02-11

Capability Radar

Avg Score

58

Across all benchmarks

Participated

9

Benchmarks

Benchmark Performance

Benchmark	Category	Score
𝜏²-Bench Telecom	Reasoning Knowledge	98.2
GPQA Diamond	Knowledge	82
IFBench	Agent	72.3
LCR	Long-Context Reasoning	63.3
Artificial Analysis Intelligence Index	Knowledge	49.6
SciCode	Reasoning Knowledge	46.2
Artificial Analysis Coding Index	Coding	44.2
Terminal-Bench Hard	Agent Coding	43.2
HLE	Knowledge Multi-Modal	27.2