GLM-4.6 (Non-reasoning)

Unknown Size

By Z AI • Released 2025-09-30

Capability Radar

Avg Score

43

Across all benchmarks

Participated

13

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MMLU-Pro	Knowledge	78.4
𝜏²-Bench Telecom	Reasoning Knowledge	76.9
GPQA Diamond	Knowledge	63.2
LiveCodeBench	Coding	56.1
SWE-bench (Bash Only)	Coding Agent	55.4
AIME 2025	Reasoning	44.3
IFBench	Agent	36.7
SciCode	Reasoning Knowledge	33.1
Artificial Analysis Coding Index	Coding	30.2
Artificial Analysis Intelligence Index	Knowledge	30.1
Terminal-Bench Hard	Agent Coding	28.8
LCR	Long-Context Reasoning	26.3
HLE	Knowledge Multi-Modal	5.2