GLM-4.5V (Reasoning)

Unknown Size

By Z AI • Released 2025-08-11

Capability Radar

Avg Score

33

Across all benchmarks

Participated

12

Benchmarks

Benchmark Performance

Benchmark	Category	Score
MMLU-Pro	Knowledge	78.8
AIME 2025	Reasoning	73
GPQA Diamond	Knowledge	68.4
LiveCodeBench	Coding	60.4
IFBench	Agent	34.2
𝜏²-Bench Telecom	Reasoning Knowledge	22.5
SciCode	Reasoning Knowledge	22.1
Artificial Analysis Intelligence Index	Knowledge	14.9
Artificial Analysis Coding Index	Coding	10.9
HLE	Knowledge Multi-Modal	5.9
Terminal-Bench Hard	Agent Coding	5.3
LCR	Long-Context Reasoning	0