K2-V2 (low)

Unknown Size

By MBZUAI Institute of Foundation Models • Released 2025-12-05

Capability Radar

Avg Score

Across all benchmarks

Participated

Benchmarks

Benchmark	Category	Score
MMLU-Pro	Knowledge	71.3
GPQA Diamond	Knowledge	54.1
IFBench	Agent	41
LiveCodeBench	Coding	39.3
AIME 2025	Reasoning	35.3
SciCode	Reasoning Knowledge	22.3
𝜏²-Bench Telecom	Reasoning Knowledge	20.8
LCR	Long-Context Reasoning	19
Artificial Analysis Intelligence Index	Knowledge	14.4
Artificial Analysis Coding Index	Coding	10.5
Terminal-Bench Hard	Agent Coding	4.5
HLE	Knowledge Multi-Modal	3.9