Cogito v2.1 (Reasoning)

Unknown Size

By Deep Cogito • Released 2025-11-18

Capability Radar

Avg Score

Across all benchmarks

Participated

Benchmarks

Benchmark	Category	Score
MMLU-Pro	Knowledge	84.9
GPQA Diamond	Knowledge	76.8
AIME 2025	Reasoning	72.7
LiveCodeBench	Coding	68.8
IFBench	Agent	46.3
SciCode	Reasoning Knowledge	41
Artificial Analysis Coding Index	Coding	24.8
LCR	Long-Context Reasoning	21.7
Terminal-Bench Hard	Agent Coding	16.7
HLE	Knowledge Multi-Modal	11