Kimi K2.5

CurrentVerified · Jun 27, 2026

Open-weight native-multimodal agentic model; selectable id in the API chat enum (kimi-k2.5) AND open-sourced at github.com/MoonshotAI/Kimi-K2.5 (repo tagline 'Moonshot's most powerful model'; HF org huggingface.co/moonshotai). README verbatim: 'Kimi K2.5 is an open-source, native multimodal agentic

profile normalized against the 70-model field

Context window· 262K of 10M3%

Max output· 16K of 384K4%

Output speed—

Affordability· $3.00 / Mtok out98%

Capability breadth· 3 of 1127%

Capability switches · 3 of 11

Reasoning mode

Tool / function use

Streaming

JSON mode

Structured outputs

Prompt caching

Fine-tuning

Web search

Code execution

Vision input

Audio input

Specifications

Every value carries a primary source and a verification date.

Capacity

Context window

262K

Max output

16K

Pricing

Input $/Mtok

$0.60 / 1M input tokens USD per 1M tokens

Cached input $/Mtok

$0.10 / Mtok USD/Mtok

Output $/Mtok

$3.00 / 1M output tokens USD per 1M tokens

Capabilities

Reasoning mode

Yes

Tool / function use

Yes

Vision input

Yes

API

API model ID

kimi-k2.5

General

Release date

January 27, 2026

Benchmarks

Sourced evaluation scores, each verified against its primary source.

MMLU-Pro

87.1 %Verified

GPQA Diamond

<td align="center" style="vertical-align: middle">GPQA-Diamond</td> <td align="center" style="vertical-align: middle">87.6</td>

87.6 %Verified

AIME 2025

96.1 %Verified

HMMT 2025 (Feb)

95.4 %Verified

HLE-Full

30.1 %Verified

HLE-Full (w/ tools)

<td align="center" style="vertical-align: middle">HLE-Full<br>(w/ tools)</td> <td align="center" style="vertical-align: middle">50.2</td>

50.2 %Verified

IMO-AnswerBench

<td align="center" style="vertical-align: middle">IMO-AnswerBench</td> <td align="center" style="vertical-align: middle">81.8</td>

81.8 %Verified

SWE-bench Verified

<td align="center" style="vertical-align: middle">SWE-Bench Verified</td> <td align="center" style="vertical-align: middle">76.8</td>

76.8 %Verified

SWE-Bench Pro

<td align="center" style="vertical-align: middle">SWE-Bench Pro</td> <td align="center" style="vertical-align: middle">50.7</td>

50.7 %Verified

SWE-Bench Multilingual

<td align="center" style="vertical-align: middle">SWE-Bench Multilingual</td> <td align="center" style="vertical-align: middle">73.0</td>

73 %Verified

LiveCodeBench (v6)

<td align="center" style="vertical-align: middle">LiveCodeBench (v6)</td> <td align="center" style="vertical-align: middle">85.0</td>

85 %Verified

Terminal Bench 2.0

<td align="center" style="vertical-align: middle">Terminal Bench 2.0</td> <td align="center" style="vertical-align: middle">50.8</td>

50.8 %Verified

OJBench (cpp)

<td align="center" style="vertical-align: middle">OJBench (cpp)</td> <td align="center" style="vertical-align: middle">57.4</td>

57.4 %Verified

SciCode

<td align="center" style="vertical-align: middle">SciCode</td> <td align="center" style="vertical-align: middle">48.7</td>

48.7 %Verified

MMMU-Pro

78.5 %Verified

MathVision

<td align="center" style="vertical-align: middle">MathVision</td> <td align="center" style="vertical-align: middle">84.2</td>

84.2 %Verified

MathVista (mini)

<td align="center" style="vertical-align: middle">MathVista (mini)</td> <td align="center" style="vertical-align: middle">90.1</td>

90.1 %Verified

OCRBench

<td align="center" style="vertical-align: middle">OCRBench</td> <td align="center" style="vertical-align: middle">92.3</td>

92.3 pointsVerified

VideoMMMU

<td align="center" style="vertical-align: middle">VideoMMMU</td> <td align="center" style="vertical-align: middle">86.6</td>

86.6 %Verified

VideoMME

<td align="center" style="vertical-align: middle">VideoMME</td> <td align="center" style="vertical-align: middle">87.4</td>

87.4 %Verified

Longbench v2

<td align="center" style="vertical-align: middle">Longbench v2</td> <td align="center" style="vertical-align: middle">61.0</td>

61 %Verified

AA-LCR

70 %Verified

BrowseComp

<td align="center" style="vertical-align: middle">BrowseComp</td> <td align="center" style="vertical-align: middle">60.6</td>

60.6 %Verified

DeepSearchQA

<td align="center" style="vertical-align: middle">DeepSearchQA</td> <td align="center" style="vertical-align: middle">77.1</td>

77.1 %Verified

Loading…

Kimi K2.5

CurrentVerified · Jun 27, 2026

Specifications

Every value carries a primary source and a verification date.

Capacity

Context window

262K

Max output

16K

Pricing

Input $/Mtok

$0.60 / 1M input tokens USD per 1M tokens

Cached input $/Mtok

$0.10 / Mtok USD/Mtok

Output $/Mtok

$3.00 / 1M output tokens USD per 1M tokens

Capabilities

Reasoning mode

Yes

Tool / function use

Yes

Vision input

Yes

API

API model ID

kimi-k2.5

General

Release date

January 27, 2026

Benchmarks

Sourced evaluation scores, each verified against its primary source.

MMLU-Pro

87.1 %Verified

GPQA Diamond

<td align="center" style="vertical-align: middle">GPQA-Diamond</td> <td align="center" style="vertical-align: middle">87.6</td>

87.6 %Verified

AIME 2025

96.1 %Verified

HMMT 2025 (Feb)

95.4 %Verified

HLE-Full

30.1 %Verified

HLE-Full (w/ tools)

<td align="center" style="vertical-align: middle">HLE-Full<br>(w/ tools)</td> <td align="center" style="vertical-align: middle">50.2</td>

50.2 %Verified

IMO-AnswerBench

<td align="center" style="vertical-align: middle">IMO-AnswerBench</td> <td align="center" style="vertical-align: middle">81.8</td>

81.8 %Verified

SWE-bench Verified

<td align="center" style="vertical-align: middle">SWE-Bench Verified</td> <td align="center" style="vertical-align: middle">76.8</td>

76.8 %Verified

SWE-Bench Pro

<td align="center" style="vertical-align: middle">SWE-Bench Pro</td> <td align="center" style="vertical-align: middle">50.7</td>

50.7 %Verified

SWE-Bench Multilingual

<td align="center" style="vertical-align: middle">SWE-Bench Multilingual</td> <td align="center" style="vertical-align: middle">73.0</td>

73 %Verified

LiveCodeBench (v6)

<td align="center" style="vertical-align: middle">LiveCodeBench (v6)</td> <td align="center" style="vertical-align: middle">85.0</td>

85 %Verified

Terminal Bench 2.0

<td align="center" style="vertical-align: middle">Terminal Bench 2.0</td> <td align="center" style="vertical-align: middle">50.8</td>

50.8 %Verified

OJBench (cpp)

<td align="center" style="vertical-align: middle">OJBench (cpp)</td> <td align="center" style="vertical-align: middle">57.4</td>

57.4 %Verified

SciCode

<td align="center" style="vertical-align: middle">SciCode</td> <td align="center" style="vertical-align: middle">48.7</td>

48.7 %Verified

MMMU-Pro

78.5 %Verified

MathVision

<td align="center" style="vertical-align: middle">MathVision</td> <td align="center" style="vertical-align: middle">84.2</td>

84.2 %Verified

MathVista (mini)

<td align="center" style="vertical-align: middle">MathVista (mini)</td> <td align="center" style="vertical-align: middle">90.1</td>

90.1 %Verified

OCRBench

<td align="center" style="vertical-align: middle">OCRBench</td> <td align="center" style="vertical-align: middle">92.3</td>

92.3 pointsVerified

VideoMMMU

<td align="center" style="vertical-align: middle">VideoMMMU</td> <td align="center" style="vertical-align: middle">86.6</td>

86.6 %Verified

VideoMME

<td align="center" style="vertical-align: middle">VideoMME</td> <td align="center" style="vertical-align: middle">87.4</td>

87.4 %Verified

Longbench v2

<td align="center" style="vertical-align: middle">Longbench v2</td> <td align="center" style="vertical-align: middle">61.0</td>

61 %Verified

AA-LCR

70 %Verified

BrowseComp

<td align="center" style="vertical-align: middle">BrowseComp</td> <td align="center" style="vertical-align: middle">60.6</td>

60.6 %Verified

DeepSearchQA

<td align="center" style="vertical-align: middle">DeepSearchQA</td> <td align="center" style="vertical-align: middle">77.1</td>

77.1 %Verified