Kimi K2

Name: Kimi K2
Author: Moonshot AI

Открытая агентная LLM Moonshot AI (июль 2025): MoE 1T с 32B активных, контекст 128K. Одна из сильнейших открытых моделей в кодинге и работе с инструментами — 65.8% на SWE-bench Verified, SOTA среди «недумающих» моделей. Открытые веса под modified MIT. Позже вышла reasoning-версия Kimi K2 Thinking и поколения K2.5/K2.6.

Бесплатно (открытые веса) / API ~$0.60 / $2.50 за 1MРаботает в РФ

⭐ 8/10📅 2025-07🏢 Moonshot AI✓ Open Source

Открыть сайт

Рейтинг и бенчмарки

Общий рейтинг

8/10

Benchmark Score

8/10

Скорость

8.5/10

Архитектура

MoE 1T / 32B активных

SWE-bench Verified

65.8% pass@1 (single-attempt)

Класс

SOTA среди недумающих (non-thinking) открытых моделей

Обучение

15.5 трлн токенов, оптимизатор Muon

Входные и выходные данные

Входные данные

текст

Выходные данные

текст

API и стоимость

Входные токены (Input)

Бесплатно (открытые веса) / API ~$0.60 / $2.50 за 1M

цена за промпт

Выходные токены (Output)

~$2.50 / 1M токенов (через API-провайдеров)

цена за ответ

✓API доступен

Документация API →

Способы доступа

Web (kimi.com)API (MoonshotOpenRouter)Self-hosted (Hugging Face)

Сценарии использования

программированиеагентные задачи с инструментамирассуждениянаписание и анализ текста

Тарифы и подписки — Moonshot AI

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный

Веб kimi.com

Бесплатно

Доступ к моделям Kimi в чате
Поиск и работа с файлами
Без своего железа

Открытые веса (self-host)

Бесплатно

Чекпойнты Base и Instruct на Hugging Face (modified MIT)
Коммерческое использование разрешено
Полный контроль и дообучение (Base)
Нужен кластер GPU для 1T

API (Moonshot / провайдеры)

~$0.60 / $2.50 за 1M

Moonshot Platform, OpenRouter и др.
OpenAI-совместимый API
Интеграция в агентов и продукты
Без собственного железа

Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы

Одна из сильнейших открытых моделей в кодинге и агентных задачах: 65.8% на SWE-bench Verified (single-attempt, без test-time compute)

SOTA среди «недумающих» (non-thinking) моделей — отвечает сразу, без долгой цепочки рассуждений, поэтому быстрее reasoning-моделей

MoE 1T总 / 32B активных — качество огромной модели при стоимости инференса уровня 32B

Открытые веса под modified MIT — бесплатный запуск и коммерческое использование; есть Base-версия для дообучения

Заточена под работу с инструментами и агентов — обучена на агентных траекториях

Доступна в России: бесплатный веб kimi.com + открытые веса с Hugging Face

✗ Минусы

Это «недумающая» модель: на сложных многошаговых рассуждениях уступает reasoning-версии Kimi K2 Thinking

Линейка быстро ушла вперёд — вышли K2 Thinking и поколения K2.5/K2.6; для нового проекта смотрите свежие

Полноценный self-host триллионной модели требует кластера GPU — большинству проще API или веб

Официальный API Moonshot российские карты не принимает (доступ — через сторонние агрегаторы)

Контекст 128K — меньше, чем у K2 Thinking (256K) и ряда конкурентов

Интерфейс и документация на английском/китайском, русского интерфейса нет

Подробный обзор

Что такое Kimi K2

Kimi K2 — открытая большая языковая модель от китайской лаборатории Moonshot AI, выпущенная в июле 2025 года. Это Mixture-of-Experts на 1 триллион параметров с 32 млрд активных на токен. Сразу после выхода K2 стала одной из сильнейших открытых моделей в кодинге, агентных и reasoning-бенчмарках. Важная характеристика — это «недумающая» (non-thinking) модель: она отвечает напрямую, без длинной видимой цепочки рассуждений, и среди таких моделей показывает state-of-the-art результат.

Сильные стороны

Кодинг и агенты — 65.8% pass@1 на SWE-bench Verified с bash/editor-инструментами за одну попытку, без test-time compute
MoE-эффективность — при 1T总 параметрах активны лишь 32B, поэтому инференс дешевле плотной модели того же класса
Стабильное обучение — 15.5 трлн токенов с оптимизатором Muon, без срывов обучения
Открытость — веса Base и Instruct под modified MIT; Base удобна для дообучения под свои задачи

Место в линейке

Kimi K2 — это «базовая» быстрая модель. Позже Moonshot выпустила Kimi K2 Thinking — reasoning-версию с контекстом 256K и автономной работой с инструментами (200-300 вызовов подряд), а также более свежие поколения K2.5 и K2.6. Если нужны быстрые прямые ответы и кодинг — подойдёт K2; если сложные многошаговые рассуждения и агентные цепочки — берите K2 Thinking или более новые версии. Для нового проекта стоит свериться с актуальной итерацией линейки.

Доступность в России

Модель доступна в России: веб-интерфейс kimi.com открывается (стабильнее через VPN), а открытые веса под modified MIT можно скачать с Hugging Face и запускать на своём железе без аккаунтов и карт. Барьер — оплата официального API Moonshot: российские карты не принимаются, доступ к API проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Русский модель понимает, но интерфейс и документация — на английском и китайском.

Часто задаваемые вопросы

Что такое Kimi K2?

Открытая агентная LLM от Moonshot AI (июль 2025): Mixture-of-Experts на 1 трлн параметров с 32 млрд активных, контекст 128K. Одна из сильнейших открытых моделей в кодинге и работе с инструментами. Веса открыты под modified MIT — можно запускать локально и использовать коммерчески.

Что значит «недумающая» (non-thinking) модель?

Kimi K2 отвечает напрямую, без длинной видимой цепочки рассуждений (chain-of-thought), поэтому она быстрее и дешевле reasoning-моделей. Среди non-thinking моделей она показывает SOTA-результаты. Если нужны развёрнутые рассуждения по сложным задачам — есть отдельная reasoning-версия Kimi K2 Thinking.

Чем Kimi K2 отличается от Kimi K2 Thinking?

K2 — быстрая «недумающая» модель (контекст 128K), отвечает сразу; хороша для кодинга и прямых задач. K2 Thinking — reasoning-версия (контекст 256K) с автономной работой с инструментами (200-300 вызовов подряд) для сложных многошаговых задач. K2 быстрее и дешевле, K2 Thinking сильнее на сложных рассуждениях.

Сколько стоит Kimi K2?

Веб-версия на kimi.com бесплатна. Веса открыты под modified MIT — можно скачать с Hugging Face и запускать у себя, в том числе коммерчески (но для 1T нужен кластер GPU). Через API (Moonshot, сторонние провайдеры вроде OpenRouter) — оплата за токены, ориентировочно $0.60 за 1M входных и ~$2.50 за 1M выходных.

Насколько Kimi K2 хороша в программировании?

Очень сильна для открытой модели: 65.8% pass@1 на SWE-bench Verified с bash/editor-инструментами за одну попытку (без test-time compute) — это уровень топовых моделей. K2 специально оптимизирована под агентные задачи и работу с инструментами, обучена на агентных траекториях.

Работает ли Kimi K2 в России?

Да: сайт kimi.com открывается (стабильнее через VPN), а открытые веса можно скачать с Hugging Face и запускать локально без аккаунтов и карт. Официальный API Moonshot российские карты не принимает — доступ проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Русский модель понимает, интерфейс — на английском/китайском.