Kimi K2
Открытая агентная LLM Moonshot AI (июль 2025): MoE 1T с 32B активных, контекст 128K. Одна из сильнейших открытых моделей в кодинге и работе с инструментами — 65.8% на SWE-bench Verified, SOTA среди «недумающих» моделей. Открытые веса под modified MIT. Позже вышла reasoning-версия Kimi K2 Thinking и поколения K2.5/K2.6.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Moonshot AI
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к моделям Kimi в чате
- Поиск и работа с файлами
- Без своего железа
- Чекпойнты Base и Instruct на Hugging Face (modified MIT)
- Коммерческое использование разрешено
- Полный контроль и дообучение (Base)
- Нужен кластер GPU для 1T
- Moonshot Platform, OpenRouter и др.
- OpenAI-совместимый API
- Интеграция в агентов и продукты
- Без собственного железа
Плюсы и минусы
Подробный обзор
Что такое Kimi K2
Kimi K2 — открытая большая языковая модель от китайской лаборатории Moonshot AI, выпущенная в июле 2025 года. Это Mixture-of-Experts на 1 триллион параметров с 32 млрд активных на токен. Сразу после выхода K2 стала одной из сильнейших открытых моделей в кодинге, агентных и reasoning-бенчмарках. Важная характеристика — это «недумающая» (non-thinking) модель: она отвечает напрямую, без длинной видимой цепочки рассуждений, и среди таких моделей показывает state-of-the-art результат.
Сильные стороны
- Кодинг и агенты — 65.8% pass@1 на SWE-bench Verified с bash/editor-инструментами за одну попытку, без test-time compute
- MoE-эффективность — при 1T总 параметрах активны лишь 32B, поэтому инференс дешевле плотной модели того же класса
- Стабильное обучение — 15.5 трлн токенов с оптимизатором Muon, без срывов обучения
- Открытость — веса Base и Instruct под modified MIT; Base удобна для дообучения под свои задачи
Место в линейке
Kimi K2 — это «базовая» быстрая модель. Позже Moonshot выпустила Kimi K2 Thinking — reasoning-версию с контекстом 256K и автономной работой с инструментами (200-300 вызовов подряд), а также более свежие поколения K2.5 и K2.6. Если нужны быстрые прямые ответы и кодинг — подойдёт K2; если сложные многошаговые рассуждения и агентные цепочки — берите K2 Thinking или более новые версии. Для нового проекта стоит свериться с актуальной итерацией линейки.
Доступность в России
Модель доступна в России: веб-интерфейс kimi.com открывается (стабильнее через VPN), а открытые веса под modified MIT можно скачать с Hugging Face и запускать на своём железе без аккаунтов и карт. Барьер — оплата официального API Moonshot: российские карты не принимаются, доступ к API проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Русский модель понимает, но интерфейс и документация — на английском и китайском.