Kimi K2 Thinking
Открытая reasoning/agentic-модель Moonshot AI (6 ноября 2025): MoE 1T с 32B активных, контекст 256K, автономно выполняет 200-300 последовательных вызовов инструментов. По ряду бенчмарков заявлена выше GPT-5 и Claude Sonnet 4.5 (Thinking). Открытые веса под modified MIT — бесплатный запуск.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Moonshot AI
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к Kimi K2 Thinking в чате
- Агентные задачи и поиск
- Heavy Mode для сложных задач
- Без своего железа
- Чекпойнты на Hugging Face (modified MIT)
- Коммерческое использование разрешено
- Нативный INT4 (~594 ГБ) — нужен кластер GPU
- Полный локальный контроль
- Moonshot Platform, OpenRouter и др.
- OpenAI-совместимый API
- Интеграция в агентов и продукты
- Без собственного железа
Плюсы и минусы
Подробный обзор
Что такое Kimi K2 Thinking
Kimi K2 Thinking — открытая reasoning-модель от китайской лаборатории Moonshot AI, выпущенная 6 ноября 2025 года. Это «думающая» версия Kimi K2 — огромная Mixture-of-Experts на 1 триллион параметров, из которых на токен активны лишь 32 млрд. Её главная сила — агентность: модель способна автономно выполнить 200-300 последовательных вызовов инструментов, чередуя в одном цикле размышление, действие и интерпретацию результата, без вмешательства человека. По ряду бенчмарков Moonshot заявляет результаты выше GPT-5 и Claude Sonnet 4.5 в режиме Thinking.
Ключевые особенности
- Контекст 256K токенов — длинные документы, репозитории и многошаговые агентные сессии
- Нативный INT4-инференс — обучение с учётом квантизации (QAT) даёт примерно двукратное ускорение без потери качества; модель ужимается до ~594 ГБ
- Heavy Mode — для сложнейших задач запускает 8 независимых цепочек рассуждений параллельно
- Открытые веса под modified MIT — можно скачать, запускать и использовать коммерчески
- Технологии обучения — оптимизатор MuonClip для стабильного обучения триллионного масштаба, обучение на 15.5 трлн токенов
Кому подходит и статус
Kimi K2 Thinking — выбор для агентных сценариев и сложных рассуждений: автономные исследования, многошаговая работа с инструментами, математика, наука, программирование. Для простого чата она избыточна (reasoning медленнее и расходует больше токенов). Полноценный self-host требует кластера видеокарт, поэтому большинству удобнее пользоваться ею через бесплатный веб kimi.com или через API. Линейка Kimi развивается очень быстро — уже вышли более свежие версии (K2.5, K2.6), поэтому для нового проекта стоит свериться с актуальной.
Доступность в России
Модель доступна в России: веб-интерфейс kimi.com открывается (иногда стабильнее через VPN), а открытые веса под modified MIT можно скачать с Hugging Face и запускать на своём железе без аккаунтов и карт. Барьер — оплата официального API Moonshot: российские карты не принимаются, доступ к API проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Модель понимает русский, но интерфейс и документация — на английском и китайском.