Kimi K2

Kimi K2

Открытая агентная LLM Moonshot AI (июль 2025): MoE 1T с 32B активных, контекст 128K. Одна из сильнейших открытых моделей в кодинге и работе с инструментами — 65.8% на SWE-bench Verified, SOTA среди «недумающих» моделей. Открытые веса под modified MIT. Позже вышла reasoning-версия Kimi K2 Thinking и поколения K2.5/K2.6.

Бесплатно (открытые веса) / API ~$0.60 / $2.50 за 1MРаботает в РФ
8/10📅 2025-07🏢 Moonshot AI✓ Open Source

Рейтинг и бенчмарки

Общий рейтинг
8/10
Benchmark Score
8/10
Скорость
8.5/10
Архитектура
MoE 1T / 32B активных
SWE-bench Verified
65.8% pass@1 (single-attempt)
Класс
SOTA среди недумающих (non-thinking) открытых моделей
Обучение
15.5 трлн токенов, оптимизатор Muon

Входные и выходные данные

Входные данные
текст
Выходные данные
текст

API и стоимость

Входные токены (Input)
Бесплатно (открытые веса) / API ~$0.60 / $2.50 за 1M
цена за промпт
Выходные токены (Output)
~$2.50 / 1M токенов (через API-провайдеров)
цена за ответ
API доступен

Способы доступа

Web (kimi.com)API (MoonshotOpenRouter)Self-hosted (Hugging Face)

Сценарии использования

программированиеагентные задачи с инструментамирассуждениянаписание и анализ текста

Тарифы и подписки — Moonshot AI

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Веб kimi.com
Бесплатно
  • Доступ к моделям Kimi в чате
  • Поиск и работа с файлами
  • Без своего железа
Открытые веса (self-host)
Бесплатно
  • Чекпойнты Base и Instruct на Hugging Face (modified MIT)
  • Коммерческое использование разрешено
  • Полный контроль и дообучение (Base)
  • Нужен кластер GPU для 1T
API (Moonshot / провайдеры)
~$0.60 / $2.50 за 1M
  • Moonshot Platform, OpenRouter и др.
  • OpenAI-совместимый API
  • Интеграция в агентов и продукты
  • Без собственного железа
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Одна из сильнейших открытых моделей в кодинге и агентных задачах: 65.8% на SWE-bench Verified (single-attempt, без test-time compute)
SOTA среди «недумающих» (non-thinking) моделей — отвечает сразу, без долгой цепочки рассуждений, поэтому быстрее reasoning-моделей
MoE 1T总 / 32B активных — качество огромной модели при стоимости инференса уровня 32B
Открытые веса под modified MIT — бесплатный запуск и коммерческое использование; есть Base-версия для дообучения
Заточена под работу с инструментами и агентов — обучена на агентных траекториях
Доступна в России: бесплатный веб kimi.com + открытые веса с Hugging Face
✗ Минусы
Это «недумающая» модель: на сложных многошаговых рассуждениях уступает reasoning-версии Kimi K2 Thinking
Линейка быстро ушла вперёд — вышли K2 Thinking и поколения K2.5/K2.6; для нового проекта смотрите свежие
Полноценный self-host триллионной модели требует кластера GPU — большинству проще API или веб
Официальный API Moonshot российские карты не принимает (доступ — через сторонние агрегаторы)
Контекст 128K — меньше, чем у K2 Thinking (256K) и ряда конкурентов
Интерфейс и документация на английском/китайском, русского интерфейса нет

Подробный обзор

Что такое Kimi K2

Kimi K2 — открытая большая языковая модель от китайской лаборатории Moonshot AI, выпущенная в июле 2025 года. Это Mixture-of-Experts на 1 триллион параметров с 32 млрд активных на токен. Сразу после выхода K2 стала одной из сильнейших открытых моделей в кодинге, агентных и reasoning-бенчмарках. Важная характеристика — это «недумающая» (non-thinking) модель: она отвечает напрямую, без длинной видимой цепочки рассуждений, и среди таких моделей показывает state-of-the-art результат.

Сильные стороны

  • Кодинг и агенты — 65.8% pass@1 на SWE-bench Verified с bash/editor-инструментами за одну попытку, без test-time compute
  • MoE-эффективность — при 1T总 параметрах активны лишь 32B, поэтому инференс дешевле плотной модели того же класса
  • Стабильное обучение — 15.5 трлн токенов с оптимизатором Muon, без срывов обучения
  • Открытость — веса Base и Instruct под modified MIT; Base удобна для дообучения под свои задачи

Место в линейке

Kimi K2 — это «базовая» быстрая модель. Позже Moonshot выпустила Kimi K2 Thinking — reasoning-версию с контекстом 256K и автономной работой с инструментами (200-300 вызовов подряд), а также более свежие поколения K2.5 и K2.6. Если нужны быстрые прямые ответы и кодинг — подойдёт K2; если сложные многошаговые рассуждения и агентные цепочки — берите K2 Thinking или более новые версии. Для нового проекта стоит свериться с актуальной итерацией линейки.

Доступность в России

Модель доступна в России: веб-интерфейс kimi.com открывается (стабильнее через VPN), а открытые веса под modified MIT можно скачать с Hugging Face и запускать на своём железе без аккаунтов и карт. Барьер — оплата официального API Moonshot: российские карты не принимаются, доступ к API проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Русский модель понимает, но интерфейс и документация — на английском и китайском.

Часто задаваемые вопросы

Что такое Kimi K2?
Открытая агентная LLM от Moonshot AI (июль 2025): Mixture-of-Experts на 1 трлн параметров с 32 млрд активных, контекст 128K. Одна из сильнейших открытых моделей в кодинге и работе с инструментами. Веса открыты под modified MIT — можно запускать локально и использовать коммерчески.
Что значит «недумающая» (non-thinking) модель?
Kimi K2 отвечает напрямую, без длинной видимой цепочки рассуждений (chain-of-thought), поэтому она быстрее и дешевле reasoning-моделей. Среди non-thinking моделей она показывает SOTA-результаты. Если нужны развёрнутые рассуждения по сложным задачам — есть отдельная reasoning-версия Kimi K2 Thinking.
Чем Kimi K2 отличается от Kimi K2 Thinking?
K2 — быстрая «недумающая» модель (контекст 128K), отвечает сразу; хороша для кодинга и прямых задач. K2 Thinking — reasoning-версия (контекст 256K) с автономной работой с инструментами (200-300 вызовов подряд) для сложных многошаговых задач. K2 быстрее и дешевле, K2 Thinking сильнее на сложных рассуждениях.
Сколько стоит Kimi K2?
Веб-версия на kimi.com бесплатна. Веса открыты под modified MIT — можно скачать с Hugging Face и запускать у себя, в том числе коммерчески (но для 1T нужен кластер GPU). Через API (Moonshot, сторонние провайдеры вроде OpenRouter) — оплата за токены, ориентировочно $0.60 за 1M входных и ~$2.50 за 1M выходных.
Насколько Kimi K2 хороша в программировании?
Очень сильна для открытой модели: 65.8% pass@1 на SWE-bench Verified с bash/editor-инструментами за одну попытку (без test-time compute) — это уровень топовых моделей. K2 специально оптимизирована под агентные задачи и работу с инструментами, обучена на агентных траекториях.
Работает ли Kimi K2 в России?
Да: сайт kimi.com открывается (стабильнее через VPN), а открытые веса можно скачать с Hugging Face и запускать локально без аккаунтов и карт. Официальный API Moonshot российские карты не принимает — доступ проще получить через сторонние агрегаторы (OpenRouter) или сервисы с рублёвой оплатой. Русский модель понимает, интерфейс — на английском/китайском.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно

Moonshot AI
Другие модели Moonshot AI

Смотреть все →