JetBrains выпустила Mellum2: 12B MoE-модель для разработчиков в open source

Когда «меньше» снова значит «умнее»

JetBrains делает неожиданный ход: компания, которую большинство знает по IDE-инструментам вроде IntelliJ IDEA и PyCharm, продолжает строить собственный AI-стек. Mellum2 — это не маркетинговый апгрейд, а принципиально иная архитектурная ставка. Пока все гонятся за триллионными параметрами, чешская компания идёт в противоположном направлении: специализация вместо универсальности, скорость вместо энциклопедичности.

Что такое Mellum2 и чем он отличается от предшественника

Первый Mellum был скромной 4-миллиардной моделью, заточенной исключительно под автодополнение кода — и работал внутри JetBrains AI Assistant. Mellum2 — это качественный прыжок. Архитектура Mixture-of-Experts (MoE) с 12 миллиардами параметров при активных 2,5 млрд на каждый токен меняет уравнение инференса кардинально.

Логика простая: не нужно «включать» всю нейросеть для каждого предсказания. MoE активирует только нужные «эксперты» — специализированные подсети — в зависимости от задачи. Результат: время инференса менее чем вдвое по сравнению с плотными моделями аналогичного размера. Для production-среды это не абстрактная цифра — это разница между отзывчивым инструментом и раздражающей паузой.

Помимо кода, Mellum2 теперь понимает и обрабатывает естественный язык — что открывает его для задач маршрутизации запросов, суммаризации и промежуточного рассуждения в многоагентных пайплайнах. Мультимодальности нет и не планируется — это сознательное решение, а не упущение.

Концепция «фокусной модели»: философия, а не маркетинг

JetBrains вводит термин focal model — «фокусная модель». Суть в том, что не каждая задача требует GPT-4-класса монстра, пожирающего GPU-ресурсы. Фокусные модели возвращают к первопринципам машинного обучения: специализация даёт преимущество там, где глубина важнее ширины.

Аналогия, которую использует сама компания — T-shaped специалист: широкий кругозор плюс глубокая экспертиза в одной области. Mellum2 именно такой: он не пытается написать стихи или объяснить квантовую механику, но в задачах кодирования, маршрутизации агентов и построения RAG-пайплайнов работает на уровне моделей значительно большего размера.

JetBrains прямо формулирует свою позицию: «Будущее принадлежит скоординированным системам, а не одиночным моделям». Mellum2 — компонент такой системы, а не попытка заменить Claude или GPT.

Лицензия, доступность и практика

Модель опубликована на Hugging Face под лицензией Apache 2.0 — одной из самых либеральных в экосистеме open source. Это означает коммерческое использование без роялти, возможность файн-тюнинга и приватного деплоя. Для бизнеса, работающего с чувствительными кодовыми базами, последнее особенно важно: никаких данных в чужое облако.

Три сценария использования, которые JetBrains выделяет как основные: - Локальный запуск — для тех, кто ценит приватность и независимость от внешних API - Self-hosted деплой — корпоративная инфраструктура с полным контролем - Fine-tuning — адаптация под специфические кодовые стили, фреймворки, внутренние стандарты команды

Для российских разработчиков: модель доступна напрямую через Hugging Face, VPN не требуется для скачивания весов, а развернуть её можно на любом железе без привязки к американским сервисам. Это особенно актуально для команд, работающих в условиях ограниченного доступа к западным API.

Как Mellum2 стоит на фоне конкурентов

Сравнение неизбежно. В нише code-специализированных моделей Mellum2 конкурирует с DeepSeek-Coder-V2 (тоже MoE, 16B активных параметров), CodeGemma от Google и Qwen2.5-Coder. По бенчмаркам — HumanEval, RepoBench, SAFIM — Mellum2 показывает результаты на уровне моделей сопоставимого размера, что честно: JetBrains не заявляет о превосходстве, а позиционирует продукт через скорость инференса и специализацию.

Главное конкурентное преимущество — не сырые цифры accuracy, а эффективность в production: меньше вычислительных ресурсов, меньше задержки, меньше углеродный след. Для команд, которые деплоят модели на собственном железе с ограниченными GPU-бюджетами, это весомый аргумент.

Поддерживаемые языки программирования

Mellum2 обучен на 14 языках программирования: Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Это не случайный набор — это именно те языки, которые наиболее востребованы в экосистеме JetBrains IDE. Kotlin и Java получают особое внимание как родные языки для Android-разработки и корпоративного бэкенда.

Что это значит для индустрии

Выход Mellum2 подтверждает тренд, который я наблюдаю последние полтора года: эпоха монолитных LLM-гигантов уступает место экосистемам специализированных моделей. Anthropic строит Claude для рассуждений, OpenAI — o-серию для математики, JetBrains — Mellum для кода. Победа будет у того, кто научится оркестрировать эти компоненты эффективнее всех.

Для разработчиков Mellum2 — это прежде всего инструмент для экспериментов с агентными системами: быстрый, дешёвый в инференсе, понятный по лицензии. Для бизнеса — реальная альтернатива дорогим API с возможностью полного контроля над данными. Для исследователей — открытая база для изучения того, как MoE-архитектура работает в production-условиях кодогенерации.

Информация о выходе модели подтверждена несколькими независимыми публикациями, что говорит о реальном интересе индустрии к этому релизу.

JetBrains выпустила Mellum2: 12B MoE-модель для разработчиков в open source

Когда «меньше» снова значит «умнее»

Что такое Mellum2 и чем он отличается от предшественника

Концепция «фокусной модели»: философия, а не маркетинг

Лицензия, доступность и практика

Как Mellum2 стоит на фоне конкурентов

Поддерживаемые языки программирования

Что это значит для индустрии

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Codex набирает миллион пользователей в сутки: GPT-5.6 меняет рынок

Grok Build тайно сливал весь код пользователей в Google Cloud

Claude Code получил встроенный браузер: ИИ теперь сам серфит по вебу