JetBrains выпустила Mellum2: 12B MoE-модель для разработчиков в open source

Когда «меньше» снова значит «умнее»
JetBrains делает неожиданный ход: компания, которую большинство знает по IDE-инструментам вроде IntelliJ IDEA и PyCharm, продолжает строить собственный AI-стек. Mellum2 — это не маркетинговый апгрейд, а принципиально иная архитектурная ставка. Пока все гонятся за триллионными параметрами, чешская компания идёт в противоположном направлении: специализация вместо универсальности, скорость вместо энциклопедичности.
Что такое Mellum2 и чем он отличается от предшественника
Первый Mellum был скромной 4-миллиардной моделью, заточенной исключительно под автодополнение кода — и работал внутри JetBrains AI Assistant. Mellum2 — это качественный прыжок. Архитектура Mixture-of-Experts (MoE) с 12 миллиардами параметров при активных 2,5 млрд на каждый токен меняет уравнение инференса кардинально.
Логика простая: не нужно «включать» всю нейросеть для каждого предсказания. MoE активирует только нужные «эксперты» — специализированные подсети — в зависимости от задачи. Результат: время инференса менее чем вдвое по сравнению с плотными моделями аналогичного размера. Для production-среды это не абстрактная цифра — это разница между отзывчивым инструментом и раздражающей паузой.
Помимо кода, Mellum2 теперь понимает и обрабатывает естественный язык — что открывает его для задач маршрутизации запросов, суммаризации и промежуточного рассуждения в многоагентных пайплайнах. Мультимодальности нет и не планируется — это сознательное решение, а не упущение.
Концепция «фокусной модели»: философия, а не маркетинг
JetBrains вводит термин focal model — «фокусная модель». Суть в том, что не каждая задача требует GPT-4-класса монстра, пожирающего GPU-ресурсы. Фокусные модели возвращают к первопринципам машинного обучения: специализация даёт преимущество там, где глубина важнее ширины.
Аналогия, которую использует сама компания — T-shaped специалист: широкий кругозор плюс глубокая экспертиза в одной области. Mellum2 именно такой: он не пытается написать стихи или объяснить квантовую механику, но в задачах кодирования, маршрутизации агентов и построения RAG-пайплайнов работает на уровне моделей значительно большего размера.
JetBrains прямо формулирует свою позицию: «Будущее принадлежит скоординированным системам, а не одиночным моделям». Mellum2 — компонент такой системы, а не попытка заменить Claude или GPT.
Лицензия, доступность и практика
Модель опубликована на Hugging Face под лицензией Apache 2.0 — одной из самых либеральных в экосистеме open source. Это означает коммерческое использование без роялти, возможность файн-тюнинга и приватного деплоя. Для бизнеса, работающего с чувствительными кодовыми базами, последнее особенно важно: никаких данных в чужое облако.
Три сценария использования, которые JetBrains выделяет как основные: - Локальный запуск — для тех, кто ценит приватность и независимость от внешних API - Self-hosted деплой — корпоративная инфраструктура с полным контролем - Fine-tuning — адаптация под специфические кодовые стили, фреймворки, внутренние стандарты команды
Для российских разработчиков: модель доступна напрямую через Hugging Face, VPN не требуется для скачивания весов, а развернуть её можно на любом железе без привязки к американским сервисам. Это особенно актуально для команд, работающих в условиях ограниченного доступа к западным API.
Как Mellum2 стоит на фоне конкурентов
Сравнение неизбежно. В нише code-специализированных моделей Mellum2 конкурирует с DeepSeek-Coder-V2 (тоже MoE, 16B активных параметров), CodeGemma от Google и Qwen2.5-Coder. По бенчмаркам — HumanEval, RepoBench, SAFIM — Mellum2 показывает результаты на уровне моделей сопоставимого размера, что честно: JetBrains не заявляет о превосходстве, а позиционирует продукт через скорость инференса и специализацию.
Главное конкурентное преимущество — не сырые цифры accuracy, а эффективность в production: меньше вычислительных ресурсов, меньше задержки, меньше углеродный след. Для команд, которые деплоят модели на собственном железе с ограниченными GPU-бюджетами, это весомый аргумент.
Поддерживаемые языки программирования
Mellum2 обучен на 14 языках программирования: Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Это не случайный набор — это именно те языки, которые наиболее востребованы в экосистеме JetBrains IDE. Kotlin и Java получают особое внимание как родные языки для Android-разработки и корпоративного бэкенда.
Что это значит для индустрии
Выход Mellum2 подтверждает тренд, который я наблюдаю последние полтора года: эпоха монолитных LLM-гигантов уступает место экосистемам специализированных моделей. Anthropic строит Claude для рассуждений, OpenAI — o-серию для математики, JetBrains — Mellum для кода. Победа будет у того, кто научится оркестрировать эти компоненты эффективнее всех.
Для разработчиков Mellum2 — это прежде всего инструмент для экспериментов с агентными системами: быстрый, дешёвый в инференсе, понятный по лицензии. Для бизнеса — реальная альтернатива дорогим API с возможностью полного контроля над данными. Для исследователей — открытая база для изучения того, как MoE-архитектура работает в production-условиях кодогенерации.
Информация о выходе модели подтверждена несколькими независимыми публикациями, что говорит о реальном интересе индустрии к этому релизу.
Похожие новости
GitHub Copilot переходит на токены: разработчики в шоке от новых счетов
С 1 июня Microsoft переводит GitHub Copilot на поштучную оплату токенов. Некоторые пользователи сообщают о росте расходов с $50 до $3000 в месяц.
Anthropic выпустила Claude Opus 4.8: тысяча агентов в параллели и дешёвый быстрый режим
Anthropic обновила флагман: Claude Opus 4.8 приходит с динамическими воркфлоу на 1000 субагентов, втрое дешевле быстрым режимом и улучшенной честностью модели.
Genspark AI Slides 5.0: презентации из текста в один клик
Genspark обновил генератор презентаций до версии 5.0 и показал, как перенести слайды в Figma для редактуры. Разбираем возможности и подводные камни.