Mistral Small 4
Открытая модель Mistral (Apache 2.0, 16 марта 2026), объединившая три продукта в одном: Magistral (рассуждения), Pixtral (зрение) и Devstral (кодинг). MoE-архитектура 119B total / 6B active, контекст 256K, текст+изображение. Переключаемый reasoning_effort, цена API $0.15/$0.60 за 1M токенов.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Mistral AI
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Скачивание с HuggingFace (mistralai/Mistral-Small-4-119B-2603)
- Локальный запуск и self-hosting
- Дообучение под свои данные
- Коммерческое использование без роялти
- Доступ к Mistral Small 4 в Le Chat
- Чат, веб-поиск, генерация изображений
- Группировка чатов в проекты
- Базовые лимиты сообщений
- Расширенные лимиты сообщений и поиска
- До 15 ГБ хранилища документов
- Mistral Vibe для разработки
- Улучшенная генерация изображений
- До 30 ГБ хранилища на пользователя
- Верификация домена и экспорт данных
- Командное рабочее пространство
- Вход: $0.15 за 1M токенов, выход: $0.60 за 1M
- Model ID: mistral-small-2603 / mistral-small-latest
- Параметр reasoning_effort (none…high)
- EU-датацентры; также доступна через OpenRouter
Плюсы и минусы
Подробный обзор
Что такое Mistral Small 4
Mistral Small 4 — открытая модель французской компании Mistral AI, выпущенная 16 марта 2026 года под лицензией Apache 2.0. Её главная идея — «три модели в одной»: Small 4 объединяет возможности трёх прежде отдельных продуктов Mistral — Magistral (рассуждения), Pixtral (мультимодальное зрение) и Devstral (агентный кодинг). Вместо того чтобы держать в пайплайне три разные модели, можно использовать одну универсальную.
Архитектура: MoE 119B при 6B активных
Под капотом — архитектура Mixture of Experts (MoE): всего у модели 119 миллиардов параметров (128 экспертов), но на каждый токен активны лишь около 6 миллиардов (4 эксперта). Это даёт качество крупной модели при скорости и цене компактной. Относительно Mistral Small 3 новинка показывает в 3 раза больший throughput и на 40% меньшую задержку. Контекстное окно — 256K токенов, на входе принимаются текст и изображения.
Переключаемое рассуждение (reasoning_effort)
Small 4 — гибридная модель с параметром reasoning_effort, который задаётся прямо в запросе. Значение «none» даёт быстрый ответ без цепочки рассуждений (поведение уровня Mistral Small 3.2), а «high» включает пошаговое мышление для математики и сложных задач (уровень прежних моделей Magistral). По бенчмаркам Small 4 в режиме рассуждения сопоставима с GPT-OSS 120B, но генерирует заметно более короткие ответы — например, LCR 0.72 всего на 1600 символах против 5800–6100 у сопоставимых моделей.
Цены и доступ
Веса можно бесплатно скачать с HuggingFace (mistralai/Mistral-Small-4-119B-2603), запустить локально, дообучить и использовать коммерчески без роялти. Через API (La Plateforme) цена — $0.15 за 1M входных токенов и $0.60 за выходные, model ID mistral-small-2603 или mistral-small-latest. В чат-сервисе Le Chat модель доступна на тарифах Free, Pro ($14.99/мес), Team ($24.99/мес) и Enterprise. Также Small 4 доступна через OpenRouter и других провайдеров.
Доступность в России
Здесь у Mistral Small 4 серьёзное преимущество перед моделями OpenAI и Anthropic: Mistral — европейская компания, и её сервисы La Plateforme и Le Chat обычно доступны из России без VPN. А поскольку модель open-weight, её в любом случае можно использовать через OpenRouter, развернуть на своём сервере или взять у российских провайдеров — без привязки к зарубежной инфраструктуре. Единственное ограничение — российские карты не принимаются для прямой оплаты на La Plateforme и в Le Chat Pro; обойти это можно через OpenRouter или посредников с рублёвой оплатой вроде genova-ai.ru.