Mistral Small 4

Mistral Small 4

Открытая модель Mistral (Apache 2.0, 16 марта 2026), объединившая три продукта в одном: Magistral (рассуждения), Pixtral (зрение) и Devstral (кодинг). MoE-архитектура 119B total / 6B active, контекст 256K, текст+изображение. Переключаемый reasoning_effort, цена API $0.15/$0.60 за 1M токенов.

Открытые веса (Apache 2.0); API $0.15/$0.60 за 1M; Le Chat Free/Pro $14.99Работает в РФ
8.4/10📅 2026-03-16🏢 Mistral AI✓ Open Source

Рейтинг и бенчмарки

Общий рейтинг
8.4/10
Benchmark Score
8.2/10
Скорость
8.6/10
Параметры
119B total / 6B active (MoE, 128 экспертов)
Контекст
256K токенов
Throughput
3× vs Small 3, −40% latency
Лицензия
Apache 2.0

Входные и выходные данные

Входные данные
текстизображение
Выходные данные
текст

API и стоимость

Входные токены (Input)
Открытые веса (Apache 2.0); API $0.15/$0.60 за 1M; Le Chat Free/Pro $14.99
цена за промпт
Выходные токены (Output)
$0.60 / 1M токенов
цена за ответ
API доступен

Способы доступа

API (La Plateforme)Le ChatHuggingFaceOpenRouterself-hosted

Сценарии использования

рассужденияагентный кодингvision-анализчатлокальный запускдообучение (fine-tuning)

Тарифы и подписки — Mistral AI

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Открытые веса
Бесплатно (Apache 2.0)
  • Скачивание с HuggingFace (mistralai/Mistral-Small-4-119B-2603)
  • Локальный запуск и self-hosting
  • Дообучение под свои данные
  • Коммерческое использование без роялти
Free (Le Chat)
Бесплатно
  • Доступ к Mistral Small 4 в Le Chat
  • Чат, веб-поиск, генерация изображений
  • Группировка чатов в проекты
  • Базовые лимиты сообщений
Pro (Le Chat)
$14.99/мес
  • Расширенные лимиты сообщений и поиска
  • До 15 ГБ хранилища документов
  • Mistral Vibe для разработки
  • Улучшенная генерация изображений
Team (Le Chat)
$24.99/мес за пользователя
  • До 30 ГБ хранилища на пользователя
  • Верификация домена и экспорт данных
  • Командное рабочее пространство
API (La Plateforme)
$0.15 / $0.60 за 1M
  • Вход: $0.15 за 1M токенов, выход: $0.60 за 1M
  • Model ID: mistral-small-2603 / mistral-small-latest
  • Параметр reasoning_effort (none…high)
  • EU-датацентры; также доступна через OpenRouter
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Три модели в одной: объединяет рассуждения (Magistral), зрение (Pixtral) и агентный кодинг (Devstral) — не нужно держать три отдельные модели
MoE-архитектура — 119B параметров при всего 6B активных на токен (128 экспертов, 4 активных): качество крупной модели при скорости компактной
Контекст 256K токенов — длинные документы и кодовые базы целиком
Открытые веса под Apache 2.0 — можно скачать с HuggingFace, запустить локально, дообучить и использовать коммерчески без ограничений
Переключаемый reasoning_effort: «none» — быстрые ответы, «high» — пошаговое рассуждение; одна модель под разные задачи
Текст + изображение на входе — анализ скриншотов, схем и документов
Дёшево через API: $0.15/$0.60 за 1M токенов; против Mistral Small 3 — 3× throughput и −40% задержки
✗ Минусы
Уступает топ-флагманам (Claude Fable 5, GPT-5.5, Gemini 3.1 Pro) в самых сложных задачах рассуждения и кодинга
Российские карты не принимаются для оплаты на Mistral La Plateforme и в Le Chat Pro
Для локального запуска 119B-модели нужен серьёзный GPU или квантизация — не «ноутбучный» масштаб, несмотря на 6B активных
Интерфейс Le Chat и документация — на английском и французском, без русского
Vision слабее специализированных мультимодальных флагманов

Подробный обзор

Что такое Mistral Small 4

Mistral Small 4 — открытая модель французской компании Mistral AI, выпущенная 16 марта 2026 года под лицензией Apache 2.0. Её главная идея — «три модели в одной»: Small 4 объединяет возможности трёх прежде отдельных продуктов Mistral — Magistral (рассуждения), Pixtral (мультимодальное зрение) и Devstral (агентный кодинг). Вместо того чтобы держать в пайплайне три разные модели, можно использовать одну универсальную.

Архитектура: MoE 119B при 6B активных

Под капотом — архитектура Mixture of Experts (MoE): всего у модели 119 миллиардов параметров (128 экспертов), но на каждый токен активны лишь около 6 миллиардов (4 эксперта). Это даёт качество крупной модели при скорости и цене компактной. Относительно Mistral Small 3 новинка показывает в 3 раза больший throughput и на 40% меньшую задержку. Контекстное окно — 256K токенов, на входе принимаются текст и изображения.

Переключаемое рассуждение (reasoning_effort)

Small 4 — гибридная модель с параметром reasoning_effort, который задаётся прямо в запросе. Значение «none» даёт быстрый ответ без цепочки рассуждений (поведение уровня Mistral Small 3.2), а «high» включает пошаговое мышление для математики и сложных задач (уровень прежних моделей Magistral). По бенчмаркам Small 4 в режиме рассуждения сопоставима с GPT-OSS 120B, но генерирует заметно более короткие ответы — например, LCR 0.72 всего на 1600 символах против 5800–6100 у сопоставимых моделей.

Цены и доступ

Веса можно бесплатно скачать с HuggingFace (mistralai/Mistral-Small-4-119B-2603), запустить локально, дообучить и использовать коммерчески без роялти. Через API (La Plateforme) цена — $0.15 за 1M входных токенов и $0.60 за выходные, model ID mistral-small-2603 или mistral-small-latest. В чат-сервисе Le Chat модель доступна на тарифах Free, Pro ($14.99/мес), Team ($24.99/мес) и Enterprise. Также Small 4 доступна через OpenRouter и других провайдеров.

Доступность в России

Здесь у Mistral Small 4 серьёзное преимущество перед моделями OpenAI и Anthropic: Mistral — европейская компания, и её сервисы La Plateforme и Le Chat обычно доступны из России без VPN. А поскольку модель open-weight, её в любом случае можно использовать через OpenRouter, развернуть на своём сервере или взять у российских провайдеров — без привязки к зарубежной инфраструктуре. Единственное ограничение — российские карты не принимаются для прямой оплаты на La Plateforme и в Le Chat Pro; обойти это можно через OpenRouter или посредников с рублёвой оплатой вроде genova-ai.ru.

Часто задаваемые вопросы

Что такое Mistral Small 4?
Это открытая модель Mistral AI (Apache 2.0), выпущенная 16 марта 2026 года. Её особенность — объединение трёх прежде отдельных моделей Mistral в одну: Magistral (рассуждения), Pixtral (зрение) и Devstral (агентный кодинг). Архитектура MoE на 119B параметров (6B активных), контекст 256K, на входе текст и изображения.
Чем Mistral Small 4 отличается от прошлых версий?
Раньше у Mistral были отдельные модели под рассуждения (Magistral), зрение (Pixtral), кодинг (Devstral) и общий чат (Small 3.2). Small 4 объединяет всё это в одной MoE-модели с переключаемым параметром reasoning_effort. Плюс прирост эффективности: в 3 раза больше throughput и на 40% меньше задержки по сравнению с Mistral Small 3.
Что значит «119B параметров при 6B активных»?
Это архитектура Mixture of Experts (MoE): всего модель содержит 119 миллиардов параметров, разделённых на 128 «экспертов», но на обработку каждого токена включаются только 4 эксперта — около 6 миллиардов параметров. В итоге вы получаете качество крупной модели при скорости и стоимости компактной.
Можно ли запустить Mistral Small 4 локально?
Да. Веса открыты под Apache 2.0 и доступны на HuggingFace (mistralai/Mistral-Small-4-119B-2603) — модель можно развернуть на своём сервере, дообучить под свои данные и использовать коммерчески без роялти. Учтите: для запуска 119B-модели нужен серьёзный GPU или квантизация, несмотря на то что активны лишь 6B параметров.
Сколько стоит Mistral Small 4?
Веса для self-hosting бесплатны (Apache 2.0). Через API La Plateforme — $0.15 за 1M входных токенов и $0.60 за выходные. В Le Chat: Free, Pro ($14.99/мес), Team ($24.99/мес за пользователя) и Enterprise. Также доступна через OpenRouter.
Что такое параметр reasoning_effort?
Это настройка глубины рассуждения, задаваемая в каждом запросе. Значение «none» даёт быстрый ответ без цепочки рассуждений (как Mistral Small 3.2), а «high» включает пошаговое мышление для математики и сложных задач (как прежние модели Magistral). Одна модель закрывает оба сценария — не нужно переключаться между разными моделями.
Работает ли Mistral Small 4 в России?
Да, и заметно доступнее моделей OpenAI и Anthropic. Mistral — европейская компания, её сервисы La Plateforme и Le Chat обычно открываются из России без VPN. А благодаря открытым весам модель можно использовать через OpenRouter, развернуть локально или взять у российских провайдеров. Ограничение лишь в оплате: российские карты на La Plateforme и в Le Chat Pro не принимаются — обойти можно через OpenRouter или посредников с рублёвой оплатой вроде genova-ai.ru.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно