Name: Mistral Small 4
Author: Mistral AI

Question 1

Что такое Mistral Small 4?

Accepted Answer

Это открытая модель Mistral AI (Apache 2.0), выпущенная 16 марта 2026 года. Её особенность — объединение трёх прежде отдельных моделей Mistral в одну: Magistral (рассуждения), Pixtral (зрение) и Devstral (агентный кодинг). Архитектура MoE на 119B параметров (6B активных), контекст 256K, на входе текст и изображения.

Question 2

Чем Mistral Small 4 отличается от прошлых версий?

Accepted Answer

Раньше у Mistral были отдельные модели под рассуждения (Magistral), зрение (Pixtral), кодинг (Devstral) и общий чат (Small 3.2). Small 4 объединяет всё это в одной MoE-модели с переключаемым параметром reasoning_effort. Плюс прирост эффективности: в 3 раза больше throughput и на 40% меньше задержки по сравнению с Mistral Small 3.

Question 3

Что значит «119B параметров при 6B активных»?

Accepted Answer

Это архитектура Mixture of Experts (MoE): всего модель содержит 119 миллиардов параметров, разделённых на 128 «экспертов», но на обработку каждого токена включаются только 4 эксперта — около 6 миллиардов параметров. В итоге вы получаете качество крупной модели при скорости и стоимости компактной.

Question 4

Можно ли запустить Mistral Small 4 локально?

Accepted Answer

Да. Веса открыты под Apache 2.0 и доступны на HuggingFace (mistralai/Mistral-Small-4-119B-2603) — модель можно развернуть на своём сервере, дообучить под свои данные и использовать коммерчески без роялти. Учтите: для запуска 119B-модели нужен серьёзный GPU или квантизация, несмотря на то что активны лишь 6B параметров.

Question 5

Сколько стоит Mistral Small 4?

Accepted Answer

Веса для self-hosting бесплатны (Apache 2.0). Через API La Plateforme — $0.15 за 1M входных токенов и $0.60 за выходные. В Le Chat: Free, Pro ($14.99/мес), Team ($24.99/мес за пользователя) и Enterprise. Также доступна через OpenRouter.

Question 6

Что такое параметр reasoning_effort?

Accepted Answer

Это настройка глубины рассуждения, задаваемая в каждом запросе. Значение «none» даёт быстрый ответ без цепочки рассуждений (как Mistral Small 3.2), а «high» включает пошаговое мышление для математики и сложных задач (как прежние модели Magistral). Одна модель закрывает оба сценария — не нужно переключаться между разными моделями.

Question 7

Работает ли Mistral Small 4 в России?

Accepted Answer

Да, и заметно доступнее моделей OpenAI и Anthropic. Mistral — европейская компания, её сервисы La Plateforme и Le Chat обычно открываются из России без VPN. А благодаря открытым весам модель можно использовать через OpenRouter, развернуть локально или взять у российских провайдеров. Ограничение лишь в оплате: российские карты на La Plateforme и в Le Chat Pro не принимаются — обойти можно через OpenRouter или посредников с рублёвой оплатой вроде genova-ai.ru.

Mistral Small 4

Рейтинг и бенчмарки

Входные и выходные данные

API и стоимость

Способы доступа

Сценарии использования

Тарифы и подписки — Mistral AI

Плюсы и минусы

Подробный обзор

Что такое Mistral Small 4

Архитектура: MoE 119B при 6B активных

Переключаемое рассуждение (reasoning_effort)

Цены и доступ

Доступность в России

Часто задаваемые вопросы

Все эти инструменты — уже на Genova-ai

Другие модели Mistral AI

Похожие модели