Name: Llama 4 Maverick
Author: Meta

Question 1

Что такое Llama 4 Maverick и чем отличается от Scout?

Accepted Answer

Llama 4 Maverick — флагманская open-weight модель Meta, выпущенная 5 апреля 2025 года, на архитектуре MoE (400B параметров всего, 17B активных, 128 экспертов) с контекстом 1M токенов. Llama 4 Scout — её компактная сестра (109B всего, 16 экспертов) с рекордным контекстом до 10M токенов. Maverick сильнее по качеству для большинства задач, Scout — выбор когда нужен экстремально длинный контекст на более лёгком железе.

Question 2

Что значит MoE и зачем 400B параметров если активны только 17B?

Accepted Answer

MoE (Mixture of Experts) — архитектура, где модель состоит из множества «экспертов», но на каждый токен активируется только часть. У Maverick 400 миллиардов параметров всего, но на токен работают лишь 17 миллиардов (общий эксперт + 1 из 128 маршрутизируемых). Это даёт качество и знания крупной модели при скорости и стоимости инференса средней — ключевое преимущество MoE.

Question 3

Сколько стоит использование Llama 4 Maverick?

Accepted Answer

Веса бесплатны для скачивания (self-host). Облачный API очень дёшев: OpenRouter ~$0.15 за 1M входных и ~$0.60 за 1M выходных токенов; Together AI, DeepInfra, Groq — в диапазоне $0.19–0.49 за 1M (blended по оценке Meta). Это в разы дешевле GPT-5.x и Claude Opus. Для локального запуска нужны только затраты на GPU-инфраструктуру.

Question 4

Можно ли использовать Llama 4 Maverick коммерчески?

Accepted Answer

Да, по Llama 4 Community License коммерческое использование разрешено. Единственное существенное ограничение: компаниям с 700+ миллионами активных пользователей в месяц нужно отдельное разрешение от Meta. Для индивидуальных разработчиков, стартапов и большинства бизнесов это ограничение неактуально. Веса можно дообучать и распространять с соблюдением условий лицензии.

Question 5

Работает ли Llama 4 Maverick в России?

Accepted Answer

Да. Open-weight веса на HuggingFace не блокируются — модель можно скачать и запускать локально где угодно. Облачный доступ через OpenRouter (принимает криптовалюту, удобно для РФ), Together AI, DeepInfra и Groq работает из России. Российские карты МИР напрямую обычно не принимаются — нужна зарубежная карта или оплата криптовалютой через OpenRouter.

Question 6

Какие требования к железу для локального запуска?

Accepted Answer

Maverick — тяжёлая модель: 400B параметров требуют серверной многокарточной GPU-конфигурации (несколько A100/H100 80GB). На одной потребительской видеокарте полная модель не запустится. Существуют квантизованные версии (GGUF, FP8) от сообщества, снижающие требования, но всё равно речь о десятках гигабайт VRAM. Для большинства проще использовать облачный API провайдеров, чем держать своё железо.

Question 7

Какие альтернативы Llama 4 Maverick среди открытых моделей?

Accepted Answer

Основные конкуренты в open-weight: DeepSeek V3/R1 (сильны в рассуждениях и коде), Qwen 3 от Alibaba (Apache 2.0, многоязычность), Mistral Large, Nous Hermes (файнтюны). По меркам 2026 года для топового качества стоит смотреть на свежие DeepSeek и Qwen. Maverick остаётся хорошим выбором по соотношению цена/качество и за нативную мультимодальность. Для русского языка также подойдут YandexGPT и GigaChat (но они проприетарные).

Llama 4 Maverick

Рейтинг и бенчмарки

Входные и выходные данные

API и стоимость

Способы доступа

Сценарии использования

Тарифы и подписки — Meta

Плюсы и минусы

Подробный обзор

Что такое Llama 4 Maverick

Архитектура и линейка Llama 4

Производительность

Цены и где запускать

Лицензия и доступность в России

Часто задаваемые вопросы

Все эти инструменты — уже на Genova-ai

Другие модели Meta

Похожие модели