Llama 3
Открытая языковая модель Meta (апрель 2024), родоначальник линейки Llama 3.x. Версии 8B и 70B обучены на 15 триллионах токенов, контекст 8K. 8B-модель обошла Llama 2 70B (в 9 раз крупнее). Лицензия Llama 3 Community — коммерция разрешена. Работает в РФ без VPN при self-host.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Meta
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Веса на HuggingFace: meta-llama/Meta-Llama-3-8B и -70B
- Коммерция по Llama 3 Community License (до 700M MAU)
- Запуск через Ollama, llama.cpp, vLLM, transformers
- GGUF-кванты для слабого железа
- Дообучение и LoRA под свою задачу
- Облачный доступ без своей инфраструктуры
- Groq — экстремально быстрая инференция Llama 3
- OpenRouter принимает криптовалюту (для РФ)
- OpenAI-совместимый API
- Чат с Llama через Meta AI (где доступно)
- Интеграция в WhatsApp, Messenger, Instagram
- Без установки и регистрации API
- Недоступно в ряде стран, включая РФ напрямую
Плюсы и минусы
Подробный обзор
Что такое Llama 3
Llama 3 — открытая языковая модель от Meta, выпущенная 18 апреля 2024 года. Это родоначальник всей линейки Llama 3.x (за ней последовали 3.1, 3.2, 3.3 и Llama 4). На старте вышли сразу четыре модели: базовые 8B и 70B и их instruction-tuned версии (8B Instruct, 70B Instruct). На момент релиза Llama 3 была самой способной открытой моделью в своих весовых категориях, обойдя Mistral, Gemma и предыдущее поколение Llama 2.
Обучение и архитектура
Модели обучены на 15 триллионах токенов из публичных источников — это в 7 раз больше, чем у Llama 2, и вчетверо больше кода. Словарь — 128K токенов, контекстное окно — 8192 токена (по меркам 2024 нормально, по меркам 2026 мало). Улучшения в пост-тренинге резко снизили долю ложных отказов, улучшили выравнивание и разнообразие ответов. Самый яркий результат — 8B-модель обошла Llama 2 70B (почти в 9 раз крупнее) на MMLU: скачок эффективности, который переопределил планку для маленьких открытых моделей.
Бенчмарки
- MMLU: 70B — 79.5%, 8B — 66.6%
- HumanEval (код): 70B — 81.7%, 8B — 62.2%
- GSM8K (математика): 70B — 93.0%, 8B — 79.6%
Для открытой модели апреля 2024 это были выдающиеся результаты — 70B конкурировал с проприетарными моделями вроде GPT-3.5 и приближался к GPT-4 на части задач.
Лицензия и где запускать
Llama 3 распространяется под Llama 3 Community License — коммерческое использование разрешено, единственное существенное ограничение: компаниям с 700+ миллионами активных пользователей в месяц нужно отдельное разрешение Meta (для большинства неактуально). Запуск: self-host (веса на HuggingFace, через Ollama, llama.cpp, vLLM — 8B идёт на потребительской GPU, 70B нужна серверная); облачные провайдеры — OpenRouter, Together AI, Groq (экстремально быстрый), AWS Bedrock по цене от ~$0.05 за 1M токенов; Meta AI в WhatsApp/Messenger там, где доступно.
Состояние на 2026 и доступность в России
Llama 3 — родоначальник, который уже устарел. Вышли Llama 3.1 (контекст 128K), 3.2 (с vision), 3.3 (качество 405B в 70B) и Llama 4 (MoE, мультимодальность). Для новых проектов берите свежие версии. Llama 3 ценна как точка отсчёта и для лёгких задач на 8B. Веса не блокируются для России — свободно качаются с HuggingFace, запускаются локально или через OpenRouter (принимает крипту). Русский язык у Llama 3 слабый — обучена в основном на английском; для русского лучше Qwen, YandexGPT или GigaChat. Чат Meta AI в России напрямую недоступен, но это не мешает использовать веса.