Code Llama
Открытая модель Meta для кода на базе Llama 2 (август 2023). Четыре размера (7B/13B/34B/70B) и три варианта: базовый, Python-специализированный и Instruct. Fill-in-the-middle для вставки кода, лицензия Llama 2 Community — коммерция разрешена. Работает в РФ без VPN при self-host.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Meta
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Веса на HuggingFace: codellama/CodeLlama-7b/13b/34b/70b
- Варианты base / Python / Instruct
- Коммерция по Llama 2 Community License
- Запуск через Ollama, llama.cpp, vLLM
- GGUF-кванты для слабого железа, FIM на 7B/13B
- Облачный доступ без своей инфраструктуры
- OpenRouter принимает криптовалюту (для РФ)
- OpenAI-совместимый API
- Подходит для интеграции в продукты
Плюсы и минусы
Подробный обзор
Что такое Code Llama
Code Llama — открытая модель для генерации кода от Meta, выпущенная 24 августа 2023 года. Это специализированная версия Llama 2: базовую модель дообучили на огромном корпусе кода, чтобы она лучше писала, дополняла и объясняла программы. На момент выхода Code Llama была одной из сильнейших открытых моделей для кода — достигала до 67% на HumanEval, опережая другие открытые модели.
Размеры и варианты
Code Llama вышла в четырёх размерах — 7B, 13B, 34B и 70B параметров — каждый в трёх вариантах:
- Code Llama (base) — фундаментальная модель для общих задач с кодом
- Code Llama - Python — дополнительно специализирована на Python
- Code Llama - Instruct — следует инструкциям, лучше для чат-сценариев и безопаснее в ответах
7B и 13B обучены на 500 миллиардах токенов кода, 70B — на 1 триллионе. Важная фишка младших моделей (7B/13B) — fill-in-the-middle (FIM): способность вставлять код в середину существующего, а не только дописывать в конец. Это критично для автодополнения в редакторах, где курсор стоит посреди функции.
Бенчмарки
Code Llama оценивалась на главных code-бенчмарках — HumanEval, MBPP, APPS и многоязычном MultiPL-E. Результаты модели 34B: HumanEval 53.7%, MBPP 56.2%. Лучшие варианты достигали до 67% на HumanEval. Для открытой модели 2023 года это были передовые результаты, конкурировавшие с проприетарными решениями того времени.
Лицензия и доступ
Code Llama распространяется под Llama 2 Community License — бесплатна для исследований и коммерческого использования (ограничение на компании с 700M+ MAU неактуально для большинства). Веса лежат на HuggingFace (репозиторий codellama). Запуск: self-host через Ollama, llama.cpp, vLLM (7B/13B идут на потребительской GPU, 34B/70B — серверная); облачные провайдеры — OpenRouter, Together AI по цене от ~$0.10 за 1M токенов. Можно подключить как локальный код-ассистент в IDE через расширения вроде Continue или Cline.
Состояние на 2026 и доступность в России
Code Llama сильно устарела — релиз август 2023, она построена на Llama 2, и по качеству кода кратно уступает современным моделям: DeepSeek R1, Qwen 3 Coder, GPT-5.x, Claude Opus 4.8. Для серьёзной разработки сегодня берут их. Code Llama остаётся вариантом для лёгкого локального код-ассистента на слабом железе (7B/13B) и для изучения. Веса не блокируются для России — свободно качаются с HuggingFace, запускаются локально или через OpenRouter (принимает крипту). Российские карты МИР у провайдеров не принимаются. Модель заточена под код и английский — русские комментарии и запросы даются хуже.