Code Llama

Code Llama

Открытая модель Meta для кода на базе Llama 2 (август 2023). Четыре размера (7B/13B/34B/70B) и три варианта: базовый, Python-специализированный и Instruct. Fill-in-the-middle для вставки кода, лицензия Llama 2 Community — коммерция разрешена. Работает в РФ без VPN при self-host.

Бесплатно (self-host) / API ~$0.10–0.80 за 1M токенов у провайдеровРаботает в РФ
6/10📅 2023-08-24🏢 MetaProprietary

Рейтинг и бенчмарки

Общий рейтинг
6/10
Benchmark Score
6/10
Скорость
8/10
HumanEval (34B)
53.7%
MBPP (34B)
56.2%
Лучший HumanEval
до 67%
Обучение
7B/13B — 500B токенов кода, 70B — 1T
Варианты
base / Python / Instruct
Релиз
24 августа 2023

Входные и выходные данные

Входные данные
тексткод
Выходные данные
тексткод

API и стоимость

Входные токены (Input)
Бесплатно (self-host) / API ~$0.10–0.80 за 1M токенов у провайдеров
цена за промпт
Выходные токены (Output)
~$0.10–0.80 / 1M токенов (зависит от размера и провайдера); self-host — бесплатно
цена за ответ
API доступен

Способы доступа

Self-hosted (HuggingFaceOllamallama.cpp)OpenRouterTogether AIпровайдеры

Сценарии использования

генерация и дополнение кодаfill-in-the-middle (вставка в существующий код)отладкаобъяснение кодадообучение под свой стек

Тарифы и подписки — Meta

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Self-hosted (Open Weights)
Бесплатно
  • Веса на HuggingFace: codellama/CodeLlama-7b/13b/34b/70b
  • Варианты base / Python / Instruct
  • Коммерция по Llama 2 Community License
  • Запуск через Ollama, llama.cpp, vLLM
  • GGUF-кванты для слабого железа, FIM на 7B/13B
OpenRouter / Together / провайдеры
~$0.10–0.80 за 1M токенов
  • Облачный доступ без своей инфраструктуры
  • OpenRouter принимает криптовалюту (для РФ)
  • OpenAI-совместимый API
  • Подходит для интеграции в продукты
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Специализирована на коде — обучена дополнительно на 500B–1T токенов кода поверх Llama 2
Четыре размера (7B/13B/34B/70B) и три варианта: базовый, Python-специализированный и Instruct под разные задачи
Fill-in-the-middle (FIM) у 7B/13B — модель вставляет код в середину существующего, а не только дописывает в конец (важно для автодополнения в IDE)
Открытые веса под Llama 2 Community License — коммерческое использование, self-host и дообучение разрешены
Работает в России без VPN — веса свободно качаются с HuggingFace, запуск локальный или через OpenRouter с криптой
Огромная экосистема: Ollama, llama.cpp, расширения IDE (Continue, Cline) — лёгкий локальный код-ассистент
✗ Минусы
Сильно устарела — релиз август 2023, по качеству кода кратно уступает современным (DeepSeek R1, Qwen 3 Coder, GPT-5.x, Claude)
Базируется на Llama 2 — контекст и общие способности слабее новых моделей на Llama 3/4
Русский язык и комментарии на русском даются хуже — модель заточена под код и английский
Российские карты МИР не принимаются у API-провайдеров — нужна крипта (OpenRouter) или зарубежная карта
Запуск 34B/70B локально требует серверной GPU — на потребительском железе идут 7B/13B (или квантизация)
Нет агентных возможностей — это базовая code-модель, не инструмент вроде Copilot или Cursor с автономной работой

Подробный обзор

Что такое Code Llama

Code Llama — открытая модель для генерации кода от Meta, выпущенная 24 августа 2023 года. Это специализированная версия Llama 2: базовую модель дообучили на огромном корпусе кода, чтобы она лучше писала, дополняла и объясняла программы. На момент выхода Code Llama была одной из сильнейших открытых моделей для кода — достигала до 67% на HumanEval, опережая другие открытые модели.

Размеры и варианты

Code Llama вышла в четырёх размерах — 7B, 13B, 34B и 70B параметров — каждый в трёх вариантах:

  • Code Llama (base) — фундаментальная модель для общих задач с кодом
  • Code Llama - Python — дополнительно специализирована на Python
  • Code Llama - Instruct — следует инструкциям, лучше для чат-сценариев и безопаснее в ответах

7B и 13B обучены на 500 миллиардах токенов кода, 70B — на 1 триллионе. Важная фишка младших моделей (7B/13B) — fill-in-the-middle (FIM): способность вставлять код в середину существующего, а не только дописывать в конец. Это критично для автодополнения в редакторах, где курсор стоит посреди функции.

Бенчмарки

Code Llama оценивалась на главных code-бенчмарках — HumanEval, MBPP, APPS и многоязычном MultiPL-E. Результаты модели 34B: HumanEval 53.7%, MBPP 56.2%. Лучшие варианты достигали до 67% на HumanEval. Для открытой модели 2023 года это были передовые результаты, конкурировавшие с проприетарными решениями того времени.

Лицензия и доступ

Code Llama распространяется под Llama 2 Community License — бесплатна для исследований и коммерческого использования (ограничение на компании с 700M+ MAU неактуально для большинства). Веса лежат на HuggingFace (репозиторий codellama). Запуск: self-host через Ollama, llama.cpp, vLLM (7B/13B идут на потребительской GPU, 34B/70B — серверная); облачные провайдеры — OpenRouter, Together AI по цене от ~$0.10 за 1M токенов. Можно подключить как локальный код-ассистент в IDE через расширения вроде Continue или Cline.

Состояние на 2026 и доступность в России

Code Llama сильно устарела — релиз август 2023, она построена на Llama 2, и по качеству кода кратно уступает современным моделям: DeepSeek R1, Qwen 3 Coder, GPT-5.x, Claude Opus 4.8. Для серьёзной разработки сегодня берут их. Code Llama остаётся вариантом для лёгкого локального код-ассистента на слабом железе (7B/13B) и для изучения. Веса не блокируются для России — свободно качаются с HuggingFace, запускаются локально или через OpenRouter (принимает крипту). Российские карты МИР у провайдеров не принимаются. Модель заточена под код и английский — русские комментарии и запросы даются хуже.

Часто задаваемые вопросы

Что такое Code Llama?
Code Llama — открытая модель для генерации кода от Meta, выпущенная 24 августа 2023 года. Это специализированная версия Llama 2, дообученная на большом корпусе кода. Вышла в четырёх размерах (7B/13B/34B/70B) и трёх вариантах: базовый, Python-специализированный (Code Llama - Python) и Instruct. На момент релиза была одной из сильнейших открытых моделей для кода — до 67% на HumanEval.
Чем отличаются варианты base, Python и Instruct?
Code Llama (base) — фундаментальная модель для общих задач с кодом. Code Llama - Python дополнительно специализирована на Python и сильнее в нём. Code Llama - Instruct обучена следовать инструкциям — лучше для чат-сценариев («напиши функцию, которая...») и безопаснее в ответах. Для интерактивной работы обычно берут Instruct, для автодополнения в IDE — base с поддержкой fill-in-the-middle.
Что такое fill-in-the-middle (FIM)?
FIM — способность вставлять код в СЕРЕДИНУ существующего, а не только дописывать в конец. У Code Llama её имеют модели 7B и 13B. Это критично для автодополнения в редакторах: когда курсор стоит посреди функции, модель видит код и до, и после курсора, и вставляет подходящий фрагмент. Без FIM модель умеет только продолжать текст с конца.
Можно ли использовать Code Llama коммерчески?
Да, по Llama 2 Community License Code Llama бесплатна для исследований и коммерческого использования. Единственное ограничение — компаниям с 700+ миллионами активных пользователей в месяц нужно отдельное разрешение Meta (неактуально для большинства). Можно скачать веса, дообучить под свой стек и встроить в продукт.
Работает ли Code Llama в России?
Да. Веса свободно качаются с HuggingFace и не блокируются — модель запускается локально где угодно. Облачный доступ через OpenRouter (принимает криптовалюту), Together AI работает из России. Российские карты МИР у провайдеров не принимаются — нужна крипта или зарубежная карта. Модель заточена под код и английский, русские комментарии даются хуже.
Актуальна ли Code Llama в 2026 году?
Как рабочий инструмент — устарела. Релиз август 2023, базируется на Llama 2, по качеству кода кратно уступает современным: DeepSeek R1, Qwen 3 Coder, GPT-5.x, Claude Opus 4.8. Для серьёзной разработки берите их. Code Llama остаётся вариантом для лёгкого локального код-ассистента на слабом железе (7B/13B) и для изучения. Среди свежих открытых code-моделей лучшие — DeepSeek-Coder, Qwen Coder, Llama 4.
Какие требования к железу для Code Llama?
Code Llama 7B и 13B запускаются на потребительской GPU от 8-16 GB VRAM (RTX 3060/4070), отлично подходят для локального автодополнения. 34B требует ~24 GB (RTX 4090) или квантизации, 70B — серверной конфигурации. Через GGUF-кванты можно запускать и на CPU с достаточным RAM. Для лёгкого локального код-ассистента оптимальны 7B/13B с поддержкой fill-in-the-middle.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно