Qwen3-Coder

Qwen3-Coder

Флагманская открытая кодинг-модель Alibaba (июль 2025): MoE 480B с 35B активных, контекст 256K (до 1M с extrapolation), заточена под агентное программирование. По агентному кодингу — state-of-the-art среди открытых моделей, на уровне Claude Sonnet 4. Лицензия Apache 2.0 — бесплатный локальный запуск.

Бесплатно (открытые веса, Apache 2.0) / API у провайдеровРаботает в РФ
8/10📅 2025-07🏢 Alibaba (Qwen)✓ Open Source

Рейтинг и бенчмарки

Общий рейтинг
8/10
Benchmark Score
8.2/10
Скорость
8.5/10
Архитектура
MoE 480B / 35B активных
Контекст
256K нативно, до 1M с extrapolation
Агентный кодинг
SOTA среди открытых, на уровне Claude Sonnet 4
Обучение
7.5 трлн токенов, 70% — код

Входные и выходные данные

Входные данные
тексткод
Выходные данные
тексткод

API и стоимость

Входные токены (Input)
Бесплатно (открытые веса, Apache 2.0) / API у провайдеров
цена за промпт
API доступен

Способы доступа

Self-hosted (Hugging Face)API (Alibaba CloudOpenRouterTogether AI)CLI Qwen Code

Сценарии использования

агентное программированиегенерация и рефакторинг кодаработа с большими репозиториямииспользование инструментовотладка

Тарифы и подписки — Alibaba (Qwen)

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Открытые веса (self-host)
Бесплатно
  • Чекпойнты на Hugging Face (Apache 2.0)
  • Коммерческое использование без ограничений
  • Флагман 480B-A35B + меньшие варианты под доступное железо
  • Запуск через vLLM / SGLang / llama.cpp
Популярный
Сторонние API
оплата за токены (зависит от провайдера)
  • OpenRouter, Together AI, Alibaba Cloud и др.
  • Без своего GPU
  • OpenAI-совместимый API
  • Интеграция в IDE и агентов
Qwen Code (CLI)
Бесплатно (open source)
  • Официальный агентный CLI под Qwen3-Coder
  • Работа с репозиторием из терминала
  • Вызов инструментов и многошаговые задачи
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
SOTA среди открытых моделей в агентном кодинге — по заявлению Alibaba, сопоставима с Claude Sonnet 4
Огромный контекст: 256K токенов нативно и до 1M с extrapolation — целые репозитории в одном запросе
Заточена под агентность: обучена long-horizon RL (20 000 параллельных окружений) — уверенно работает с инструментами и в несколько шагов
Открытые веса под Apache 2.0 — бесплатный локальный запуск и коммерческое использование без ограничений
Архитектура MoE: при 480B всего 35B активных параметров — эффективнее плотной модели того же качества
Работает в России: открытые веса с Hugging Face + доступ через сторонние API (OpenRouter, Together AI)
✗ Минусы
Флагманский вариант 480B требует серьёзного железа для self-host — на одной видеокарте не запустить (нужен кластер или квантизация)
Заточена под код и агентные задачи — для обычного чата и письма есть более универсальные модели линейки Qwen
Официальный облачный доступ — через Alibaba Cloud, российские карты там не принимаются
Интерфейс и документация на английском/китайском, русского интерфейса нет
Это специализированная модель: вне программирования качество ниже, чем у фронтир-чатов
Появились более свежие итерации линейки Qwen-Coder — для новых проектов проверяйте актуальную версию

Подробный обзор

Что такое Qwen3-Coder

Qwen3-Coder — флагманская открытая модель для программирования от Alibaba (Qwen), представленная в июле 2025 года. Старшая версия — Qwen3-Coder-480B-A35B: это Mixture-of-Experts на 480 млрд параметров, из которых на каждый токен активны лишь 35 млрд. Главный акцент модели — не просто «писать код по запросу», а агентное программирование: самостоятельно работать с репозиторием, вызывать инструменты и решать задачу в несколько шагов. По заявлению Alibaba, по агентному кодингу, agentic browser-use и tool-use это state-of-the-art среди открытых моделей, сопоставимый с Claude Sonnet 4.

Ключевые особенности

  • Контекст 256K токенов нативно и до 1M с методами extrapolation — модель видит целый репозиторий, а не отдельные файлы
  • Обучена под агентность — long-horizon RL на 20 000 параллельных окружений научили модель устойчиво проходить многошаговые задачи с инструментами
  • MoE-эффективность — при 480B总 параметрах работают 35B активных, поэтому инференс дешевле плотной модели того же класса
  • Предобучение на 7.5 трлн токенов, 70% из которых — код, при сохранении общих и математических способностей
  • Открытость — веса под Apache 2.0, есть официальный агентный CLI Qwen Code

Кому подходит

Это инструмент для разработчиков и команд, которым нужен открытый «движок» для AI-кодинга без привязки к закрытому провайдеру: автодополнение и рефакторинг, ревью, миграции, агенты, которые сами правят код и гоняют тесты. Флагман 480B требует серьёзного железа (кластер или агрессивная квантизация), но в линейке есть и меньшие варианты, а также хостинг у сторонних провайдеров — можно начать через API без своего GPU. Линейка активно развивается, поэтому для нового проекта стоит свериться с самой свежей итерацией Qwen-Coder.

Доступность в России

Модель доступна в России: это открытые веса под Apache 2.0 — их можно скачать с Hugging Face (доступен из РФ, иногда нужен VPN для стабильности) и запускать локально или на своём сервере без аккаунтов и карт. Если своего железа под 480B нет, проще использовать модель через сторонние API (OpenRouter, Together AI) с оплатой за токены; официальный Alibaba Cloud российские карты не принимает. Модель понимает русские комментарии и постановки задач, но саму работу с кодом и инструкции эффективнее вести на английском.

Часто задаваемые вопросы

Что такое Qwen3-Coder?
Флагманская открытая модель для программирования от Alibaba (Qwen), июль 2025. Старшая версия — Qwen3-Coder-480B-A35B (MoE: 480 млрд параметров, 35 млрд активных). Заточена под агентное программирование: самостоятельную работу с репозиторием, вызов инструментов и многошаговые задачи. Лицензия Apache 2.0.
Насколько Qwen3-Coder хорош в кодинге?
По заявлению Alibaba, это state-of-the-art среди открытых моделей в агентном кодинге, agentic browser-use и tool-use — на уровне Claude Sonnet 4. Модель обучена на 7.5 трлн токенов (70% код) и дополнительно прокачана long-horizon RL на 20 000 параллельных окружений для устойчивой работы с инструментами.
Какой у Qwen3-Coder контекст?
256K токенов нативно и до 1 млн с методами extrapolation. Это позволяет держать в контексте целый репозиторий, длинную историю изменений или большую кодовую базу, а не отдельные файлы — критично для агентных задач и рефакторинга крупных проектов.
Сколько стоит Qwen3-Coder?
Сами веса бесплатны — модель открыта под Apache 2.0, можно скачать с Hugging Face и запускать локально, в том числе коммерчески. Платить нужно только за чужой хостинг: сторонние провайдеры (OpenRouter, Together AI, Alibaba Cloud) берут за токены. Официальный CLI Qwen Code тоже бесплатный и открытый.
Какое железо нужно для запуска?
Флагман 480B-A35B требует кластера видеокарт или агрессивной квантизации — на одной потребительской GPU его не запустить. Для скромного железа в линейке есть меньшие варианты Qwen-Coder, а проще всего начать через сторонний API без собственного GPU.
Работает ли Qwen3-Coder в России?
Да — это открытые веса: качаете с Hugging Face и запускаете у себя без аккаунтов и карт. Для доступа без своего железа подойдут сторонние API (OpenRouter, Together AI). Официальный Alibaba Cloud российские карты не принимает. Постановки задач модель понимает и на русском, но работу с кодом эффективнее вести на английском.
Qwen3-Coder или универсальная LLM — что выбрать для кода?
Qwen3-Coder специализирована под программирование и агентные задачи — на них она сильнее универсальных моделей сопоставимого размера. Но для смешанных задач (код + письмо + общий чат) удобнее универсальная модель. Оптимально: Qwen3-Coder как «движок» в IDE и агентах для кода, универсальная LLM — для всего остального.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно