Qwen3-Coder

Name: Qwen3-Coder
Author: Alibaba (Qwen)

Флагманская открытая кодинг-модель Alibaba (июль 2025): MoE 480B с 35B активных, контекст 256K (до 1M с extrapolation), заточена под агентное программирование. По агентному кодингу — state-of-the-art среди открытых моделей, на уровне Claude Sonnet 4. Лицензия Apache 2.0 — бесплатный локальный запуск.

Бесплатно (открытые веса, Apache 2.0) / API у провайдеровРаботает в РФ

⭐ 8/10📅 2025-07🏢 Alibaba (Qwen)✓ Open Source

Открыть сайт

Рейтинг и бенчмарки

Общий рейтинг

8/10

Benchmark Score

8.2/10

Скорость

8.5/10

Архитектура

MoE 480B / 35B активных

Контекст

256K нативно, до 1M с extrapolation

Агентный кодинг

SOTA среди открытых, на уровне Claude Sonnet 4

Обучение

7.5 трлн токенов, 70% — код

Входные и выходные данные

Входные данные

тексткод

Выходные данные

тексткод

API и стоимость

Входные токены (Input)

Бесплатно (открытые веса, Apache 2.0) / API у провайдеров

цена за промпт

✓API доступен

Документация API →

Способы доступа

Self-hosted (Hugging Face)API (Alibaba CloudOpenRouterTogether AI)CLI Qwen Code

Сценарии использования

агентное программированиегенерация и рефакторинг кодаработа с большими репозиториямииспользование инструментовотладка

Тарифы и подписки — Alibaba (Qwen)

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Открытые веса (self-host)

Бесплатно

Чекпойнты на Hugging Face (Apache 2.0)
Коммерческое использование без ограничений
Флагман 480B-A35B + меньшие варианты под доступное железо
Запуск через vLLM / SGLang / llama.cpp

Популярный

Сторонние API

оплата за токены (зависит от провайдера)

OpenRouter, Together AI, Alibaba Cloud и др.
Без своего GPU
OpenAI-совместимый API
Интеграция в IDE и агентов

Qwen Code (CLI)

Бесплатно (open source)

Официальный агентный CLI под Qwen3-Coder
Работа с репозиторием из терминала
Вызов инструментов и многошаговые задачи

Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы

SOTA среди открытых моделей в агентном кодинге — по заявлению Alibaba, сопоставима с Claude Sonnet 4

Огромный контекст: 256K токенов нативно и до 1M с extrapolation — целые репозитории в одном запросе

Заточена под агентность: обучена long-horizon RL (20 000 параллельных окружений) — уверенно работает с инструментами и в несколько шагов

Открытые веса под Apache 2.0 — бесплатный локальный запуск и коммерческое использование без ограничений

Архитектура MoE: при 480B всего 35B активных параметров — эффективнее плотной модели того же качества

Работает в России: открытые веса с Hugging Face + доступ через сторонние API (OpenRouter, Together AI)

✗ Минусы

Флагманский вариант 480B требует серьёзного железа для self-host — на одной видеокарте не запустить (нужен кластер или квантизация)

Заточена под код и агентные задачи — для обычного чата и письма есть более универсальные модели линейки Qwen

Официальный облачный доступ — через Alibaba Cloud, российские карты там не принимаются

Интерфейс и документация на английском/китайском, русского интерфейса нет

Это специализированная модель: вне программирования качество ниже, чем у фронтир-чатов

Появились более свежие итерации линейки Qwen-Coder — для новых проектов проверяйте актуальную версию

Подробный обзор

Что такое Qwen3-Coder

Qwen3-Coder — флагманская открытая модель для программирования от Alibaba (Qwen), представленная в июле 2025 года. Старшая версия — Qwen3-Coder-480B-A35B: это Mixture-of-Experts на 480 млрд параметров, из которых на каждый токен активны лишь 35 млрд. Главный акцент модели — не просто «писать код по запросу», а агентное программирование: самостоятельно работать с репозиторием, вызывать инструменты и решать задачу в несколько шагов. По заявлению Alibaba, по агентному кодингу, agentic browser-use и tool-use это state-of-the-art среди открытых моделей, сопоставимый с Claude Sonnet 4.

Ключевые особенности

Контекст 256K токенов нативно и до 1M с методами extrapolation — модель видит целый репозиторий, а не отдельные файлы
Обучена под агентность — long-horizon RL на 20 000 параллельных окружений научили модель устойчиво проходить многошаговые задачи с инструментами
MoE-эффективность — при 480B总 параметрах работают 35B активных, поэтому инференс дешевле плотной модели того же класса
Предобучение на 7.5 трлн токенов, 70% из которых — код, при сохранении общих и математических способностей
Открытость — веса под Apache 2.0, есть официальный агентный CLI Qwen Code

Кому подходит

Это инструмент для разработчиков и команд, которым нужен открытый «движок» для AI-кодинга без привязки к закрытому провайдеру: автодополнение и рефакторинг, ревью, миграции, агенты, которые сами правят код и гоняют тесты. Флагман 480B требует серьёзного железа (кластер или агрессивная квантизация), но в линейке есть и меньшие варианты, а также хостинг у сторонних провайдеров — можно начать через API без своего GPU. Линейка активно развивается, поэтому для нового проекта стоит свериться с самой свежей итерацией Qwen-Coder.

Доступность в России

Модель доступна в России: это открытые веса под Apache 2.0 — их можно скачать с Hugging Face (доступен из РФ, иногда нужен VPN для стабильности) и запускать локально или на своём сервере без аккаунтов и карт. Если своего железа под 480B нет, проще использовать модель через сторонние API (OpenRouter, Together AI) с оплатой за токены; официальный Alibaba Cloud российские карты не принимает. Модель понимает русские комментарии и постановки задач, но саму работу с кодом и инструкции эффективнее вести на английском.

Часто задаваемые вопросы

Что такое Qwen3-Coder?

Флагманская открытая модель для программирования от Alibaba (Qwen), июль 2025. Старшая версия — Qwen3-Coder-480B-A35B (MoE: 480 млрд параметров, 35 млрд активных). Заточена под агентное программирование: самостоятельную работу с репозиторием, вызов инструментов и многошаговые задачи. Лицензия Apache 2.0.

Насколько Qwen3-Coder хорош в кодинге?

По заявлению Alibaba, это state-of-the-art среди открытых моделей в агентном кодинге, agentic browser-use и tool-use — на уровне Claude Sonnet 4. Модель обучена на 7.5 трлн токенов (70% код) и дополнительно прокачана long-horizon RL на 20 000 параллельных окружений для устойчивой работы с инструментами.

Какой у Qwen3-Coder контекст?

256K токенов нативно и до 1 млн с методами extrapolation. Это позволяет держать в контексте целый репозиторий, длинную историю изменений или большую кодовую базу, а не отдельные файлы — критично для агентных задач и рефакторинга крупных проектов.

Сколько стоит Qwen3-Coder?

Сами веса бесплатны — модель открыта под Apache 2.0, можно скачать с Hugging Face и запускать локально, в том числе коммерчески. Платить нужно только за чужой хостинг: сторонние провайдеры (OpenRouter, Together AI, Alibaba Cloud) берут за токены. Официальный CLI Qwen Code тоже бесплатный и открытый.

Какое железо нужно для запуска?

Флагман 480B-A35B требует кластера видеокарт или агрессивной квантизации — на одной потребительской GPU его не запустить. Для скромного железа в линейке есть меньшие варианты Qwen-Coder, а проще всего начать через сторонний API без собственного GPU.

Работает ли Qwen3-Coder в России?

Да — это открытые веса: качаете с Hugging Face и запускаете у себя без аккаунтов и карт. Для доступа без своего железа подойдут сторонние API (OpenRouter, Together AI). Официальный Alibaba Cloud российские карты не принимает. Постановки задач модель понимает и на русском, но работу с кодом эффективнее вести на английском.

Qwen3-Coder или универсальная LLM — что выбрать для кода?

Qwen3-Coder специализирована под программирование и агентные задачи — на них она сильнее универсальных моделей сопоставимого размера. Но для смешанных задач (код + письмо + общий чат) удобнее универсальная модель. Оптимально: Qwen3-Coder как «движок» в IDE и агентах для кода, универсальная LLM — для всего остального.