Question 1

Работает ли Qwen 3.5 в России без VPN?

Accepted Answer

Да, полностью. Сайт qwen.ai, чат chat.qwen.ai, HuggingFace (huggingface.co/Qwen), ModelScope и Alibaba Cloud — всё открывается с российских IP без VPN. Это ключевое отличие от ChatGPT, Claude и Gemini, которые заблокированы для РФ своими провайдерами. Единственное ограничение — Alibaba Cloud не принимает российские карты для оплаты API, но это обходится через OpenRouter (криптовалюта или зарубежные карты) или self-hosting локально.

Question 2

Сколько стоит Qwen 3.5 в 2026 году?

Accepted Answer

Open weights — полностью бесплатно. Скачали с HuggingFace и запустили на своих серверах. Через Alibaba Cloud API цена: $0.40 за 1M input-токенов и $1.20 за 1M output-токенов — это в 6-8 раз дешевле GPT-5 ($2.50/$10) и Claude Opus 4.7 ($3/$15). Через OpenRouter — небольшая наценка ~10% ($0.45/$1.35). Для корпоративных клиентов доступны dedicated инстансы в Alibaba Cloud с выделенной инфраструктурой — цена по запросу, обычно начинается от $5000/мес за 72B модель.

Question 3

Qwen 3.5 действительно конкурирует с GPT-5 и Claude Opus 4.7?

Accepted Answer

По большинству бенчмарков Qwen 3.5 находится в пределах 2-5% от GPT-5 и Claude Opus 4.7. MMLU: 89.2% (Qwen) vs ~91% (GPT-5). HumanEval: 86.2% vs ~90%. MATH: 79.8% vs ~85%. Arena ELO: 1325 vs ~1400. На кодинге и математике Qwen немного отстаёт, на анализе текстов и мультиязычности — почти равна. Где Qwen явно выигрывает: цена (в 6-8 раз дешевле), работа в России, возможность self-hosting, и полная прозрачность весов.

Question 4

Можно ли использовать Qwen 3.5 в коммерческом продукте бесплатно?

Accepted Answer

Да, и это главное преимущество модели. Лицензия Apache 2.0 прямо разрешает коммерческое использование, модификацию и распространение производных работ. Не нужно платить Alibaba роялти, не нужно открывать свой код (в отличие от GPL), не нужно указывать авторов в UI (достаточно в NOTICE-файле). Единственные ограничения Apache 2.0: сохранять оригинальные copyright-нотисы в исходниках и не использовать торговые марки Alibaba без разрешения. На практике большинство компаний просто скачивают веса с HuggingFace и интегрируют в продукт без какого-либо юридического контакта с Alibaba.

Question 5

Какое железо нужно для self-hosting Qwen 3.5?

Accepted Answer

Зависит от размера модели. Qwen3.5-7B: одна RTX 3090 или RTX 4090 (24 ГБ VRAM), даёт 50-80 токенов/сек. Qwen3.5-14B: одна RTX 4090 в 8-bit квантизации или две карты в FP16. Qwen3.5-72B: одна A100 80GB в 4-bit (AWQ) или две A100 80GB в FP16. Qwen3.5-110B (флагман): минимум две A100 80GB или одна H100 80GB + NVMe swap для FP16, либо одна A100 80GB для AWQ 4-bit. Для production используют vLLM (continuous batching) — это в 2-3 раза быстрее наивного Transformers. На Apple Silicon (M3/M4) через Ollama/llama.cpp работает только до 14B версии с приемлемой скоростью.

Question 6

Насколько хорошо Qwen 3.5 говорит по-русски?

Accepted Answer

Лучше всех предыдущих open-source моделей (Llama 3, Mistral, старые Qwen), но слабее GPT-5 и Claude по русскому. Основные проблемы: иногда смешивает русский и китайский/английский в длинных ответах, чуть хуже следует сложным русским грамматическим конструкциям, и чуть слабее улавливает российский культурный контекст. Для простых задач (саммаризация, перевод, ответы на вопросы) — работает отлично. Для генерации художественных русских текстов или юридических документов лучше GPT-5. Для технических задач на английском с русскими именами/названиями — Qwen справляется на уровне топовых моделей.

Qwen 3.5

Рейтинг и бенчмарки

Входные и выходные данные

API и стоимость

Способы доступа

Сценарии использования

Тарифы и подписки — Alibaba (Qwen)

Плюсы и минусы

Подробный обзор

Что такое Qwen 3.5

Главное преимущество: открытый код под Apache 2.0

Технические характеристики

Сравнение с проприетарными моделями

Эволюция семейства Qwen

Доступность в России — ключевой плюс

Self-hosting и аппаратные требования

Часто задаваемые вопросы

Все эти инструменты — уже на Genova-ai

Другие модели Alibaba (Qwen)

Похожие модели