Qwen 2.5 Max
Флагманская MoE-модель Alibaba (релиз 28 января 2025), обученная на 20+ триллионах токенов. На момент выхода обошла DeepSeek V3, GPT-4o и Claude 3.5 Sonnet на ряде бенчмарков (Arena-Hard 89.4). Проприетарная — доступна только через API Alibaba Cloud, без открытых весов. Работает в России без VPN.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Alibaba (Qwen)
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к Qwen 2.5 Max через chat.qwen.ai
- Работает в России без VPN
- Понимает русский язык
- Для теста без API
- Доступ через Model Studio (qwen-max-2025-01-25)
- 60 запросов/мин (Standard), 600 (Enterprise)
- Контекст 128K, вывод до 8192 токенов
- Оплата зарубежной картой
- Единый API без аккаунта Alibaba Cloud
- Принимает оплату криптовалютой (для РФ)
- OpenAI-совместимый формат
- Маршрутизация между провайдерами
Плюсы и минусы
Подробный обзор
Что такое Qwen 2.5 Max
Qwen 2.5 Max — флагманская языковая модель от Alibaba (команда Qwen / Tongyi Qianwen), выпущенная 28 января 2025 года. Это крупномасштабная MoE-модель (Mixture of Experts), предобученная на более чем 20 триллионах токенов с последующим дообучением методами SFT и RLHF. На момент релиза Qwen 2.5 Max позиционировалась как прямой конкурент топовым моделям того времени — DeepSeek V3, GPT-4o и Claude 3.5 Sonnet — и на ряде бенчмарков их обошла.
Производительность на момент выхода
Главное достижение — лидерство на Arena-Hard (89.4), где модель обошла DeepSeek V3 (85.5) и Claude 3.5 Sonnet (85.2). Также Qwen 2.5 Max выигрывала на LiveBench, LiveCodeBench и GPQA-Diamond, показала MMLU-Pro 76.1 (чуть выше DeepSeek V3, чуть ниже Claude 3.5 Sonnet). MoE-архитектура маршрутизирует каждый токен через 8 из 64 экспертных подсетей, что давало до 40% более быструю инференцию по сравнению с dense-моделями того же качества.
Важно: проприетарная, не open-weight
Ключевое отличие, которое надо понимать: Qwen 2.5 Max — проприетарная модель, в отличие от открытых Qwen 2.5 (7B, 72B и др.) под Apache 2.0. У Max нет открытых весов — её нельзя скачать с HuggingFace и запустить локально. Доступ только через облако: API Alibaba Cloud Model Studio (имя модели qwen-max-2025-01-25), веб-чат chat.qwen.ai или сторонние агрегаторы вроде OpenRouter. Это плата за топовое качество флагмана — Alibaba держит самые сильные модели закрытыми, открывая веса только младших.
Состояние на 2026 и доступность в России
Qwen 2.5 Max устарела — за ней вышли Qwen 3.x, включая Qwen 3.6 Plus и Qwen 3.7 Max (контекст до 1 миллиона токенов, выше всех бенчмарки среди китайских моделей). Для новых задач берите их. Главное преимущество Qwen для российских пользователей — работа без VPN: chat.qwen.ai и API Alibaba Cloud доступны из России напрямую, а сама модель хорошо понимает русский (обучена на 27+ языках). Российские карты МИР у Alibaba Cloud не принимаются — нужна зарубежная карта или доступ через OpenRouter с оплатой криптовалютой.