Qwen 2.5 Max

Name: Qwen 2.5 Max
Author: Alibaba (Qwen)

Флагманская MoE-модель Alibaba (релиз 28 января 2025), обученная на 20+ триллионах токенов. На момент выхода обошла DeepSeek V3, GPT-4o и Claude 3.5 Sonnet на ряде бенчмарков (Arena-Hard 89.4). Проприетарная — доступна только через API Alibaba Cloud, без открытых весов. Работает в России без VPN.

API ~$1.60 вход / $6.40 выход за 1M токенов (Alibaba Cloud / OpenRouter)Работает в РФРусский язык

⭐ 7.2/10📅 2025-01-28🏢 Alibaba (Qwen)Proprietary

Открыть сайт

Рейтинг и бенчмарки

Общий рейтинг

7.2/10

Benchmark Score

7.2/10

Скорость

8.5/10

Arena-Hard

89.4 (обошла DeepSeek V3 85.5, Claude 3.5 Sonnet 85.2)

MMLU-Pro

76.1

Обучение

20+ триллионов токенов

Архитектура

MoE (8 из 64 экспертов на токен)

Релиз

28 января 2025

Входные и выходные данные

Входные данные

текст

Выходные данные

текст

API и стоимость

Входные токены (Input)

API ~$1.60 вход / $6.40 выход за 1M токенов (Alibaba Cloud / OpenRouter)

цена за промпт

Выходные токены (Output)

~$6.40 / 1M выходных токенов

цена за ответ

✓API доступен

Документация API →

Способы доступа

Alibaba Cloud Model Studio APIQwen Chat (chat.qwen.ai)OpenRouter

Сценарии использования

чат-ассистентанализ и рассуждениянаписание кодамногоязычные задачи (включая русский)обработка длинных документов

Тарифы и подписки — Alibaba (Qwen)

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный

Qwen Chat (веб)

Бесплатно (лимит)

Доступ к Qwen 2.5 Max через chat.qwen.ai
Работает в России без VPN
Понимает русский язык
Для теста без API

Alibaba Cloud API

~$1.60 вход / $6.40 выход за 1M

Доступ через Model Studio (qwen-max-2025-01-25)
60 запросов/мин (Standard), 600 (Enterprise)
Контекст 128K, вывод до 8192 токенов
Оплата зарубежной картой

OpenRouter

По тарифам OpenRouter

Единый API без аккаунта Alibaba Cloud
Принимает оплату криптовалютой (для РФ)
OpenAI-совместимый формат
Маршрутизация между провайдерами

Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы

На момент релиза обошла DeepSeek V3, GPT-4o и Claude 3.5 Sonnet на ряде бенчмарков — Arena-Hard 89.4 (лидер), MMLU-Pro 76.1

MoE-архитектура (8 из 64 экспертов на токен) — до 40% быстрее dense-моделей того же качества на том же железе

Обучена на 20+ триллионах токенов с SFT и RLHF — сильна в коде, рассуждениях и многоязычии

Хорошо понимает русский — Qwen обучен на 27+ языках, русский среди них

Работает в России без VPN — chat.qwen.ai и API Alibaba Cloud доступны напрямую

Доступна через OpenRouter — удобный единый API с оплатой в т.ч. криптой

✗ Минусы

Устарела — релиз январь 2025, вышли Qwen 3.x (3.6, 3.7 Max с контекстом 1M), которые кратно сильнее

Проприетарная — в отличие от open-weight Qwen 2.5, у Max НЕТ открытых весов, только облачный API

Российские карты МИР не принимаются у Alibaba Cloud — нужна зарубежная карта или OpenRouter с криптой

Контекст 128K и вывод всего 8192 токена — скромно по меркам 2026 (у Qwen 3.7 Max уже 1M)

Только текст — нет мультимодальности (изображения появились в vision-версиях Qwen позже)

Интерфейс Alibaba Cloud сложноват для новичков — проще через chat.qwen.ai или OpenRouter

Подробный обзор

Что такое Qwen 2.5 Max

Qwen 2.5 Max — флагманская языковая модель от Alibaba (команда Qwen / Tongyi Qianwen), выпущенная 28 января 2025 года. Это крупномасштабная MoE-модель (Mixture of Experts), предобученная на более чем 20 триллионах токенов с последующим дообучением методами SFT и RLHF. На момент релиза Qwen 2.5 Max позиционировалась как прямой конкурент топовым моделям того времени — DeepSeek V3, GPT-4o и Claude 3.5 Sonnet — и на ряде бенчмарков их обошла.

Производительность на момент выхода

Главное достижение — лидерство на Arena-Hard (89.4), где модель обошла DeepSeek V3 (85.5) и Claude 3.5 Sonnet (85.2). Также Qwen 2.5 Max выигрывала на LiveBench, LiveCodeBench и GPQA-Diamond, показала MMLU-Pro 76.1 (чуть выше DeepSeek V3, чуть ниже Claude 3.5 Sonnet). MoE-архитектура маршрутизирует каждый токен через 8 из 64 экспертных подсетей, что давало до 40% более быструю инференцию по сравнению с dense-моделями того же качества.

Важно: проприетарная, не open-weight

Ключевое отличие, которое надо понимать: Qwen 2.5 Max — проприетарная модель, в отличие от открытых Qwen 2.5 (7B, 72B и др.) под Apache 2.0. У Max нет открытых весов — её нельзя скачать с HuggingFace и запустить локально. Доступ только через облако: API Alibaba Cloud Model Studio (имя модели qwen-max-2025-01-25), веб-чат chat.qwen.ai или сторонние агрегаторы вроде OpenRouter. Это плата за топовое качество флагмана — Alibaba держит самые сильные модели закрытыми, открывая веса только младших.

Состояние на 2026 и доступность в России

Qwen 2.5 Max устарела — за ней вышли Qwen 3.x, включая Qwen 3.6 Plus и Qwen 3.7 Max (контекст до 1 миллиона токенов, выше всех бенчмарки среди китайских моделей). Для новых задач берите их. Главное преимущество Qwen для российских пользователей — работа без VPN: chat.qwen.ai и API Alibaba Cloud доступны из России напрямую, а сама модель хорошо понимает русский (обучена на 27+ языках). Российские карты МИР у Alibaba Cloud не принимаются — нужна зарубежная карта или доступ через OpenRouter с оплатой криптовалютой.

Часто задаваемые вопросы

Что такое Qwen 2.5 Max и кто его создал?

Qwen 2.5 Max — флагманская MoE-модель от Alibaba (команда Qwen), выпущенная 28 января 2025 года. Предобучена на 20+ триллионах токенов с дообучением SFT и RLHF. На момент релиза конкурировала с DeepSeek V3, GPT-4o и Claude 3.5 Sonnet, обойдя их на ряде бенчмарков (Arena-Hard 89.4). Это была одна из сильнейших моделей начала 2025 года.

Qwen 2.5 Max — открытая модель или нет?

Нет, это проприетарная модель — в отличие от открытых Qwen 2.5 (7B, 72B и др.) под Apache 2.0. У Max НЕТ открытых весов, её нельзя скачать и запустить локально. Доступ только через облако: API Alibaba Cloud (qwen-max-2025-01-25), веб-чат chat.qwen.ai или OpenRouter. Alibaba держит флагманские модели закрытыми, открывая веса только младших версий.

Работает ли Qwen 2.5 Max в России?

Да, это одно из главных преимуществ Qwen — работа без VPN. Веб-чат chat.qwen.ai и API Alibaba Cloud доступны из России напрямую. Модель хорошо понимает русский (обучена на 27+ языках). Ограничение — российские карты МИР у Alibaba Cloud не принимаются, нужна зарубежная карта или доступ через OpenRouter с оплатой криптовалютой.

Сколько стоит Qwen 2.5 Max?

Веб-чат на chat.qwen.ai бесплатен с лимитами. API через Alibaba Cloud — примерно $1.60 за 1M входных и $6.40 за 1M выходных токенов. Standard-аккаунты получают 60 запросов/мин, Enterprise — 600. Также доступна через OpenRouter по их тарифам с возможностью оплаты криптовалютой, что удобно для пользователей из РФ.

Какие бенчмарки показала Qwen 2.5 Max?

На момент релиза (январь 2025): Arena-Hard 89.4 — лидер, обошла DeepSeek V3 (85.5) и Claude 3.5 Sonnet (85.2). MMLU-Pro 76.1 — чуть выше DeepSeek V3 (75.9), чуть ниже Claude 3.5 Sonnet (78.0). Также выигрывала на LiveBench, LiveCodeBench и GPQA-Diamond. Сильна в коде, рассуждениях и многоязычных задачах.

Актуальна ли Qwen 2.5 Max в 2026 и какие альтернативы?

Устарела — вышли Qwen 3.x: Qwen 3.6 Plus и Qwen 3.7 Max (контекст до 1M токенов, выше бенчмарки). Для новых задач берите их. Альтернативы: открытые Qwen 3 (Apache 2.0, можно self-host), DeepSeek R1/V3, Llama 4. Для русского без VPN — сама Qwen, YandexGPT, GigaChat. Qwen 2.5 Max остаётся вариантом, если нужна именно эта проверенная модель через доступный из РФ API.