Qwen 2.5 Max

Qwen 2.5 Max

Флагманская MoE-модель Alibaba (релиз 28 января 2025), обученная на 20+ триллионах токенов. На момент выхода обошла DeepSeek V3, GPT-4o и Claude 3.5 Sonnet на ряде бенчмарков (Arena-Hard 89.4). Проприетарная — доступна только через API Alibaba Cloud, без открытых весов. Работает в России без VPN.

API ~$1.60 вход / $6.40 выход за 1M токенов (Alibaba Cloud / OpenRouter)Работает в РФРусский язык
7.2/10📅 2025-01-28🏢 Alibaba (Qwen)Proprietary

Рейтинг и бенчмарки

Общий рейтинг
7.2/10
Benchmark Score
7.2/10
Скорость
8.5/10
Arena-Hard
89.4 (обошла DeepSeek V3 85.5, Claude 3.5 Sonnet 85.2)
MMLU-Pro
76.1
Обучение
20+ триллионов токенов
Архитектура
MoE (8 из 64 экспертов на токен)
Релиз
28 января 2025

Входные и выходные данные

Входные данные
текст
Выходные данные
текст

API и стоимость

Входные токены (Input)
API ~$1.60 вход / $6.40 выход за 1M токенов (Alibaba Cloud / OpenRouter)
цена за промпт
Выходные токены (Output)
~$6.40 / 1M выходных токенов
цена за ответ
API доступен

Способы доступа

Alibaba Cloud Model Studio APIQwen Chat (chat.qwen.ai)OpenRouter

Сценарии использования

чат-ассистентанализ и рассуждениянаписание кодамногоязычные задачи (включая русский)обработка длинных документов

Тарифы и подписки — Alibaba (Qwen)

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Qwen Chat (веб)
Бесплатно (лимит)
  • Доступ к Qwen 2.5 Max через chat.qwen.ai
  • Работает в России без VPN
  • Понимает русский язык
  • Для теста без API
Alibaba Cloud API
~$1.60 вход / $6.40 выход за 1M
  • Доступ через Model Studio (qwen-max-2025-01-25)
  • 60 запросов/мин (Standard), 600 (Enterprise)
  • Контекст 128K, вывод до 8192 токенов
  • Оплата зарубежной картой
OpenRouter
По тарифам OpenRouter
  • Единый API без аккаунта Alibaba Cloud
  • Принимает оплату криптовалютой (для РФ)
  • OpenAI-совместимый формат
  • Маршрутизация между провайдерами
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
На момент релиза обошла DeepSeek V3, GPT-4o и Claude 3.5 Sonnet на ряде бенчмарков — Arena-Hard 89.4 (лидер), MMLU-Pro 76.1
MoE-архитектура (8 из 64 экспертов на токен) — до 40% быстрее dense-моделей того же качества на том же железе
Обучена на 20+ триллионах токенов с SFT и RLHF — сильна в коде, рассуждениях и многоязычии
Хорошо понимает русский — Qwen обучен на 27+ языках, русский среди них
Работает в России без VPN — chat.qwen.ai и API Alibaba Cloud доступны напрямую
Доступна через OpenRouter — удобный единый API с оплатой в т.ч. криптой
✗ Минусы
Устарела — релиз январь 2025, вышли Qwen 3.x (3.6, 3.7 Max с контекстом 1M), которые кратно сильнее
Проприетарная — в отличие от open-weight Qwen 2.5, у Max НЕТ открытых весов, только облачный API
Российские карты МИР не принимаются у Alibaba Cloud — нужна зарубежная карта или OpenRouter с криптой
Контекст 128K и вывод всего 8192 токена — скромно по меркам 2026 (у Qwen 3.7 Max уже 1M)
Только текст — нет мультимодальности (изображения появились в vision-версиях Qwen позже)
Интерфейс Alibaba Cloud сложноват для новичков — проще через chat.qwen.ai или OpenRouter

Подробный обзор

Что такое Qwen 2.5 Max

Qwen 2.5 Max — флагманская языковая модель от Alibaba (команда Qwen / Tongyi Qianwen), выпущенная 28 января 2025 года. Это крупномасштабная MoE-модель (Mixture of Experts), предобученная на более чем 20 триллионах токенов с последующим дообучением методами SFT и RLHF. На момент релиза Qwen 2.5 Max позиционировалась как прямой конкурент топовым моделям того времени — DeepSeek V3, GPT-4o и Claude 3.5 Sonnet — и на ряде бенчмарков их обошла.

Производительность на момент выхода

Главное достижение — лидерство на Arena-Hard (89.4), где модель обошла DeepSeek V3 (85.5) и Claude 3.5 Sonnet (85.2). Также Qwen 2.5 Max выигрывала на LiveBench, LiveCodeBench и GPQA-Diamond, показала MMLU-Pro 76.1 (чуть выше DeepSeek V3, чуть ниже Claude 3.5 Sonnet). MoE-архитектура маршрутизирует каждый токен через 8 из 64 экспертных подсетей, что давало до 40% более быструю инференцию по сравнению с dense-моделями того же качества.

Важно: проприетарная, не open-weight

Ключевое отличие, которое надо понимать: Qwen 2.5 Max — проприетарная модель, в отличие от открытых Qwen 2.5 (7B, 72B и др.) под Apache 2.0. У Max нет открытых весов — её нельзя скачать с HuggingFace и запустить локально. Доступ только через облако: API Alibaba Cloud Model Studio (имя модели qwen-max-2025-01-25), веб-чат chat.qwen.ai или сторонние агрегаторы вроде OpenRouter. Это плата за топовое качество флагмана — Alibaba держит самые сильные модели закрытыми, открывая веса только младших.

Состояние на 2026 и доступность в России

Qwen 2.5 Max устарела — за ней вышли Qwen 3.x, включая Qwen 3.6 Plus и Qwen 3.7 Max (контекст до 1 миллиона токенов, выше всех бенчмарки среди китайских моделей). Для новых задач берите их. Главное преимущество Qwen для российских пользователей — работа без VPN: chat.qwen.ai и API Alibaba Cloud доступны из России напрямую, а сама модель хорошо понимает русский (обучена на 27+ языках). Российские карты МИР у Alibaba Cloud не принимаются — нужна зарубежная карта или доступ через OpenRouter с оплатой криптовалютой.

Часто задаваемые вопросы

Что такое Qwen 2.5 Max и кто его создал?
Qwen 2.5 Max — флагманская MoE-модель от Alibaba (команда Qwen), выпущенная 28 января 2025 года. Предобучена на 20+ триллионах токенов с дообучением SFT и RLHF. На момент релиза конкурировала с DeepSeek V3, GPT-4o и Claude 3.5 Sonnet, обойдя их на ряде бенчмарков (Arena-Hard 89.4). Это была одна из сильнейших моделей начала 2025 года.
Qwen 2.5 Max — открытая модель или нет?
Нет, это проприетарная модель — в отличие от открытых Qwen 2.5 (7B, 72B и др.) под Apache 2.0. У Max НЕТ открытых весов, её нельзя скачать и запустить локально. Доступ только через облако: API Alibaba Cloud (qwen-max-2025-01-25), веб-чат chat.qwen.ai или OpenRouter. Alibaba держит флагманские модели закрытыми, открывая веса только младших версий.
Работает ли Qwen 2.5 Max в России?
Да, это одно из главных преимуществ Qwen — работа без VPN. Веб-чат chat.qwen.ai и API Alibaba Cloud доступны из России напрямую. Модель хорошо понимает русский (обучена на 27+ языках). Ограничение — российские карты МИР у Alibaba Cloud не принимаются, нужна зарубежная карта или доступ через OpenRouter с оплатой криптовалютой.
Сколько стоит Qwen 2.5 Max?
Веб-чат на chat.qwen.ai бесплатен с лимитами. API через Alibaba Cloud — примерно $1.60 за 1M входных и $6.40 за 1M выходных токенов. Standard-аккаунты получают 60 запросов/мин, Enterprise — 600. Также доступна через OpenRouter по их тарифам с возможностью оплаты криптовалютой, что удобно для пользователей из РФ.
Какие бенчмарки показала Qwen 2.5 Max?
На момент релиза (январь 2025): Arena-Hard 89.4 — лидер, обошла DeepSeek V3 (85.5) и Claude 3.5 Sonnet (85.2). MMLU-Pro 76.1 — чуть выше DeepSeek V3 (75.9), чуть ниже Claude 3.5 Sonnet (78.0). Также выигрывала на LiveBench, LiveCodeBench и GPQA-Diamond. Сильна в коде, рассуждениях и многоязычных задачах.
Актуальна ли Qwen 2.5 Max в 2026 и какие альтернативы?
Устарела — вышли Qwen 3.x: Qwen 3.6 Plus и Qwen 3.7 Max (контекст до 1M токенов, выше бенчмарки). Для новых задач берите их. Альтернативы: открытые Qwen 3 (Apache 2.0, можно self-host), DeepSeek R1/V3, Llama 4. Для русского без VPN — сама Qwen, YandexGPT, GigaChat. Qwen 2.5 Max остаётся вариантом, если нужна именно эта проверенная модель через доступный из РФ API.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно