Qwen3.7-Max: ИИ Alibaba 35 часов сам оптимизировал чип без помощи людей

Полтора суток без человека — и 10-кратное ускорение

Представьте: вы запускаете ИИ-агента, уходите домой, ложитесь спать, просыпаетесь, снова ложитесь спать — и только на вторые сутки возвращаетесь, чтобы забрать результат. Именно так выглядит демонстрация Qwen3.7-Max от команды Alibaba. Модель отработала 35 часов в полностью автономном режиме, оптимизируя ядро вычислений для фирменного ускорителя Alibaba — и без единого человеческого вмешательства добилась 10-кратного прироста производительности по сравнению с исходной реализацией.

Это не маркетинговый трюк. Это реальный инженерный эксперимент, который меняет представление о том, что значит «агентский ИИ».

Что именно делала модель

Задача была сформулирована предельно жёстко. Qwen3.7-Max получила доступ к облачному инстансу с ускорителями T-Head ZW-M890 — фирменным чипом из семейства Alibaba. Загвоздка: эту архитектуру модель никогда не видела при обучении. Никакой документации, никаких примеров кода, никаких измерений производительности — только эталонная реализация на Triton.

За 35 часов непрерывной работы модель выполнила 1158 вызовов инструментов и провела 432 теста ядра. Она сама компилировала код, измеряла производительность, отлавливала ошибки компиляции, находила узкие места и итеративно переписывала решение. Итог — средний геометрический прирост производительности в 10 раз.

Для понимания масштаба: китайский конкурент GLM 5.1 от z.ai показал ускорение в 7.3x, Kimi K2.6 от Moonshot — 5x, DeepSeek V4 Pro — всего 3.3x, а предшественник Qwen3.6-Plus едва дотянулся до 1.1x. Часть конкурентов просто прекратила работу сама по себе — после пяти последовательных раундов без прогресса агент сдавался. Qwen3.7-Max не сдался.

Бенчмарки и сравнение с Anthropic

На стандартизированном бенчмарке KernelBench L3 Qwen3.7-Max генерирует ускоренные ядра в 96% случаев — почти вровень с Anthropic Claude Opus 4.6, который набирает 98%. На внутреннем QwenClawBench новая модель обходит Opus 4.6.

Отдельно интересен тест на стабильность между фреймворками. Предыдущий Qwen3.6-Plus показывал сильный разброс результатов в зависимости от того, через какой агентский фреймворк запускался. Qwen3.7-Max выдаёт практически идентичные результаты при запуске через OpenClaw, Claude Code и Hermes. Для корпоративных пользователей это критически важно: предсказуемость поведения агента — это половина успеха при внедрении.

Ещё один показательный тест — YC-Bench, симуляция годового жизненного цикла стартапа. Модель управляла наймом, проверяла контракты, принимала сотни управленческих решений — и сгенерировала $2.08 млн виртуальной выручки, почти вдвое превысив результат предшественника.

Как это обучалось

Архитектура обучения Qwen3.7-Max строится на подходе, который команда обкатала ещё с версии Qwen3.5. Каждая обучающая задача разбивается на три независимых компонента: сама задача, инструментальная среда и валидатор результата. Эти три части можно произвольно комбинировать, что вынуждает модель вырабатывать стратегии, работающие универсально — а не запоминать shortcuts под конкретный стенд.

Такой подход Alibaba называет «масштабированием среды» (environment scaling) — по аналогии с тем, как ранние языковые модели умнели за счёт разнообразия текстовых данных, здесь модель умнеет за счёт разнообразия агентных сред.

Примечательно, что команда использовала саму модель для мониторинга нежелательного поведения во время собственного обучения — выявления читерства и аномалий. Это своеобразная рекурсия: ИИ надзирает за собственным ИИ-обучением.

Открытость закончилась

Qwen3.7-Max доступен исключительно через API Alibaba Cloud Model Studio. Это принципиальный сдвиг: последней полностью открытой флагманской моделью был Qwen3.5-397B-A17B, выпущенный в феврале 2026 года. С тех пор Alibaba последовательно переводит топовые модели в проприетарный режим.

Логика понятна: обучение таких моделей стоит огромных денег, и отдавать их бесплатно — финансово нецелесообразно. Alibaba просто повторяет путь OpenAI и Google: лучшее — за деньги через API, чуть послабее — в открытый доступ.

Модель поддерживает OpenAI- и Anthropic-совместимые интерфейсы, что означает возможность прямой интеграции с Claude Code, OpenClaw и Qwen Code без переписывания существующих пайплайнов.

Что это значит для российских разработчиков

Доступ к Qwen3.7-Max осуществляется через Alibaba Cloud Model Studio — китайские эндпоинты. Это создаёт потенциальные сложности для европейских и американских компаний с точки зрения соответствия требованиям суверенитета данных. Для российских разработчиков ситуация неоднозначна: с одной стороны, Alibaba Cloud формально доступен, с другой — оплата и юрисдикционные вопросы требуют отдельной проверки. VPN здесь не поможет — проблема не в геоблокировке, а в регуляторном позиционировании продукта.

Итог: агентская эра наступила всерьёз

35 часов автономной работы — это не демо на конференции. Это производственный эксперимент с измеримым результатом. Если раньше агентские возможности моделей измерялись минутами или часами, Qwen3.7-Max переводит разговор в плоскость суток.

Для разработчиков это означает новый класс задач: сложная многофайловая разработка, оптимизация производительности, автоматизация офисных процессов с внешними инструментами. Для бизнеса — потенциал делегирования целых инженерных спринтов автономному агенту. Для индустрии — очередное подтверждение того, что гонка агентских возможностей между американскими и китайскими лабораториями только набирает обороты.

Информация подтверждена несколькими независимыми публикациями, детально разобравшими технические характеристики и результаты экспериментов команды Qwen.

Qwen3.7-Max: ИИ Alibaba 35 часов сам оптимизировал чип без помощи людей

Полтора суток без человека — и 10-кратное ускорение

Что именно делала модель

Бенчмарки и сравнение с Anthropic

Как это обучалось

Открытость закончилась

Что это значит для российских разработчиков

Итог: агентская эра наступила всерьёз

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Google прокачал Managed Agents: фоновые задачи, удалённый MCP и обновление токенов

Alibaba запрещает Claude Code: шпионаж или паранойя?

ИИ нашёл 1500 критических уязвимостей за месяц: индустрия не справляется