Qwen3.7-Plus от Alibaba: ИИ-агент, который пишет 10 000 строк кода сам

Одиннадцать часов без перерыва — и готовое приложение

Представьте: вы ставите задачу ИИ-агенту создать приложение для изучения английских слов, уходите спать, а утром обнаруживаете полноценный продукт с документацией, тест-кейсами и системой управления версиями. Именно это продемонстрировала команда Qwen из Alibaba с новой моделью Qwen3.7-Plus. Агент проработал более 11 часов, совершил свыше 1000 вызовов и выдал более 10 000 строк кода. Это уже не «умный автодополнение» — это полноценный цифровой разработчик.

Что такое Qwen3.7-Plus и почему это не очередной апдейт

Qwen3.7-Plus строится поверх текстовой модели Qwen3.7 и добавляет к ней то, чего давно не хватало агентным системам: связку визуального восприятия с реальными действиями в интерфейсах. Модель умеет читать экраны, кликать по элементам GUI, писать код по визуальным шаблонам и работать с мобильными приложениями от начала до конца — и всё это в едином агентном цикле.

Алибаба называет её «мультимодальным интерактивным гибридным агентом» — и это, пожалуй, точнее, чем кажется. Большинство мультимодальных моделей умеют *смотреть* на картинки. Qwen3.7-Plus умеет *действовать* по тому, что видит. Разница принципиальная.

Три демо, которые говорят громче бенчмарков

Команда показала три сценария использования, и каждый интереснее предыдущего.

Первый — уже упомянутое создание приложения для словарного запаса. Агент прошёл полный цикл: от написания требований до автоматического тестирования интерфейса и управления версиями. Без единого человеческого вмешательства.

Второй — реинжиниринг нативного приложения macOS Stocks. Агент запустил оригинальное приложение, разобрал структуру его интерфейса, сгенерировал аналог на SwiftUI, подключил внешний API для котировок в реальном времени и самостоятельно прогнал десять функциональных тестов. Это уже похоже на работу джуниора, которому дали задание «сделай как вот это, но лучше».

Третий — расширение для Chrome под названием «Qwen for Chrome». В режиме агента модель заходит в облачную консоль и, например, покупает самый дешёвый доступный виртуальный сервер: выбирает образ, настраивает хранилище и группы безопасности. Потом самостоятельно занимается масштабированием и обслуживанием инфраструктуры.

Где модель лучше конкурентов, а где проигрывает

Алибаба опубликовала честные бенчмарки, и это само по себе приятно. На задачах управления графическими интерфейсами — AndroidWorld и ScreenSpot Pro — Qwen3.7-Plus уверенно обходит GPT-5.4 (xhigh), Claude Opus 4.6 Max и Gemini 3.1 Pro. В агентных терминальных задачах и планировании долгосрочных действий — тоже лидер.

Но на сложных задачах чистой логики и науки картина другая. На MedXpertQA-MM модель уступает и Gemini 3.1 Pro, и GPT-5.4. В чистом кодинге и ряде агентных бенчмарков Claude Opus 4.6 выглядит сильнее. Это честная специализация: Qwen3.7-Plus — это агент для работы с реальным миром интерфейсов, а не универсальный решатель задач олимпиадного уровня.

Моё мнение: такая специализация — правильная стратегия. Рынок агентных систем нуждается не в очередной модели, побивающей MMLU, а в инструменте, который реально делает работу в браузере и на десктопе.

Технические детали для разработчиков

Модель поддерживает протокол Anthropic API, что означает совместимость с Claude Code, OpenClaw и собственным Qwen Code без дополнительных плясок с интеграцией. Это умный ход — разработчики, уже работающие с экосистемой Anthropic, могут просто переключить endpoint.

Есть интересная функция preserve_thinking — она сохраняет цепочку рассуждений из предыдущих шагов диалога. Для агентных задач, где контекст предыдущих действий критичен, это реально полезно. Команда Qwen сама рекомендует включать эту опцию для агентных сценариев.

Помимо GUI-задач, модель обрабатывает видео и анализирует сцены вождения — что намекает на амбиции в сторону встроенных систем и автономных автомобилей. Alibaba явно закладывает фундамент под несколько рынков одновременно.

Доступность и цены: что с этим в России

Qwen3.7-Plus — проприетарная модель, открытых весов нет. Доступна через Alibaba Cloud Model Studio. Цены Alibaba традиционно агрессивны по сравнению с OpenAI и Anthropic — это одно из главных конкурентных преимуществ всей линейки Qwen.

Для российских пользователей ситуация неоднозначная: Alibaba Cloud формально работает в РФ, но полноценный доступ к API-сервисам может потребовать нероссийской платёжной карты или корпоративного аккаунта. VPN при этом обычно не нужен — китайские сервисы в России не блокируются. Разработчикам стоит проверить актуальные условия регистрации напрямую на платформе.

Что это значит для индустрии

Qwen3.7-Plus — это заявка Alibaba на то, что будущее агентных систем лежит не в «думающих» моделях в вакууме, а в моделях, которые умеют взаимодействовать с реальным программным окружением. OpenAI движется в ту же сторону с Operator, Anthropic — с Computer Use в Claude. Но Qwen3.7-Plus выглядит как более цельная реализация именно агентного цикла с GUI.

Если за год-два такие агенты станут достаточно надёжными для продакшн-задач, мы увидим реальный сдвиг в том, как пишется и тестируется программное обеспечение. Одиннадцать часов автономной разработки — это уже не эксперимент. Это прототип будущего рабочего процесса.

Qwen3.7-Plus от Alibaba: ИИ-агент, который пишет 10 000 строк кода сам

Одиннадцать часов без перерыва — и готовое приложение

Что такое Qwen3.7-Plus и почему это не очередной апдейт

Три демо, которые говорят громче бенчмарков

Где модель лучше конкурентов, а где проигрывает

Технические детали для разработчиков

Доступность и цены: что с этим в России

Что это значит для индустрии

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Anthropic: Claude пишет 90% кода компании и требует глобальную кнопку паузы

Microsoft Build 2026: 7 главных анонсов, которые меняют всё

OpenAI Codex идёт в офис: 6 новых агентов для белых воротничков