Китайский GLM-5.2 догоняет Mythos в кибербезопасности: угроза или прогресс?

Китай снова удивил — и снова в самый неудобный момент
Есть такой тип новостей, который заставляет американских чиновников открывать ноутбук в воскресенье вечером. Выход GLM-5.2 от китайской Zhipu AI — именно такой случай. Компания, известная в узких кругах под брендом Z.ai, тихо выкатила открытую модель, которая в задачах поиска программных уязвимостей не просто дотягивается до уровня Anthropic Mythos — по ряду тестов её обходит. При этом цена использования отличается настолько радикально, что разговор о «паритете» звучит почти как издевательство над западными конкурентами.
Что такое GLM-5.2 и почему он важен
GLM-5.2 — это 753-миллиардная модель архитектуры Mixture-of-Experts с контекстным окном в 1 миллион токенов. Zhipu особо подчёркивает, что этот миллион токенов — не маркетинговая цифра, а реально работающая возможность для агентных сценариев: длинные кодовые сессии, анализ больших репозиториев, сложная отладка. Модель поддерживает регулируемый уровень рассуждений — можно получить быстрый ответ или глубокий анализ в зависимости от задачи.
На бенчмарке SWE-bench Pro, измеряющем способности к программированию, GLM-5.2 набрал 62.1 балла — это лучше, чем у GPT-5.5 от OpenAI (58.6), хотя и уступает Claude Opus 4.8 от Anthropic (69.2). Разрыв есть, но он уже не пропасть.
Главный сюрприз: кибербезопасность
Настоящая сенсация пришла из тестов компании Semgrep — американского специалиста по безопасности кода. Исследователи использовали бенчмарк IDOR (Insecure Direct Object Reference), проверяющий способность модели находить уязвимости авторизации в реальных репозиториях. Результаты оказались неожиданными:
- GLM-5.2: 39% - Claude Opus 4.6: 32% - Claude Opus 4.8/4.7: 28%
Открытая китайская модель, запущенная с минимальным промптом и без дополнительных инструментов, обошла Claude Code — проприетарный агент Anthropic, заточенный именно под такие задачи. Исследователи отметили, что стоимость нахождения одной уязвимости при использовании GLM-5.2 составила примерно $0.17. Для сравнения: Claude Opus 4.8 стоит $5 за миллион входящих токенов и $25 за миллион выходящих, тогда как GLM-5.2 — $1.40 и $4.40 соответственно. Разница в 18 раз на входящих токенах — это не нюанс, это другая экономическая реальность.
Отдельно стоит упомянуть, что с дополнительным промптингом GLM-5.2 и Claude Opus 4.8 способны дотянуться до показателей самого Mythos в задачах поиска багов. Mythos — та самая модель, которую Anthropic намеренно не выпускает в открытый доступ, ссылаясь на риски безопасности. В рамках проекта Project Glasswing модель обнаружила 27-летнюю уязвимость в OpenBSD и нашла 271 уязвимость в ранней версии Firefox для Mozilla.
Почему Вашингтон нервничает
Администрация Трампа последовательно ограничивает доступ к американским ИИ-моделям за рубежом. Anthropic был вынужден закрыть доступ к Fable 5 и Mythos 5 для пользователей за пределами США. OpenAI получил рекомендации поэтапно выкатывать GPT-5.6. Логика простая: модели, умеющие находить уязвимости в программном обеспечении, — это инструмент двойного назначения с очевидным военным потенциалом.
Проблема в том, что GLM-5.2 — открытая модель с открытыми весами. Её можно скачать, запустить на собственном железе, модифицировать и — что принципиально важно — убрать все защитные ограничения. Никакие экспортные санкции здесь не работают: модель уже в открытом доступе, и её использование не требует ни подписки, ни американского аккаунта. Именно поэтому GLM-5.2 уже входит в топ-10 самых используемых моделей на OpenRouter — наравне с продуктами Anthropic, DeepSeek, Xiaomi и Tencent.
Одновременно с этим другая китайская компания, 360 Security Technology, выпустила инструмент фаззинга Tulongfeng с аналогичными заявленными возможностями. Глава компании Чжоу Хунъи высказался прямолинейно: «Такое мощное оружие, способное изменить расклад в кибервойне, не может оставаться исключительно в американских руках». Сложно не услышать в этом прямой ответ на американскую политику ограничений.
Что это значит для рынка и для нас
Эффект DeepSeek в начале 2025 года научил рынок одному: когда китайская модель появляется с несопоставимо низкой ценой и сравнимым качеством, это меняет экономику всей отрасли. GLM-5.2 продолжает эту традицию, но на этот раз точкой прорыва стала не генерация текста, а специализированная задача — кибербезопасность.
Для бизнеса это означает реальную альтернативу дорогим проприетарным моделям в задачах аудита кода и поиска уязвимостей. Microsoft уже, по имеющимся данным, изучает возможность предложения китайских моделей на своих платформах — и это само по себе говорит о том, насколько серьёзно воспринимается ценовой разрыв.
Для российских пользователей и разработчиков: GLM-5.2 как открытая модель доступна без VPN и без привязки к западным платёжным системам — её можно развернуть локально. Это делает её особенно привлекательной для тех, кто работает в условиях ограниченного доступа к западным сервисам.
Основатель Zhipu AI Тан Цзе уже анонсировал следующую цель: до конца 2026 года выпустить открытую модель, напрямую конкурирующую с Anthropic Fable 5. Судя по темпу, с которым Z.ai закрывает разрыв, это не выглядит пустым обещанием.
Гонка в ИИ давно вышла за пределы чат-ботов. Теперь её главный фронт — это безопасность кода, поиск уязвимостей и кибервойна. И здесь Китай, судя по всему, уже не догоняет.
*Информация подтверждена несколькими независимыми публикациями.*
Похожие новости
Claude Code запускает вредоносный код из GitHub без предупреждения
Исследователи Mozilla показали, как один репозиторий на GitHub может полностью захватить машину разработчика — через Claude Code и скрытый DNS-запрос.
ИИ кодил 19 дней без остановки: бенчмарк MirrorCode меняет всё
Epoch AI и METR создали бенчмарк, где ИИ переписывает программы с нуля без доступа к исходникам. Claude Opus 4.7 воссоздал 16 000 строк кода за 14 часов — человеку понадобились бы недели.
TensorRT 11.0: NVIDIA научила ИИ-инференс работать на нескольких GPU сразу
NVIDIA выпустила TensorRT 11.0 с нативной поддержкой мульти-GPU инференса — теперь генеративные модели масштабируются на несколько устройств без потери оптимизаций.