Z
ИИ-чатGLM-5.2Z.aiZhipu AIоткрытые моделиGPT-5.5

GLM-5.2 обходит GPT-5.5: китайская открытая модель врывается в элиту

Сергей Сергеев, редактор gen-hub.ru
Сергей Сергеев
Редактор gen-hub.ru
·4 мин чтения
GLM-5.2 обходит GPT-5.5: китайская открытая модель врывается в элиту

Момент, которого все ждали

Я слежу за гонкой открытых языковых моделей уже несколько лет, и у меня выработался стойкий иммунитет к громким заявлениям. Модели выходят с фанфарами, красиво смотрятся на бенчмарках, а через месяц о них забывают — типичная история «benchmaxxing», когда всё заточено под тесты, но не под реальную работу. GLM-5.2 от китайской Z.ai (Zhipu AI) — другой случай. И это говорю я, человек, который привык скептически щуриться на каждый очередной «прорыв».

Выпущенная 16–17 июня 2026 года, модель буквально за двое суток собрала волну независимых восторженных отзывов от людей, которые не склонны к хайпу. Джереми Ховард — человек, которого я уважаю именно за то, что он не даёт пустых комплиментов — назвал GLM-5.2 «как минимум не хуже Opus 4.8 и GPT-5.5» для своих задач. Это не маркетинговая цитата, это мнение практика.

Что внутри: архитектура без лишних слов

GLM-5.2 — это Mixture-of-Experts трансформер с 744 миллиардами общих параметров, из которых в каждом проходе активны лишь ~40 миллиардов. Параметрический объём не изменился по сравнению с GLM-5.1 — весь прирост производительности достигнут за счёт улучшений в обучении, а не за счёт тупого масштабирования. Это важный сигнал: Z.ai умеет выжимать из архитектуры максимум.

Ключевое техническое новшество — механизм IndexShare: разреженное внимание повторно использует индексы top-k между группами слоёв. На практике это означает существенное снижение стоимости инференса при работе с контекстным окном в 1 миллион токенов — расширенным с прежних 200 тысяч. При этом модель способна генерировать до 128 тысяч токенов на выходе.

Бенчмарки: цифры, которые не врут

На Artificial Analysis Intelligence Index v4.1 GLM-5.2 набрала 51 балл — это первое место среди открытых моделей, на 7 пунктов опережая MiniMax-M3 и DeepSeek V4 Pro Max (оба по 44). В агентных задачах на реальных многоходовых сценариях (GDPval-AA v2) модель набрала 1524 балла, оставив конкурентов позади и вплотную приблизившись к проприетарному GPT-5.5 в режиме xhigh reasoning.

Отдельные результаты впечатляют: 89% на GPQA Diamond (научные рассуждения докторского уровня), +16 пунктов на CritPt, +12 пунктов на Higher Level Entailment. На внутренних задачах разработки приложений Z.ai фиксирует скачок с 21/70 до 48/70 — это не косметическое улучшение.

По ценообразованию: $1.4 за миллион входных токенов, $0.26 при кэш-хите, $4.4 за выходные токены. Примерная стоимость одной задачи — $0.46. Для модели такого уровня это выглядит разумно.

Реакция сообщества: редкий единодушный консенсус

То, что произошло в течение двух дней после релиза, я наблюдаю крайне редко. Сразу несколько независимых практиков — не связанных между собой, из разных областей — пришли к одинаковому выводу: GLM-5.2 — первая открытая модель, которую можно использовать как ежедневный рабочий инструмент наравне с лучшими проприетарными системами.

Матт Веллозо написал, что это первая открытая модель, которая прошла его личный «тест ежедневного водителя». Artificial Analysis поставила её между GPT-5.5 и Opus 4.8 на новом агентном бенчмарке знаний. Сообщество r/LocalLlama, которое обычно жёстко критикует любой хайп, отнеслось к модели с нехарактерным уважением.

Это не маркетинговая кампания. Это органический консенсус.

Доступность: открыто и прямо сейчас

Z.ai выбрала агрессивную стратегию распространения: модель доступна бесплатно через Hugging Face Inference Providers (ограниченный период), поддерживает локальный запуск через llama.cpp и Unsloth в формате GGUF, а также доступна через API у DeepInfra, Novita, Nebius, Siliconflow и Fireworks. Лицензия — MIT, то есть можно брать и делать что угодно, включая коммерческое использование и самостоятельный хостинг.

Для российских пользователей: модель доступна через Hugging Face и ряд API-провайдеров. Прямой API Z.ai может потребовать VPN, однако через Siliconflow и аналогичные платформы доступ вполне реален. Принимают ли российские карты — зависит от конкретного провайдера, но GGUF-версия для локального запуска вообще не требует никаких платежей.

Главный минус, который честно признают и сами разработчики, и пользователи: отсутствие поддержки изображений. Только текст. Для агентных кодинговых задач это некритично, но для мультимодальных сценариев придётся комбинировать с другими инструментами.

Что это значит для индустрии

GLM-5.2 — это не просто хорошая модель. Это подтверждение того, что Z.ai превращается в полноценную frontier-лабораторию, а не просто в производителя бенчмарк-чемпионов.

Замечу кое-что важное: Zhipu AI не фигурировала в февральском отчёте Anthropic об «индустриальном дистилляционном взломе» китайских лабораторий. Это означает, что их результаты — собственные, а не производные от западных проприетарных систем. Это меняет картину.

Параллельно с GLM-5.2 в тот же день вышел Laguna M.1 от Poolside — открытая модель на 225B параметров (23B активных), оптимизированная для долгосрочного агентного кодинга с контекстом 256K. Рынок открытых frontier-моделей буквально за несколько дней стал значительно более насыщенным.

Главный вопрос, который сейчас висит в воздухе: когда появится открытая «Fable-class» модель — то есть модель, сопоставимая с лучшими проприетарными системами нового поколения? Z.ai прогнозирует это к концу 2026 года. Судя по темпу, с которым GLM эволюционирует от версии к версии, я склонен этому верить.

Открытые модели перестали быть утешительным призом. Это теперь настоящая гонка.

*Информация подтверждена несколькими независимыми публикациями и оценками от профессионального сообщества.*

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно

Похожие новости