Google выпустила Gemini 3.5: агентный ИИ, который работает в 4 раза быстрее конкурентов

Когда Flash быстрее, чем всё вокруг

Если вы думали, что гонка больших языковых моделей замедлилась — Google только что нажала педаль газа до упора. На Google I/O 19 мая 2026 года компания представила Gemini 3.5 Flash — и это не просто очередное обновление с красивыми циферками в пресс-релизе. Это попытка переписать само понятие «быстрый агентный ИИ».

Что меня зацепило сразу: скорость генерации токенов у 3.5 Flash в 4 раза выше, чем у других фронтирных моделей. Для понимания масштаба — это разница между тем, чтобы ждать ответа и получить его раньше, чем успел сформулировать следующий вопрос. Для агентных сценариев, где модель делает десятки последовательных шагов, такое ускорение — это не косметика, а принципиально иной пользовательский опыт.

Бенчмарки: цифры, которые говорят сами за себя

Google традиционно щедра на таблицы с показателями, и на этот раз они действительно впечатляют. Terminal-Bench 2.1 — 76.2%, MCP Atlas — 83.6%, GDPval-AA — 1656 Elo. Ключевой момент: по этим агентным и кодинговым бенчмаркам 3.5 Flash обходит Gemini 3.1 Pro — то есть более дешёвая и быстрая модель переиграла предыдущего флагмана. Это нетипичная история. Обычно Flash-версии — это компромисс качества ради скорости, здесь же Google заявляет о фронтирном уровне без оговорок.

Для сравнения: GPT-4o Mini от OpenAI и Claude Haiku от Anthropic занимают аналогичные ниши «быстро и дёшево», но ни один из них не претендует на то, чтобы обгонять соответствующие Pro-версии по сложным задачам. Gemini 3.5 Flash делает именно это — и если цифры честные, это меняет расстановку сил на рынке.

Мультимодальное понимание тоже не осталось в стороне: 84.2% на CharXiv Reasoning — это серьёзный результат для работы с графиками, схемами и визуальными данными.

Antigravity: платформа, которая превращает модель в систему

Одна модель сама по себе — это инструмент. Но Google делает ставку на связку Gemini 3.5 Flash с платформой Antigravity — и вот тут начинается по-настоящему интересное.

Antigravity — это агентная среда, где несколько экземпляров 3.5 Flash могут работать как скоординированные субагенты. Один агент пишет код, второй тестирует, третий итерирует — всё под общим надзором. Google приводит конкретный пример: два агента синтезировали статью AlphaZero и написали на её основе полноценную играбельную игру за шесть часов. Задача, которая у команды разработчиков заняла бы дни, если не неделю.

Я слежу за агентными системами с момента появления первых AutoGPT-экспериментов в 2023 году, и разница очевидна: тогда это были нестабильные эксперименты, которые застревали на третьем шаге. Сейчас речь идёт о надёжном выполнении многошаговых рабочих процессов в продакшн-среде. Это качественный скачок.

Для кого это и как получить доступ

Google развернула 3.5 Flash сразу по нескольким каналам одновременно — редкий случай, когда «для всех» действительно означает всех.

Обычные пользователи получат доступ через приложение Gemini и режим AI Mode в Google Search — никаких дополнительных подписок не требуется. Разработчики могут работать с моделью через Google AI Studio, Gemini API и Android Studio в рамках платформы Antigravity. Корпоративные клиенты получают доступ через Gemini Enterprise Agent Platform.

Для российской аудитории ситуация стандартная для продуктов Google: доступ через приложение Gemini и Search теоретически возможен при наличии аккаунта Google, но стабильность работы без VPN может варьироваться. API-доступ для разработчиков по-прежнему требует решения вопроса с платёжными методами — российские карты Visa и Mastercard не работают, нужны альтернативные способы оплаты или аккаунты, зарегистрированные в других регионах.

3.5 Pro уже в работе — ждём в июне

Flash — это только начало серии. Google подтвердила, что Gemini 3.5 Pro уже используется внутри компании и выйдет для широкой аудитории в следующем месяце. Это интригует: если Flash уже превосходит предыдущий Pro, то что предложит новый Pro? Судя по логике серии, это должна быть модель, способная работать с задачами ещё более высокой сложности — возможно, там появятся расширенные возможности рассуждения, которые сейчас есть у моделей типа o3 от OpenAI или Claude Opus 4.

Что это означает для рынка

Главный вывод, который я делаю из этого анонса: граница между «быстрой» и «умной» моделью стирается. Долгое время разработчики выбирали между скоростью и качеством — Flash для прототипов, Pro для продакшна. Gemini 3.5 Flash пытается закрыть оба сценария одновременно, да ещё и по цене менее половины от стоимости других фронтирных моделей, как заявляет Google.

Для бизнеса это критически важно: агентные системы генерируют огромное количество токенов, и разница в цене при масштабировании на миллионы запросов — это уже не проценты, а порядки. Если 3.5 Flash реально держит заявленное качество при такой стоимости, многие компании пересмотрят свои стеки в пользу Gemini.

Anthropicу и OpenAI придётся отвечать — и, судя по темпу выпуска моделей в 2025-2026 годах, ответ не заставит себя долго ждать. Но сегодня инициатива у Google.

Google выпустила Gemini 3.5: агентный ИИ, который работает в 4 раза быстрее конкурентов

Когда Flash быстрее, чем всё вокруг

Бенчмарки: цифры, которые говорят сами за себя

Antigravity: платформа, которая превращает модель в систему

Для кого это и как получить доступ

3.5 Pro уже в работе — ждём в июне

Что это означает для рынка

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Anthropic хочет создавать собственные лекарства с помощью ИИ

Nvidia стала венчурным банком: как чипмейкер финансирует свою монополию

Fable 5 и Mythos 5 от Anthropic вышли на мировой рынок после проверки Трампа