Google выпустила Gemini 3.5: агентный ИИ, который работает в 4 раза быстрее конкурентов

Когда Flash быстрее, чем всё вокруг
Если вы думали, что гонка больших языковых моделей замедлилась — Google только что нажала педаль газа до упора. На Google I/O 19 мая 2026 года компания представила Gemini 3.5 Flash — и это не просто очередное обновление с красивыми циферками в пресс-релизе. Это попытка переписать само понятие «быстрый агентный ИИ».
Что меня зацепило сразу: скорость генерации токенов у 3.5 Flash в 4 раза выше, чем у других фронтирных моделей. Для понимания масштаба — это разница между тем, чтобы ждать ответа и получить его раньше, чем успел сформулировать следующий вопрос. Для агентных сценариев, где модель делает десятки последовательных шагов, такое ускорение — это не косметика, а принципиально иной пользовательский опыт.
Бенчмарки: цифры, которые говорят сами за себя
Google традиционно щедра на таблицы с показателями, и на этот раз они действительно впечатляют. Terminal-Bench 2.1 — 76.2%, MCP Atlas — 83.6%, GDPval-AA — 1656 Elo. Ключевой момент: по этим агентным и кодинговым бенчмаркам 3.5 Flash обходит Gemini 3.1 Pro — то есть более дешёвая и быстрая модель переиграла предыдущего флагмана. Это нетипичная история. Обычно Flash-версии — это компромисс качества ради скорости, здесь же Google заявляет о фронтирном уровне без оговорок.
Для сравнения: GPT-4o Mini от OpenAI и Claude Haiku от Anthropic занимают аналогичные ниши «быстро и дёшево», но ни один из них не претендует на то, чтобы обгонять соответствующие Pro-версии по сложным задачам. Gemini 3.5 Flash делает именно это — и если цифры честные, это меняет расстановку сил на рынке.
Мультимодальное понимание тоже не осталось в стороне: 84.2% на CharXiv Reasoning — это серьёзный результат для работы с графиками, схемами и визуальными данными.
Antigravity: платформа, которая превращает модель в систему
Одна модель сама по себе — это инструмент. Но Google делает ставку на связку Gemini 3.5 Flash с платформой Antigravity — и вот тут начинается по-настоящему интересное.
Antigravity — это агентная среда, где несколько экземпляров 3.5 Flash могут работать как скоординированные субагенты. Один агент пишет код, второй тестирует, третий итерирует — всё под общим надзором. Google приводит конкретный пример: два агента синтезировали статью AlphaZero и написали на её основе полноценную играбельную игру за шесть часов. Задача, которая у команды разработчиков заняла бы дни, если не неделю.
Я слежу за агентными системами с момента появления первых AutoGPT-экспериментов в 2023 году, и разница очевидна: тогда это были нестабильные эксперименты, которые застревали на третьем шаге. Сейчас речь идёт о надёжном выполнении многошаговых рабочих процессов в продакшн-среде. Это качественный скачок.
Для кого это и как получить доступ
Google развернула 3.5 Flash сразу по нескольким каналам одновременно — редкий случай, когда «для всех» действительно означает всех.
Обычные пользователи получат доступ через приложение Gemini и режим AI Mode в Google Search — никаких дополнительных подписок не требуется. Разработчики могут работать с моделью через Google AI Studio, Gemini API и Android Studio в рамках платформы Antigravity. Корпоративные клиенты получают доступ через Gemini Enterprise Agent Platform.
Для российской аудитории ситуация стандартная для продуктов Google: доступ через приложение Gemini и Search теоретически возможен при наличии аккаунта Google, но стабильность работы без VPN может варьироваться. API-доступ для разработчиков по-прежнему требует решения вопроса с платёжными методами — российские карты Visa и Mastercard не работают, нужны альтернативные способы оплаты или аккаунты, зарегистрированные в других регионах.
3.5 Pro уже в работе — ждём в июне
Flash — это только начало серии. Google подтвердила, что Gemini 3.5 Pro уже используется внутри компании и выйдет для широкой аудитории в следующем месяце. Это интригует: если Flash уже превосходит предыдущий Pro, то что предложит новый Pro? Судя по логике серии, это должна быть модель, способная работать с задачами ещё более высокой сложности — возможно, там появятся расширенные возможности рассуждения, которые сейчас есть у моделей типа o3 от OpenAI или Claude Opus 4.
Что это означает для рынка
Главный вывод, который я делаю из этого анонса: граница между «быстрой» и «умной» моделью стирается. Долгое время разработчики выбирали между скоростью и качеством — Flash для прототипов, Pro для продакшна. Gemini 3.5 Flash пытается закрыть оба сценария одновременно, да ещё и по цене менее половины от стоимости других фронтирных моделей, как заявляет Google.
Для бизнеса это критически важно: агентные системы генерируют огромное количество токенов, и разница в цене при масштабировании на миллионы запросов — это уже не проценты, а порядки. Если 3.5 Flash реально держит заявленное качество при такой стоимости, многие компании пересмотрят свои стеки в пользу Gemini.
Anthropicу и OpenAI придётся отвечать — и, судя по темпу выпуска моделей в 2025-2026 годах, ответ не заставит себя долго ждать. Но сегодня инициатива у Google.
Источники
Похожие новости
ИИ от OpenAI опроверг 80-летнюю гипотезу в геометрии
Модель OpenAI самостоятельно решила задачу о единичных расстояниях Эрдёша — одну из самых известных открытых проблем комбинаторной геометрии за последние 80 лет.
Gemini 3.5 Flash: быстрее, дешевле и умнее флагмана Google
Google представила Gemini 3.5 Flash на I/O 2026 — модель обходит собственный флагман на ключевых бенчмарках, работает в 4 раза быстрее и стоит вдвое дешевле.
Google Gemini Omni: ИИ научили видеть мир как человек
Google представила Gemini Omni — мультимодальную модель с прорывом в понимании видео. Теперь ИИ анализирует движущиеся изображения не кадр за кадром, а целостно.