Gemini 3.5 Flash: быстрее, дешевле и умнее флагмана Google
Когда «бюджетная» модель бьёт флагман
Google сделала то, что раньше казалось маркетинговым трюком: выпустила модель из «дешёвого» Flash-тира, которая на деле обходит собственный премиум-флагман Gemini 3.1 Pro по большинству бенчмарков. На Google I/O 2026, прошедшем 19 мая, Sundar Pichai лично объявил о запуске Gemini 3.5 Flash — первой модели в новой серии 3.5, доступной бесплатно для всех пользователей прямо сейчас. Это не просто итерация. Это смена логики: Google открыто говорит, что будущее за агентами, а не за чат-ботами.
Цифры, которые говорят сами за себя
Посмотрим на бенчмарки. Gemini 3.5 Flash набирает 76.2% на Terminal-Bench 2.1 — специализированном тесте для оценки качества написания и исполнения кода. На GDPval-AA модель получает 1656 Elo — это метрика реальных агентных задач, где нужно не просто ответить, а выполнить цепочку действий. MCP Atlas (надёжность работы с инструментами) — 83.6%, CharXiv Reasoning (мультимодальное понимание) — 84.2%. Все эти показатели превышают результаты Gemini 3.1 Pro — предыдущего топового варианта.
Скорость: в 4 раза быстрее по количеству выходных токенов в секунду по сравнению с другими frontier-моделями. Стоимость: $1.50 за миллион входных токенов и $9.00 за миллион выходных — при этом Google заявляет, что большинство задач выполняются меньше чем за половину стоимости аналогичных запросов к флагманским моделям. Кэшированный ввод обходится всего в $0.15 за миллион токенов.
Контекстное окно — 1 048 576 токенов (более миллиона), максимальный вывод — 65 536 токенов. Поддерживаются текст, изображения, аудио и видео. Дата среза знаний — январь 2026 года.
Агентная архитектура: не болтать, а делать
Ключевое слово всего I/O 2026 — «agentic». Gemini 3.5 Flash создавался не как улучшенный чат-бот, а как движок для автономных агентов, способных планировать действия, вызывать инструменты и итерировать до достижения цели. CTO Google DeepMind Koray Kavukcuoglu на брифинге для прессы сказал прямо: модель способна самостоятельно выполнять сложные конвейеры кода и управлять исследовательскими проектами. По его словам, команда даже протестировала агентов, которые с нуля собрали работающую операционную систему.
Google представила Managed Agents API — один вызов API разворачивает полноценного агента в изолированном Linux-контейнере. Файлы и состояние сохраняются между сессиями, что раньше разработчикам приходилось реализовывать вручную. Это серьёзное снижение порога входа в агентную разработку.
Параллельно запускается Antigravity 2.0 — десктопное приложение для агентной разработки, прямой конкурент GitHub Copilot, Cursor и Claude Code от Anthropic. В Antigravity 3.5 Flash работает, по заявлению Google, в 12 раз быстрее за счёт оптимизации использования токенов. Доступно глобально, включая бесплатный уровень.
Кто уже использует в боевых условиях
Google не ограничилась лабораторными показателями — компания показала реальные внедрения. Shopify запускает параллельные субагенты для анализа данных и прогнозирования роста мерчантов. Macquarie Bank тестирует онбординг клиентов: модель анализирует документы объёмом более 100 страниц и выдаёт структурированные рекомендации. Salesforce интегрирует 3.5 Flash в Agentforce для автоматизации корпоративных задач с сохранением контекста между вызовами инструментов.
Ramp применяет мультимодальные возможности для умного OCR счетов-фактур в связке с историческими паттернами. Xero строит агентов для многонедельных рабочих процессов — например, сбора данных поставщиков для налоговых форм. Databricks использует агентные пайплайны для мониторинга данных в реальном времени с автоматической диагностикой и предложением исправлений.
Что это означает для рынка
Сравним с конкурентами. Claude 3.5 Sonnet от Anthropic стоит $3/$15 за миллион входных/выходных токенов. GPT-4o от OpenAI — $2.50/$10. Gemini 3.5 Flash при $1.50/$9 объективно дешевле по входным токенам, а с учётом скорости и агентных возможностей — это серьёзный вызов всему рынку API.
При этом Google анонсировала, что Gemini 3.5 Pro — настоящий флагман новой серии — выйдет уже в июне. Pichai признал, что компания активно тестирует его внутри и видит «значительные улучшения». Если Flash уже бьёт предыдущий Pro, то новый Pro должен быть действительно впечатляющим.
Аудитория Gemini достигла 900 миллионов активных пользователей в месяц — вдвое больше, чем год назад. Google превращает 3.5 Flash в модель по умолчанию для приложения Gemini и AI Mode в поиске. Это означает, что сотни миллионов людей уже сегодня взаимодействуют с новой архитектурой, даже не зная об этом.
Как попробовать из России
Gemini 3.5 Flash доступен через приложение Gemini (iOS, Android, десктоп), Google AI Studio и Android Studio. Бесплатный доступ через Gemini-приложение — без VPN работает не везде, ситуация с доступностью в РФ остаётся нестабильной. API через Google AI Studio требует аккаунта с платёжным методом — российские карты не принимаются, нужна иностранная карта или виртуальный счёт. Antigravity 2.0 доступен глобально, но с аналогичными ограничениями по оплате.
Information подтверждена несколькими независимыми публикациями, освещавшими Google I/O 2026.
Похожие новости
ИИ от OpenAI опроверг 80-летнюю гипотезу в геометрии
Модель OpenAI самостоятельно решила задачу о единичных расстояниях Эрдёша — одну из самых известных открытых проблем комбинаторной геометрии за последние 80 лет.
Google выпустила Gemini 3.5: агентный ИИ, который работает в 4 раза быстрее конкурентов
На Google I/O представлена новая серия моделей Gemini 3.5 Flash — она обгоняет флагманские модели по скорости и агентным задачам, уже доступна разработчикам.
Google Gemini Omni: ИИ научили видеть мир как человек
Google представила Gemini Omni — мультимодальную модель с прорывом в понимании видео. Теперь ИИ анализирует движущиеся изображения не кадр за кадром, а целостно.