Gemini 3.5 Flash: быстрее, дешевле и умнее флагмана Google

Когда «бюджетная» модель бьёт флагман

Google сделала то, что раньше казалось маркетинговым трюком: выпустила модель из «дешёвого» Flash-тира, которая на деле обходит собственный премиум-флагман Gemini 3.1 Pro по большинству бенчмарков. На Google I/O 2026, прошедшем 19 мая, Sundar Pichai лично объявил о запуске Gemini 3.5 Flash — первой модели в новой серии 3.5, доступной бесплатно для всех пользователей прямо сейчас. Это не просто итерация. Это смена логики: Google открыто говорит, что будущее за агентами, а не за чат-ботами.

Цифры, которые говорят сами за себя

Посмотрим на бенчмарки. Gemini 3.5 Flash набирает 76.2% на Terminal-Bench 2.1 — специализированном тесте для оценки качества написания и исполнения кода. На GDPval-AA модель получает 1656 Elo — это метрика реальных агентных задач, где нужно не просто ответить, а выполнить цепочку действий. MCP Atlas (надёжность работы с инструментами) — 83.6%, CharXiv Reasoning (мультимодальное понимание) — 84.2%. Все эти показатели превышают результаты Gemini 3.1 Pro — предыдущего топового варианта.

Скорость: в 4 раза быстрее по количеству выходных токенов в секунду по сравнению с другими frontier-моделями. Стоимость: $1.50 за миллион входных токенов и $9.00 за миллион выходных — при этом Google заявляет, что большинство задач выполняются меньше чем за половину стоимости аналогичных запросов к флагманским моделям. Кэшированный ввод обходится всего в $0.15 за миллион токенов.

Контекстное окно — 1 048 576 токенов (более миллиона), максимальный вывод — 65 536 токенов. Поддерживаются текст, изображения, аудио и видео. Дата среза знаний — январь 2026 года.

Агентная архитектура: не болтать, а делать

Ключевое слово всего I/O 2026 — «agentic». Gemini 3.5 Flash создавался не как улучшенный чат-бот, а как движок для автономных агентов, способных планировать действия, вызывать инструменты и итерировать до достижения цели. CTO Google DeepMind Koray Kavukcuoglu на брифинге для прессы сказал прямо: модель способна самостоятельно выполнять сложные конвейеры кода и управлять исследовательскими проектами. По его словам, команда даже протестировала агентов, которые с нуля собрали работающую операционную систему.

Google представила Managed Agents API — один вызов API разворачивает полноценного агента в изолированном Linux-контейнере. Файлы и состояние сохраняются между сессиями, что раньше разработчикам приходилось реализовывать вручную. Это серьёзное снижение порога входа в агентную разработку.

Параллельно запускается Antigravity 2.0 — десктопное приложение для агентной разработки, прямой конкурент GitHub Copilot, Cursor и Claude Code от Anthropic. В Antigravity 3.5 Flash работает, по заявлению Google, в 12 раз быстрее за счёт оптимизации использования токенов. Доступно глобально, включая бесплатный уровень.

Кто уже использует в боевых условиях

Google не ограничилась лабораторными показателями — компания показала реальные внедрения. Shopify запускает параллельные субагенты для анализа данных и прогнозирования роста мерчантов. Macquarie Bank тестирует онбординг клиентов: модель анализирует документы объёмом более 100 страниц и выдаёт структурированные рекомендации. Salesforce интегрирует 3.5 Flash в Agentforce для автоматизации корпоративных задач с сохранением контекста между вызовами инструментов.

Ramp применяет мультимодальные возможности для умного OCR счетов-фактур в связке с историческими паттернами. Xero строит агентов для многонедельных рабочих процессов — например, сбора данных поставщиков для налоговых форм. Databricks использует агентные пайплайны для мониторинга данных в реальном времени с автоматической диагностикой и предложением исправлений.

Что это означает для рынка

Сравним с конкурентами. Claude 3.5 Sonnet от Anthropic стоит $3/$15 за миллион входных/выходных токенов. GPT-4o от OpenAI — $2.50/$10. Gemini 3.5 Flash при $1.50/$9 объективно дешевле по входным токенам, а с учётом скорости и агентных возможностей — это серьёзный вызов всему рынку API.

При этом Google анонсировала, что Gemini 3.5 Pro — настоящий флагман новой серии — выйдет уже в июне. Pichai признал, что компания активно тестирует его внутри и видит «значительные улучшения». Если Flash уже бьёт предыдущий Pro, то новый Pro должен быть действительно впечатляющим.

Аудитория Gemini достигла 900 миллионов активных пользователей в месяц — вдвое больше, чем год назад. Google превращает 3.5 Flash в модель по умолчанию для приложения Gemini и AI Mode в поиске. Это означает, что сотни миллионов людей уже сегодня взаимодействуют с новой архитектурой, даже не зная об этом.

Как попробовать из России

Gemini 3.5 Flash доступен через приложение Gemini (iOS, Android, десктоп), Google AI Studio и Android Studio. Бесплатный доступ через Gemini-приложение — без VPN работает не везде, ситуация с доступностью в РФ остаётся нестабильной. API через Google AI Studio требует аккаунта с платёжным методом — российские карты не принимаются, нужна иностранная карта или виртуальный счёт. Antigravity 2.0 доступен глобально, но с аналогичными ограничениями по оплате.

Information подтверждена несколькими независимыми публикациями, освещавшими Google I/O 2026.

Gemini 3.5 Flash: быстрее, дешевле и умнее флагмана Google

Когда «бюджетная» модель бьёт флагман

Цифры, которые говорят сами за себя

Агентная архитектура: не болтать, а делать

Кто уже использует в боевых условиях

Что это означает для рынка

Как попробовать из России

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Anthropic хочет создавать собственные лекарства с помощью ИИ

Nvidia стала венчурным банком: как чипмейкер финансирует свою монополию

Fable 5 и Mythos 5 от Anthropic вышли на мировой рынок после проверки Трампа