Gemini 3.5 Flash
Быстрая фронтир-модель Google (релиз 19 мая 2026 на I/O) — Flash, который обошёл прошлогодний Gemini 3.1 Pro в коде и агентных задачах. В 4× быстрее других фронтир-моделей, контекст 1M, dynamic thinking по умолчанию. Цена выросла втрое к Gemini 3 Flash, но всё ещё дешевле Pro. В России без VPN не работает.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Google DeepMind
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к Gemini 3.5 Flash в приложении Gemini
- Суточный лимит запросов
- Мультимодальный ввод (фото, аудио, видео)
- Dynamic thinking по умолчанию
- Расширенные лимиты на Flash и доступ к Pro-моделям
- Gemini в Gmail, Docs, Sheets, Meet
- Deep Research, генерация изображений (Imagen)
- 2 ТБ облачного хранилища
- Программный доступ через ai.google.dev
- Контекст 1M (1 048 576 вход / 65 536 выход)
- Cached input — $0.15 за 1M (экономия на повторах)
- Function calling, code execution, search-as-a-tool
Плюсы и минусы
Подробный обзор
Что такое Gemini 3.5 Flash
Gemini 3.5 Flash — быстрая «фронтир»-модель от Google DeepMind, представленная 19 мая 2026 года на конференции Google I/O. В линейке Gemini «Flash» — это лёгкие и быстрые модели, но версия 3.5 переопределила планку: этот Flash обошёл прошлогодний флагман Gemini 3.1 Pro на сложных задачах кодирования и агентных сценариях. Google позиционирует её как «фронтир-интеллект с действием» — то есть модель не только отвечает, но и выполняет многошаговые задачи через инструменты.
Главное — скорость и агентность
Ключевое преимущество — скорость: в 4 раза быстрее других фронтир-моделей по числу выходных токенов в секунду. Это делает её идеальной для агентов и высоконагруженных сценариев, где важна низкая задержка. Dynamic thinking включён по умолчанию — модель сама регулирует глубину рассуждений под задачу. Поддерживается полный agentic-набор: function calling (вызов функций), structured output (структурированный вывод), search-as-a-tool (поиск как инструмент) и code execution (выполнение кода).
Бенчмарки
- Terminal-Bench 2.1: 76.2% — работа в терминале и автоматизация
- GDPval-AA: 1656 Elo — задачи реального knowledge work
- MCP Atlas: 83.6% — агентные задачи через инструменты
- CharXiv Reasoning: 84.2% — лидер мультимодального понимания
На этих бенчмарках Gemini 3.5 Flash превосходит Gemini 3.1 Pro — то есть быстрая и дешёвая модель текущего поколения обходит дорогой флагман прошлого. Контекст — 1 миллион токенов (1 048 576 на вход, 65 536 на выход), нативная мультимодальность (текст, изображение, аудио, видео).
Цены и место в линейке
API: $1.50 за 1M входных и $9 за 1M выходных токенов, кэшированный ввод — $0.15 за 1M. Это втрое дороже предыдущей Gemini 3 Flash ($0.50/$3), но всё ещё примерно на 40% дешевле Gemini 3.1 Pro. В приложении Gemini Flash доступна бесплатно с суточным лимитом, на Google AI Pro ($19.99/мес) — расширенные лимиты и интеграция с Workspace. Полноценная Gemini 3.5 Pro ожидается в июне 2026 — для самых сложных задач она будет сильнее, но Flash уже сейчас закрывает большинство сценариев быстрее и дешевле.
Доступность в России
Gemini 3.5 Flash не работает в России без VPN — приложение Gemini (gemini.google.com), Google AI Studio (ai.google.dev) и связанные сервисы заблокированы для российских IP-адресов. Российские карты МИР не принимаются — нужна зарубежная карта или Google Pay с ней. Для пользователей из РФ доступ к Gemini дают посредники вроде genova-ai.ru с рублёвой оплатой за токены. Сама модель хорошо понимает русский язык, но интерфейс приложения Gemini — английский.