Gemini 3.5 Flash

Gemini 3.5 Flash

Быстрая фронтир-модель Google (релиз 19 мая 2026 на I/O) — Flash, который обошёл прошлогодний Gemini 3.1 Pro в коде и агентных задачах. В 4× быстрее других фронтир-моделей, контекст 1M, dynamic thinking по умолчанию. Цена выросла втрое к Gemini 3 Flash, но всё ещё дешевле Pro. В России без VPN не работает.

Бесплатно (лимит) / $19.99/мес (AI Pro) / API $1.50/$9 за 1MНужен VPNРусский язык
8.5/10📅 2026-05-19🏢 Google DeepMindProprietary

Рейтинг и бенчмарки

Общий рейтинг
8.5/10
Benchmark Score
8.6/10
Скорость
9.5/10
Terminal-Bench 2.1
76.2%
GDPval-AA
1656 Elo
MCP Atlas
83.6%
CharXiv Reasoning
84.2% (лидер мультимодального понимания)
Скорость
в 4× быстрее других фронтир-моделей
Релиз
19 мая 2026 (I/O)

Входные и выходные данные

Входные данные
текстизображениеаудиовидео
Выходные данные
текст

API и стоимость

Входные токены (Input)
Бесплатно (лимит) / $19.99/мес (AI Pro) / API $1.50/$9 за 1M
цена за промпт
Выходные токены (Output)
$9.00 / 1M выходных токенов
цена за ответ
API доступен

Способы доступа

Gemini AppGoogle AI StudioGemini APIVertex AI

Сценарии использования

агентные задачинаписание кодабыстрый мультимодальный анализчат-боты с высокой нагрузкойобработка длинных документовfunction calling и автоматизация

Тарифы и подписки — Google DeepMind

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Free
Бесплатно
  • Доступ к Gemini 3.5 Flash в приложении Gemini
  • Суточный лимит запросов
  • Мультимодальный ввод (фото, аудио, видео)
  • Dynamic thinking по умолчанию
Популярный
Google AI Pro
$19.99/мес
  • Расширенные лимиты на Flash и доступ к Pro-моделям
  • Gemini в Gmail, Docs, Sheets, Meet
  • Deep Research, генерация изображений (Imagen)
  • 2 ТБ облачного хранилища
Gemini API / Vertex AI
$1.50 вход / $9 выход за 1M
  • Программный доступ через ai.google.dev
  • Контекст 1M (1 048 576 вход / 65 536 выход)
  • Cached input — $0.15 за 1M (экономия на повторах)
  • Function calling, code execution, search-as-a-tool
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Flash обошёл прошлогодний флагман Gemini 3.1 Pro на сложных code- и агентных бенчмарках (Terminal-Bench 76.2%, MCP Atlas 83.6%)
В 4 раза быстрее других фронтир-моделей по скорости вывода — оптимальна для агентов и высоконагруженных сценариев
Dynamic thinking включён по умолчанию — модель сама решает, сколько «думать» над задачей, без ручной настройки
Полный набор agentic-инструментов: function calling, structured output, search-as-a-tool, code execution
Контекст 1M токенов и нативная мультимодальность (текст, изображение, аудио, видео) — большие документы и репозитории в один проход
Дешевле флагмана — API $1.50/$9 за 1M, примерно на 40% ниже Gemini 3.1 Pro при сопоставимом качестве в ряде задач
✗ Минусы
Не работает в России без VPN — Gemini App и AI Studio заблокированы для российских IP
Российские карты МИР не принимаются — оплата только зарубежной картой или Google Pay с ней
Цена выросла втрое к предыдущей Gemini 3 Flash ($0.50/$3 → $1.50/$9) — для бюджетных массовых задач это заметно
Это Flash, не Pro — в самых сложных рассуждениях полноценный Gemini 3.5 Pro (ожидается в июне 2026) будет сильнее
На выходе только текст — генерация изображений и видео через отдельные модели Google (Imagen, Veo)
Интерфейс приложения Gemini на английском, хотя модель хорошо понимает русский

Подробный обзор

Что такое Gemini 3.5 Flash

Gemini 3.5 Flash — быстрая «фронтир»-модель от Google DeepMind, представленная 19 мая 2026 года на конференции Google I/O. В линейке Gemini «Flash» — это лёгкие и быстрые модели, но версия 3.5 переопределила планку: этот Flash обошёл прошлогодний флагман Gemini 3.1 Pro на сложных задачах кодирования и агентных сценариях. Google позиционирует её как «фронтир-интеллект с действием» — то есть модель не только отвечает, но и выполняет многошаговые задачи через инструменты.

Главное — скорость и агентность

Ключевое преимущество — скорость: в 4 раза быстрее других фронтир-моделей по числу выходных токенов в секунду. Это делает её идеальной для агентов и высоконагруженных сценариев, где важна низкая задержка. Dynamic thinking включён по умолчанию — модель сама регулирует глубину рассуждений под задачу. Поддерживается полный agentic-набор: function calling (вызов функций), structured output (структурированный вывод), search-as-a-tool (поиск как инструмент) и code execution (выполнение кода).

Бенчмарки

  • Terminal-Bench 2.1: 76.2% — работа в терминале и автоматизация
  • GDPval-AA: 1656 Elo — задачи реального knowledge work
  • MCP Atlas: 83.6% — агентные задачи через инструменты
  • CharXiv Reasoning: 84.2% — лидер мультимодального понимания

На этих бенчмарках Gemini 3.5 Flash превосходит Gemini 3.1 Pro — то есть быстрая и дешёвая модель текущего поколения обходит дорогой флагман прошлого. Контекст — 1 миллион токенов (1 048 576 на вход, 65 536 на выход), нативная мультимодальность (текст, изображение, аудио, видео).

Цены и место в линейке

API: $1.50 за 1M входных и $9 за 1M выходных токенов, кэшированный ввод — $0.15 за 1M. Это втрое дороже предыдущей Gemini 3 Flash ($0.50/$3), но всё ещё примерно на 40% дешевле Gemini 3.1 Pro. В приложении Gemini Flash доступна бесплатно с суточным лимитом, на Google AI Pro ($19.99/мес) — расширенные лимиты и интеграция с Workspace. Полноценная Gemini 3.5 Pro ожидается в июне 2026 — для самых сложных задач она будет сильнее, но Flash уже сейчас закрывает большинство сценариев быстрее и дешевле.

Доступность в России

Gemini 3.5 Flash не работает в России без VPN — приложение Gemini (gemini.google.com), Google AI Studio (ai.google.dev) и связанные сервисы заблокированы для российских IP-адресов. Российские карты МИР не принимаются — нужна зарубежная карта или Google Pay с ней. Для пользователей из РФ доступ к Gemini дают посредники вроде genova-ai.ru с рублёвой оплатой за токены. Сама модель хорошо понимает русский язык, но интерфейс приложения Gemini — английский.

Часто задаваемые вопросы

Что такое Gemini 3.5 Flash и чем она примечательна?
Gemini 3.5 Flash — быстрая фронтир-модель Google, представленная 19 мая 2026 на Google I/O. Главное достижение: этот Flash обошёл прошлогодний флагман Gemini 3.1 Pro на сложных code- и агентных бенчмарках (Terminal-Bench 76.2%, MCP Atlas 83.6%). Она в 4 раза быстрее других фронтир-моделей, имеет контекст 1M токенов и dynamic thinking по умолчанию. То есть быстрая и дешёвая модель обходит дорогой флагман прошлого поколения.
Чем Gemini 3.5 Flash отличается от Gemini 3.5 Pro?
На июнь 2026 вышла только 3.5 Flash (19 мая), а Gemini 3.5 Pro ещё ожидается (в июне 2026). Flash — быстрая и дешёвая модель, оптимизированная под агентов, код и высоконагруженные сценарии. Pro, когда выйдет, будет сильнее в самых сложных рассуждениях, но дороже и медленнее. Уже сейчас 3.5 Flash превосходит прошлогодний 3.1 Pro, так что для большинства задач её достаточно.
Сколько стоит Gemini 3.5 Flash?
API: $1.50 за 1M входных и $9 за 1M выходных токенов, кэшированный ввод $0.15 за 1M. Это втрое дороже предыдущей Gemini 3 Flash ($0.50/$3), но примерно на 40% дешевле Gemini 3.1 Pro. В приложении Gemini Flash бесплатна с суточным лимитом, на Google AI Pro ($19.99/мес) — расширенные лимиты и Workspace-интеграция.
Работает ли Gemini 3.5 Flash в России?
Нет, без VPN не работает — приложение Gemini, Google AI Studio и связанные сервисы заблокированы для российских IP. Российские карты МИР не принимаются. Для доступа из РФ нужен VPN с зарубежной картой, корпоративный доступ через Vertex AI, либо посредники вроде genova-ai.ru с рублёвой оплатой за токены.
Какие agentic-возможности у Gemini 3.5 Flash?
Полный набор для построения агентов: function calling (вызов функций), structured output (структурированный вывод в заданном формате), search-as-a-tool (поиск в интернете как инструмент) и code execution (выполнение кода). Dynamic thinking включён по умолчанию — модель сама регулирует глубину рассуждений. Плюс лидерство на агентных бенчмарках (MCP Atlas 83.6%) делает её сильным выбором для автономных агентов и автоматизации.
Какой контекст и что Gemini 3.5 Flash принимает на вход?
Контекст 1 миллион токенов (1 048 576 на вход, 65 536 на выход) — большие документы и кодовые базы в один проход. Нативная мультимодальность: на входе текст, изображения, аудио и видео в одном запросе. На выходе только текст; генерация картинок и видео — через отдельные модели Google (Imagen, Veo). Лидер мультимодального понимания на CharXiv Reasoning (84.2%).
Стоит ли переходить с Gemini 2.5 Flash на 3.5 Flash?
Если важны код, агентные задачи и скорость — да. Gemini 3.5 Flash в 4 раза быстрее, обходит даже прошлогодний 3.1 Pro и имеет полный agentic-набор. Но цена выросла втрое к Gemini 3 Flash, так что для простых массовых задач, где хватает базовой модели, прежняя Flash или Flash-Lite могут быть выгоднее по бюджету. Для агентов и сложного кода 3.5 Flash однозначно сильнее.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно