Gemini 2.5 Flash
Быстрая и дешёвая мультимодальная модель Google (релиз 17 июня 2025) — первая Flash с режимом рассуждений (thinking). Контекст 1M токенов, ввод текста, изображений, аудио и видео. Лучший баланс цена/качество в линейке Gemini для массовых задач. В России без VPN не работает.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Google DeepMind
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к Gemini 2.5 Flash в приложении Gemini
- Суточный лимит запросов
- Мультимодальный ввод (фото, аудио, видео)
- Для личного использования
- Расширенные лимиты на Flash и доступ к Pro
- Gemini в Gmail, Docs, Sheets, Meet
- Deep Research, генерация изображений
- 2 ТБ облачного хранилища
- Программный доступ через ai.google.dev
- Контекст 1M, вывод до 65 536 токенов
- Режим thinking управляется параметром
- Vertex AI для enterprise-пайплайнов
- Gemini 2.5 Flash-Lite — самая дешёвая в линейке
- Для простых массовых задач
- Стабильна и доступна с 22 июля 2025
- Тот же контекст 1M токенов
Плюсы и минусы
Подробный обзор
Что такое Gemini 2.5 Flash
Gemini 2.5 Flash — быстрая мультимодальная модель от Google DeepMind, выпущенная 17 июня 2025 года. В линейке Gemini «Flash» — это лёгкие, быстрые и дешёвые модели для массовых задач, в отличие от тяжёлого флагмана «Pro». Главное достижение версии 2.5 — это первая Flash-модель с режимом рассуждений (thinking): при сохранении высокой скорости она может «подумать» перед ответом, и пользователь видит сам процесс рассуждения. Google позиционирует её как лучшую модель по соотношению цена/качество.
Ключевые возможности
- Thinking (рассуждения) — режим, в котором модель пошагово разбирает задачу; можно включать/выключать через параметр и контролировать «бюджет размышлений»
- Нативная мультимодальность — на входе текст, изображения, аудио и видео в одном запросе
- Контекст 1M токенов — большие документы и длинные диалоги даже на дешёвой модели
- Высокая скорость — оптимизирована под высоконагруженные сценарии (чат-боты, классификация, перевод)
- Вывод до 65 536 токенов — развёрнутые ответы
По всем направлениям (код, математика, наука, рассуждения, мультимодальное понимание) 2.5 Flash заметно качественнее предыдущей 2.0 Flash-Lite.
Цены и место в линейке
Через API: $0.30 за 1M входных и $2.50 за 1M выходных токенов — в разы дешевле флагмана Gemini Pro ($2/$12). Для ещё более простых задач есть Gemini 2.5 Flash-Lite (релиз 22 июля 2025) по $0.10/$0.40 за 1M — самая дешёвая в линейке. В приложении Gemini Flash доступна бесплатно с суточным лимитом, на тарифе Google AI Pro ($19.99/мес) — расширенные лимиты плюс доступ к Pro и интеграция с Workspace. Связка «Flash для массовых задач + Pro для сложных» — типовой паттерн использования Gemini.
Доступность в России
Gemini 2.5 Flash не работает в России без VPN — приложение Gemini (gemini.google.com), Google AI Studio (ai.google.dev) и связанные сервисы заблокированы для российских IP-адресов. Российские карты МИР не принимаются — нужна зарубежная карта или Google Pay с ней. Для пользователей из РФ доступ к Gemini дают посредники вроде genova-ai.ru с рублёвой оплатой за токены. Сама модель хорошо понимает русский язык, но интерфейс приложения Gemini — английский.