Gemini 3.5 Flash: быстрее, умнее и в 5,5 раз дороже предшественника

Быстрее всех, но кошелёк опустеет быстрее
Google DeepMind сделала то, что все давно ожидали, но никто не хотел признавать: эпоха дешёвых «Flash»-моделей закончилась. Gemini 3.5 Flash, анонсированный на Google I/O и сразу вышедший в общий доступ без традиционной пометки «preview», — это технологический шаг вперёд, обёрнутый в ценник, который заставит разработчиков пересчитать свои бюджеты.
Модель выдаёт свыше 280 токенов в секунду — примерно на 70% быстрее Gemini 3 Flash и быстрее таких конкурентов, как GPT-5.4 mini. На Intelligence Index от Artificial Analysis она набирает 55 баллов — на 9 пунктов выше предшественника. Это ставит её выше Grok 4.3 (53 балла) и Claude Sonnet 4.6 (52 балла). Звучит отлично. Но дальше начинается арифметика, которая портит всю картину.
Цены выросли по всем фронтам
Google подняла цены сразу с двух сторон: и базовый тариф, и фактическое потребление токенов в реальных задачах. Теперь Gemini 3.5 Flash стоит $1,50 за миллион входных токенов и $9,00 за миллион выходных — против $0,50 и $3,00 у Gemini 3 Flash. То есть тариф вырос втрое.
Но это лишь половина проблемы. Агентные задачи требуют значительно больше итераций — модель буквально «разговаривает» сама с собой дольше, чем любой из протестированных конкурентов. В результате прогон бенчмарка Artificial Analysis Intelligence Index обошёлся в $1 551,60 для Gemini 3.5 Flash против $892,28 для Gemini 3.1 Pro. Иными словами, «бюджетная» Flash-модель обходится на 75% дороже Pro в реальных условиях агентной работы.
Для сравнения: Gemini 3 Flash с рассуждениями стоил $278 за тот же прогон. Разница — пятикратная. Это уже не «небольшая корректировка цен», это смена позиционирования продукта.
Отраслевой тренд: все лаборатории зондируют ценовую чувствительность
Гугл здесь не одинок — скорее, завершает формирование отраслевого консенсуса. Anthropic с Claude Opus 4.7 незаметно поднял реальную стоимость на 30–40% за счёт нового токенизатора. OpenAI с GPT-5.5 прибавил 50–90% к стоимости относительно GPT-5.4, хотя там рост был за счёт базовых цен при снижении потребления токенов. Google пошла иным путём: подняла и то, и другое одновременно.
Это показательно. Все три крупнейшие лаборатории синхронно тестируют, сколько API-разработчики готовы платить за «следующее поколение». Сырая цена за токен перестаёт быть релевантной метрикой — важна стоимость завершённой задачи, а не миллиона символов.
Где Flash 3.5 реально хорош
Самые впечатляющие результаты — в агентных задачах и мультимодальности. На GDPval-AA (реальные агентные сценарии) модель набрала Elo 1656, значительно обогнав Gemini 3 Flash (1204) и Gemini 3.1 Pro (1314). Лидер здесь GPT-5.4 с показателем 1674 — разрыв минимальный.
В мультимодальности Google традиционно сильна. Gemini 3.5 Flash поддерживает текст, изображения, видео и речь — в отличие от Claude Opus 4.7, Grok 4.3 и GPT-5.5, которые работают только с текстом и картинками. На бенчмарке MMMU-Pro модель набрала 84% — лучший результат среди всех протестированных моделей.
Галлюцинации тоже сократились: показатель упал до 61% против 92% у предшественника — снижение на 31 процентный пункт. Звучит как прорыв, но MiMo-V2.5-Pro и Grok 4.3 уже давно сидят на отметке 25%. Так что тут скорее «догоняем», чем «лидируем».
Слабое место: программирование
При всех достоинствах у Gemini 3.5 Flash есть заметная дыра в навыках кодирования. В coding-бенчмарках модель уступает GPT-5.5 и Claude Opus 4.7 — и это критично для разработчиков, которые рассматривают Flash как замену более тяжёлым моделям в своих пайплайнах. Если ваш основной сценарий — генерация кода или code review, переход на 3.5 Flash принесёт разочарование.
Контекст и доступность
Модель вышла сразу повсюду: в приложении Gemini, в AI Mode в Google Search, в Google AI Studio, Android Studio и корпоративных продуктах Gemini Enterprise. Контекстное окно осталось прежним — 1 миллион токенов, максимальный вывод — 65 536 токенов. Дата среза знаний — январь 2025 года.
Google также анонсировала новый Interactions API в бета-версии — по сути, их ответ на OpenAI Responses с серверным управлением историей диалога.
Для российских разработчиков ситуация стандартная: Gemini API доступен через Google AI Studio, но оплата требует иностранной карты или работы через посредников. VPN для базового доступа к документации не нужен, но для полноценной работы с API — зависит от вашей юрисдикции.
Что это значит
Gemini 3.5 Flash — это честный апгрейд по качеству, но радикальный пересмотр ценностного предложения Flash-линейки. Раньше Flash означал «дёшево и достаточно быстро». Теперь Flash означает «быстро, умно, но дорого».
Следующий месяц обещает Gemini 3.5 Pro — судя по тренду, по цене он будет выше Gemini 3.1 Pro, а значит, API-разработчики окажутся перед непростым выбором: платить за флагман или искать компромисс в более дешёвых моделях конкурентов.
Информация о характеристиках и ценах модели подтверждена несколькими независимыми публикациями, включая детальный бенчмарк-анализ Artificial Analysis с предрелизным доступом.
Похожие новости
ИИ от OpenAI опроверг 80-летнюю гипотезу в геометрии
Модель OpenAI самостоятельно решила задачу о единичных расстояниях Эрдёша — одну из самых известных открытых проблем комбинаторной геометрии за последние 80 лет.
Gemini 3.5 Flash: быстрее, дешевле и умнее флагмана Google
Google представила Gemini 3.5 Flash на I/O 2026 — модель обходит собственный флагман на ключевых бенчмарках, работает в 4 раза быстрее и стоит вдвое дешевле.
Google выпустила Gemini 3.5: агентный ИИ, который работает в 4 раза быстрее конкурентов
На Google I/O представлена новая серия моделей Gemini 3.5 Flash — она обгоняет флагманские модели по скорости и агентным задачам, уже доступна разработчикам.