Gemini 3.5 Flash: быстрее, умнее и в 5,5 раз дороже предшественника

Быстрее всех, но кошелёк опустеет быстрее

Google DeepMind сделала то, что все давно ожидали, но никто не хотел признавать: эпоха дешёвых «Flash»-моделей закончилась. Gemini 3.5 Flash, анонсированный на Google I/O и сразу вышедший в общий доступ без традиционной пометки «preview», — это технологический шаг вперёд, обёрнутый в ценник, который заставит разработчиков пересчитать свои бюджеты.

Модель выдаёт свыше 280 токенов в секунду — примерно на 70% быстрее Gemini 3 Flash и быстрее таких конкурентов, как GPT-5.4 mini. На Intelligence Index от Artificial Analysis она набирает 55 баллов — на 9 пунктов выше предшественника. Это ставит её выше Grok 4.3 (53 балла) и Claude Sonnet 4.6 (52 балла). Звучит отлично. Но дальше начинается арифметика, которая портит всю картину.

Цены выросли по всем фронтам

Google подняла цены сразу с двух сторон: и базовый тариф, и фактическое потребление токенов в реальных задачах. Теперь Gemini 3.5 Flash стоит $1,50 за миллион входных токенов и $9,00 за миллион выходных — против $0,50 и $3,00 у Gemini 3 Flash. То есть тариф вырос втрое.

Но это лишь половина проблемы. Агентные задачи требуют значительно больше итераций — модель буквально «разговаривает» сама с собой дольше, чем любой из протестированных конкурентов. В результате прогон бенчмарка Artificial Analysis Intelligence Index обошёлся в $1 551,60 для Gemini 3.5 Flash против $892,28 для Gemini 3.1 Pro. Иными словами, «бюджетная» Flash-модель обходится на 75% дороже Pro в реальных условиях агентной работы.

Для сравнения: Gemini 3 Flash с рассуждениями стоил $278 за тот же прогон. Разница — пятикратная. Это уже не «небольшая корректировка цен», это смена позиционирования продукта.

Отраслевой тренд: все лаборатории зондируют ценовую чувствительность

Гугл здесь не одинок — скорее, завершает формирование отраслевого консенсуса. Anthropic с Claude Opus 4.7 незаметно поднял реальную стоимость на 30–40% за счёт нового токенизатора. OpenAI с GPT-5.5 прибавил 50–90% к стоимости относительно GPT-5.4, хотя там рост был за счёт базовых цен при снижении потребления токенов. Google пошла иным путём: подняла и то, и другое одновременно.

Это показательно. Все три крупнейшие лаборатории синхронно тестируют, сколько API-разработчики готовы платить за «следующее поколение». Сырая цена за токен перестаёт быть релевантной метрикой — важна стоимость завершённой задачи, а не миллиона символов.

Где Flash 3.5 реально хорош

Самые впечатляющие результаты — в агентных задачах и мультимодальности. На GDPval-AA (реальные агентные сценарии) модель набрала Elo 1656, значительно обогнав Gemini 3 Flash (1204) и Gemini 3.1 Pro (1314). Лидер здесь GPT-5.4 с показателем 1674 — разрыв минимальный.

В мультимодальности Google традиционно сильна. Gemini 3.5 Flash поддерживает текст, изображения, видео и речь — в отличие от Claude Opus 4.7, Grok 4.3 и GPT-5.5, которые работают только с текстом и картинками. На бенчмарке MMMU-Pro модель набрала 84% — лучший результат среди всех протестированных моделей.

Галлюцинации тоже сократились: показатель упал до 61% против 92% у предшественника — снижение на 31 процентный пункт. Звучит как прорыв, но MiMo-V2.5-Pro и Grok 4.3 уже давно сидят на отметке 25%. Так что тут скорее «догоняем», чем «лидируем».

Слабое место: программирование

При всех достоинствах у Gemini 3.5 Flash есть заметная дыра в навыках кодирования. В coding-бенчмарках модель уступает GPT-5.5 и Claude Opus 4.7 — и это критично для разработчиков, которые рассматривают Flash как замену более тяжёлым моделям в своих пайплайнах. Если ваш основной сценарий — генерация кода или code review, переход на 3.5 Flash принесёт разочарование.

Контекст и доступность

Модель вышла сразу повсюду: в приложении Gemini, в AI Mode в Google Search, в Google AI Studio, Android Studio и корпоративных продуктах Gemini Enterprise. Контекстное окно осталось прежним — 1 миллион токенов, максимальный вывод — 65 536 токенов. Дата среза знаний — январь 2025 года.

Google также анонсировала новый Interactions API в бета-версии — по сути, их ответ на OpenAI Responses с серверным управлением историей диалога.

Для российских разработчиков ситуация стандартная: Gemini API доступен через Google AI Studio, но оплата требует иностранной карты или работы через посредников. VPN для базового доступа к документации не нужен, но для полноценной работы с API — зависит от вашей юрисдикции.

Что это значит

Gemini 3.5 Flash — это честный апгрейд по качеству, но радикальный пересмотр ценностного предложения Flash-линейки. Раньше Flash означал «дёшево и достаточно быстро». Теперь Flash означает «быстро, умно, но дорого».

Следующий месяц обещает Gemini 3.5 Pro — судя по тренду, по цене он будет выше Gemini 3.1 Pro, а значит, API-разработчики окажутся перед непростым выбором: платить за флагман или искать компромисс в более дешёвых моделях конкурентов.

Информация о характеристиках и ценах модели подтверждена несколькими независимыми публикациями, включая детальный бенчмарк-анализ Artificial Analysis с предрелизным доступом.

Gemini 3.5 Flash: быстрее, умнее и в 5,5 раз дороже предшественника

Быстрее всех, но кошелёк опустеет быстрее

Цены выросли по всем фронтам

Отраслевой тренд: все лаборатории зондируют ценовую чувствительность

Где Flash 3.5 реально хорош

Слабое место: программирование

Контекст и доступность

Что это значит

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Anthropic хочет создавать собственные лекарства с помощью ИИ

Nvidia стала венчурным банком: как чипмейкер финансирует свою монополию

Fable 5 и Mythos 5 от Anthropic вышли на мировой рынок после проверки Трампа