Google переводит Gemini на Interactions API: конец эпохи generateContent

Тихая революция в том, как работает Gemini

Пока весь мир обсуждает очередные бенчмарки и сравнивает GPT с Claude, Google DeepMind сделала ход, который мало кто заметил, но который изменит жизнь каждого разработчика, работающего с Gemini. Interactions API официально стал интерфейсом по умолчанию — и это не просто косметическое переименование. Это смена архитектурной философии.

Я слежу за эволюцией API крупных ИИ-платформ уже несколько лет, и такие переходы всегда говорят о том, куда компания движется на самом деле. Google явно делает ставку на агентные сценарии — и перестраивает весь фундамент под эту идею.

Что именно изменилось и почему это важно

Старый `generateContent` работал по простой схеме: есть роль «user», есть роль «model», между ними — диалог. Это была классическая чат-парадигма, унаследованная ещё от эпохи GPT-3. Удобно для чат-ботов, но катастрофически неудобно, когда агент должен вызывать инструменты, запускать код, обращаться к внешним сервисам и делать всё это параллельно.

Interactions API заменяет ролевую структуру на типизированные шаги (typed steps) — каждое действие, будь то пользовательский ввод, вызов функции или результат поиска, является самостоятельным определённым шагом со своим типом. Это принципиально другой подход: вместо плоского диалога — граф событий. Разработчикам, которые строили сложные пайплайны поверх старого API, это должно быть очень знакомо — они буквально изобретали подобные обёртки самостоятельно.

Google просто формализовала то, что сообщество и так делало через костыли.

Агентные функции — только через новый API

Вот где начинается самое интересное. Google прямо заявила: все новые агентные возможности будут поставляться исключительно через Interactions API. Старый `generateContent` продолжит работать, но фактически заморожен в развитии. Это классический «soft deprecation» — официально не убивают, но и не развивают.

Что уже доступно через новый API? Список впечатляет:

- Managed Agents с собственной Linux-песочницей — агент может запускать реальный код в изолированной среде - Background execution для долгих задач — агент работает асинхронно, не держа соединение открытым - Tool chaining с Google Search и Google Maps — нативная интеграция, а не просто передача ссылок - Media generation — изображения, музыка, речь прямо из агентного пайплайна

Это уже не «умный чат-бот». Это полноценная агентная платформа с доступом к реальным инструментам.

Flex vs Priority: Google играет в ценовую игру

Одно из практических нововведений — два режима работы. Flex-режим снижает стоимость запросов на 50% за счёт менее приоритетного исполнения. Priority-режим оптимизирован под скорость — платишь больше, получаешь ответ быстрее.

Это прямой ответ на критику, которую Gemini получал последние полтора года: слишком дорого для высоконагруженных продакшн-сценариев. Anthropic с Claude предлагает Batch API со скидкой 50%, OpenAI — аналогичный механизм для массовых запросов. Google теперь в той же лиге, но встроила выбор прямо в основной API, а не вынесла в отдельный endpoint.

Для разработчиков, которые гоняют тысячи запросов в день в фоновых задачах, Flex-режим — это буквально деньги в кармане.

Что это значит для российских разработчиков

Честный вопрос, который всегда задают читатели gen-hub.ru. Ситуация не изменилась: Google AI Studio и Gemini API официально недоступны в России без VPN. Российские карты не принимаются для оплаты. Это ограничение существует с 2022 года и Interactions API его, разумеется, не снимает.

Практика у сообщества отработана: VPN с европейским или американским выходом, карта через зарубежный счёт или криптовалюта через сторонние сервисы. Часть команд работает через GCP-аккаунты, зарегистрированные на юридические лица в других юрисдикциях. Сложно, но реально — и судя по активности русскоязычных разработчиков на GitHub с Gemini-проектами, многие именно так и делают.

Контекст: зачем это Google сейчас

Logan Kilpatrick, руководитель developer relations в Google, написал буквально: «Interactions задаёт сцену для новой эры агентов». Это не маркетинговый буллшит — это честное описание стратегии.

Google опоздала с агентной парадигмой. OpenAI запустила Agents SDK и Responses API раньше, Anthropic выпустила Model Context Protocol, который уже стал де-факто стандартом для подключения инструментов. Google смотрела на это из окна и делала incremental updates к `generateContent`.

Interactions API — это попытка не просто догнать, а предложить что-то более структурированное. Typed steps действительно выглядят чище, чем то, что OpenAI реализовала в своём Responses API. Встроенные Managed Agents с Linux-песочницей — это то, чего у конкурентов нет в такой форме из коробки.

Миграция: насколько больно?

Google опубликовала migration guide, и судя по описанию изменений, переход нетривиальный, но управляемый. Основная работа — переосмыслить структуру истории разговора: вместо массива объектов с полями `role` и `content` придётся работать с типизированными шагами.

Для небольших проектов это день-два работы. Для сложных продакшн-систем с кастомными обёртками над API — неделя рефакторинга. Хорошая новость: старый API не ломается завтра. Плохая новость: если вы хотите Managed Agents и background execution — миграция неизбежна.

Моя рекомендация: не тяните. Чем дольше откладываете, тем больше технического долга накопится. И тем дальше отстанете от конкурентов, которые уже строят агентные продукты на новом API.

Итог

Interactions API — это не просто обновление документации. Это заявление о том, что Google видит будущее Gemini не как языковую модель с API, а как агентную платформу с полноценными возможностями автономного исполнения задач. Typed steps, Linux-песочницы, фоновое выполнение, нативные инструменты — всё это складывается в картину, которая выглядит серьёзнее, чем казалось полгода назад.

Посмотрим, хватит ли Google терпения довести это до ума — история с Bard, Duet AI и прочими ребрендингами учит осторожности. Но технически направление выбрано правильное.

Google переводит Gemini на Interactions API: конец эпохи generateContent

Тихая революция в том, как работает Gemini

Что именно изменилось и почему это важно

Агентные функции — только через новый API

Flex vs Priority: Google играет в ценовую игру

Что это значит для российских разработчиков

Контекст: зачем это Google сейчас

Миграция: насколько больно?

Итог

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Fugu от Sakana AI: японский оркестратор бросает вызов Anthropic

iOS 27: ИИ-функции Apple, которые изменят жизнь без Siri

Альтман обвинил целое поколение учёных в торможении ИИ