Google переводит Gemini на Interactions API: конец эпохи generateContent

Тихая революция в том, как работает Gemini
Пока весь мир обсуждает очередные бенчмарки и сравнивает GPT с Claude, Google DeepMind сделала ход, который мало кто заметил, но который изменит жизнь каждого разработчика, работающего с Gemini. Interactions API официально стал интерфейсом по умолчанию — и это не просто косметическое переименование. Это смена архитектурной философии.
Я слежу за эволюцией API крупных ИИ-платформ уже несколько лет, и такие переходы всегда говорят о том, куда компания движется на самом деле. Google явно делает ставку на агентные сценарии — и перестраивает весь фундамент под эту идею.
Что именно изменилось и почему это важно
Старый `generateContent` работал по простой схеме: есть роль «user», есть роль «model», между ними — диалог. Это была классическая чат-парадигма, унаследованная ещё от эпохи GPT-3. Удобно для чат-ботов, но катастрофически неудобно, когда агент должен вызывать инструменты, запускать код, обращаться к внешним сервисам и делать всё это параллельно.
Interactions API заменяет ролевую структуру на типизированные шаги (typed steps) — каждое действие, будь то пользовательский ввод, вызов функции или результат поиска, является самостоятельным определённым шагом со своим типом. Это принципиально другой подход: вместо плоского диалога — граф событий. Разработчикам, которые строили сложные пайплайны поверх старого API, это должно быть очень знакомо — они буквально изобретали подобные обёртки самостоятельно.
Google просто формализовала то, что сообщество и так делало через костыли.
Агентные функции — только через новый API
Вот где начинается самое интересное. Google прямо заявила: все новые агентные возможности будут поставляться исключительно через Interactions API. Старый `generateContent` продолжит работать, но фактически заморожен в развитии. Это классический «soft deprecation» — официально не убивают, но и не развивают.
Что уже доступно через новый API? Список впечатляет:
- Managed Agents с собственной Linux-песочницей — агент может запускать реальный код в изолированной среде - Background execution для долгих задач — агент работает асинхронно, не держа соединение открытым - Tool chaining с Google Search и Google Maps — нативная интеграция, а не просто передача ссылок - Media generation — изображения, музыка, речь прямо из агентного пайплайна
Это уже не «умный чат-бот». Это полноценная агентная платформа с доступом к реальным инструментам.
Flex vs Priority: Google играет в ценовую игру
Одно из практических нововведений — два режима работы. Flex-режим снижает стоимость запросов на 50% за счёт менее приоритетного исполнения. Priority-режим оптимизирован под скорость — платишь больше, получаешь ответ быстрее.
Это прямой ответ на критику, которую Gemini получал последние полтора года: слишком дорого для высоконагруженных продакшн-сценариев. Anthropic с Claude предлагает Batch API со скидкой 50%, OpenAI — аналогичный механизм для массовых запросов. Google теперь в той же лиге, но встроила выбор прямо в основной API, а не вынесла в отдельный endpoint.
Для разработчиков, которые гоняют тысячи запросов в день в фоновых задачах, Flex-режим — это буквально деньги в кармане.
Что это значит для российских разработчиков
Честный вопрос, который всегда задают читатели gen-hub.ru. Ситуация не изменилась: Google AI Studio и Gemini API официально недоступны в России без VPN. Российские карты не принимаются для оплаты. Это ограничение существует с 2022 года и Interactions API его, разумеется, не снимает.
Практика у сообщества отработана: VPN с европейским или американским выходом, карта через зарубежный счёт или криптовалюта через сторонние сервисы. Часть команд работает через GCP-аккаунты, зарегистрированные на юридические лица в других юрисдикциях. Сложно, но реально — и судя по активности русскоязычных разработчиков на GitHub с Gemini-проектами, многие именно так и делают.
Контекст: зачем это Google сейчас
Logan Kilpatrick, руководитель developer relations в Google, написал буквально: «Interactions задаёт сцену для новой эры агентов». Это не маркетинговый буллшит — это честное описание стратегии.
Google опоздала с агентной парадигмой. OpenAI запустила Agents SDK и Responses API раньше, Anthropic выпустила Model Context Protocol, который уже стал де-факто стандартом для подключения инструментов. Google смотрела на это из окна и делала incremental updates к `generateContent`.
Interactions API — это попытка не просто догнать, а предложить что-то более структурированное. Typed steps действительно выглядят чище, чем то, что OpenAI реализовала в своём Responses API. Встроенные Managed Agents с Linux-песочницей — это то, чего у конкурентов нет в такой форме из коробки.
Миграция: насколько больно?
Google опубликовала migration guide, и судя по описанию изменений, переход нетривиальный, но управляемый. Основная работа — переосмыслить структуру истории разговора: вместо массива объектов с полями `role` и `content` придётся работать с типизированными шагами.
Для небольших проектов это день-два работы. Для сложных продакшн-систем с кастомными обёртками над API — неделя рефакторинга. Хорошая новость: старый API не ломается завтра. Плохая новость: если вы хотите Managed Agents и background execution — миграция неизбежна.
Моя рекомендация: не тяните. Чем дольше откладываете, тем больше технического долга накопится. И тем дальше отстанете от конкурентов, которые уже строят агентные продукты на новом API.
Итог
Interactions API — это не просто обновление документации. Это заявление о том, что Google видит будущее Gemini не как языковую модель с API, а как агентную платформу с полноценными возможностями автономного исполнения задач. Typed steps, Linux-песочницы, фоновое выполнение, нативные инструменты — всё это складывается в картину, которая выглядит серьёзнее, чем казалось полгода назад.
Посмотрим, хватит ли Google терпения довести это до ума — история с Bard, Duet AI и прочими ребрендингами учит осторожности. Но технически направление выбрано правильное.
Источники
Похожие новости
Fugu от Sakana AI: японский оркестратор бросает вызов Anthropic
Токийский стартап Sakana AI запустил Fugu — систему, которая дирижирует десятками LLM как единой моделью и заявляет о результатах на уровне лучших моделей Anthropic.
iOS 27: ИИ-функции Apple, которые изменят жизнь без Siri
Apple тихо встраивает ИИ в каждый уголок iPhone — и это важнее громкой перезагрузки Siri. Разбираем, что реально изменится в iOS 27 уже этой осенью.
Альтман обвинил целое поколение учёных в торможении ИИ
На лекции в Стэнфорде CEO OpenAI заявил, что скептики масштабирования ЛЯМ на годы замедлили развитие ИИ — и привёл математическое доказательство как аргумент.