Fugu от Sakana AI: японский оркестратор бросает вызов Anthropic

Когда дирижёр важнее солиста

Что если следующий прорыв в ИИ — это не очередная гигантская модель, обученная на петабайтах данных, а умный менеджер, который знает, кому из специалистов поручить задачу? Именно на этот вопрос отвечает Fugu — новый продукт токийского стартапа Sakana AI, официально вышедший 22 июня 2026 года.

Fugu — это не просто очередной агентный фреймворк. Это коммерческий мультиагентный оркестратор, который снаружи выглядит как обычная языковая модель с одним OpenAI-совместимым API, а внутри динамически координирует пул специализированных LLM. Пользователь отправляет запрос — и не подозревает, что за кулисами уже идёт распределение ролей между несколькими моделями.

Как работает «дирижёр»

В основе Fugu лежит архитектура, которую Sakana AI называет RL Conductor — небольшая языковая модель (~7B параметров), обученная через обучение с подкреплением управлять пулом рабочих LLM. Conductor не следует жёстко прописанному пайплайну: он анализирует входящий запрос и на лету генерирует кастомный рабочий процесс на естественном языке.

Для каждого шага модель формирует инструкцию для конкретного агента, назначает исполнителя и определяет, какой контекст из предыдущих шагов ему доступен. В зависимости от задачи Conductor может выстроить последовательную цепочку, параллельное дерево или рекурсивный цикл — включая вызов самого себя для верификации ответа.

Академическая база у проекта серьёзная: два доклада, принятых на ICLR 2026. Первый — TRINITY — описывает эволюционную координацию с ролями Thinker, Worker и Verifier. Второй — Conductor — исследует обучение стратегиям коммуникации между агентами через RL. То есть система не просто маршрутизирует запросы по правилам, написанным инженером, — она сама обнаруживает оптимальные стратегии взаимодействия.

Два варианта для разных задач

Sakana AI запускает два продукта. Fugu (базовый) оптимизирован под низкую задержку и повседневные задачи: помощь в кодинге, code review, чат-боты. Команды с требованиями к приватности могут исключать отдельных агентов из пула.

Fugu Ultra — версия для максимального качества на сложных многошаговых задачах. Ранние пользователи уже применяют его для воспроизведения научных статей, анализа патентов, кибербезопасности и AI-исследований. Один из показательных кейсов: инженер-программист получил от Fugu Ultra более 20 замечаний при code review там, где другие инструменты находили лишь 3.

Оба варианта доступны через единый API, поддерживаются подписочная модель и pay-as-you-go.

Бенчмарки: впечатляет, но с оговорками

Sakana AI публикует сравнительную таблицу, где Fugu Ultra соперничает с топовыми моделями рынка. Ключевые цифры для Fugu Ultra:

- SWE-Bench Pro: 73.7 (против 69.2 у Opus 4.8 и 58.6 у GPT-5.5) - LiveCodeBench: 93.2 (против 87.8 у Opus 4.8) - GPQA-D: 95.5 (лучший результат в таблице) - Humanity's Last Exam: 50.0 (чуть выше 49.8 у Opus 4.8) - TerminalBench 2.1: 82.1 (против 74.6 у Opus 4.8)

Цифры действительно впечатляют. Но здесь важна честность: ни Fable 5, ни Mythos Preview не входят в агентный пул Fugu — эти модели Anthropic просто недоступны публично. Sakana AI признаёт, что с их включением результаты были бы ещё выше. Кроме того, сравнительные данные по конкурентам взяты из публикаций самих провайдеров — независимого аудита пока нет.

При этом Fable 5 всё же обходит Fugu Ultra на нескольких бенчмарках, так что картина «победы по всем фронтам» несколько преувеличена. Но факт остаётся: оркестрация достигла уровня, где она реально конкурирует с монолитными системами на бенчмарках, за которыми следит индустрия.

Главный аргумент: страховка от вендорного локина

Sakana AI делает ставку не только на производительность, но и на геополитический аргумент. Компания прямо указывает на введённые экспортные ограничения для моделей Anthropic как на живой пример того, как доступ к критической AI-инфраструктуре может исчезнуть за одну ночь из-за регуляторных или внешнеполитических решений.

«Для организации или государства зависеть от API одной компании в критической инфраструктуре, финансах или госуправлении — это материальная уязвимость. Этот риск больше не гипотетический», — формулирует Sakana AI свою позицию.

Пул агентов спроектирован как взаимозаменяемый: если один провайдер ограничивает доступ, Fugu автоматически переключается на альтернативные модели. Обновление пула после выхода нового фронтирного релиза занимает около двух недель.

Что это значит для рынка

Fugu — не первая попытка оркестрации LLM, но, пожалуй, самая зрелая коммерческая реализация с академической подложкой. Ручные пайплайны типа LangChain ломаются при смещении распределения запросов — и это хорошо известная боль команд в продакшне. Sakana AI решает именно эту проблему, обучая систему находить оптимальные стратегии самостоятельно.

Однако есть и нерешённые вопросы. Оркестрация нескольких сторонних моделей и их перепродажа как сервиса порождает вопросы соответствия условиям использования каждого провайдера — это риск и для Sakana, и для корпоративных клиентов. Для пользователей из ЕС/ЕЭЗ сервис пока недоступен.

Для российской аудитории: сервис работает по API с OpenAI-совместимым интерфейсом, однако доступность из РФ без VPN на старте остаётся под вопросом — Sakana AI не анонсировала специальной политики для российского рынка.

Я считаю, что подход Sakana AI — это ответ на реальную архитектурную проблему отрасли. Гонка за масштабом одной модели упирается в потолок, а умная координация специалистов даёт прирост производительности при меньших затратах. Если Fugu действительно работает так, как заявлено, это меняет логику выбора AI-инструментов для enterprise: вместо вопроса «какую модель выбрать?» встаёт вопрос «какого дирижёра нанять?»

Информация о запуске Fugu подтверждена несколькими независимыми публикациями в специализированных изданиях.

Fugu от Sakana AI: японский оркестратор бросает вызов Anthropic

Когда дирижёр важнее солиста

Как работает «дирижёр»

Два варианта для разных задач

Бенчмарки: впечатляет, но с оговорками

Главный аргумент: страховка от вендорного локина

Что это значит для рынка

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

iOS 27: ИИ-функции Apple, которые изменят жизнь без Siri

Альтман обвинил целое поколение учёных в торможении ИИ

Нобелевский лауреат Джон Джампер уходит из DeepMind в Anthropic