Fugu от Sakana AI: японский оркестратор бросает вызов Anthropic

Когда дирижёр важнее солиста
Что если следующий прорыв в ИИ — это не очередная гигантская модель, обученная на петабайтах данных, а умный менеджер, который знает, кому из специалистов поручить задачу? Именно на этот вопрос отвечает Fugu — новый продукт токийского стартапа Sakana AI, официально вышедший 22 июня 2026 года.
Fugu — это не просто очередной агентный фреймворк. Это коммерческий мультиагентный оркестратор, который снаружи выглядит как обычная языковая модель с одним OpenAI-совместимым API, а внутри динамически координирует пул специализированных LLM. Пользователь отправляет запрос — и не подозревает, что за кулисами уже идёт распределение ролей между несколькими моделями.
Как работает «дирижёр»
В основе Fugu лежит архитектура, которую Sakana AI называет RL Conductor — небольшая языковая модель (~7B параметров), обученная через обучение с подкреплением управлять пулом рабочих LLM. Conductor не следует жёстко прописанному пайплайну: он анализирует входящий запрос и на лету генерирует кастомный рабочий процесс на естественном языке.
Для каждого шага модель формирует инструкцию для конкретного агента, назначает исполнителя и определяет, какой контекст из предыдущих шагов ему доступен. В зависимости от задачи Conductor может выстроить последовательную цепочку, параллельное дерево или рекурсивный цикл — включая вызов самого себя для верификации ответа.
Академическая база у проекта серьёзная: два доклада, принятых на ICLR 2026. Первый — TRINITY — описывает эволюционную координацию с ролями Thinker, Worker и Verifier. Второй — Conductor — исследует обучение стратегиям коммуникации между агентами через RL. То есть система не просто маршрутизирует запросы по правилам, написанным инженером, — она сама обнаруживает оптимальные стратегии взаимодействия.
Два варианта для разных задач
Sakana AI запускает два продукта. Fugu (базовый) оптимизирован под низкую задержку и повседневные задачи: помощь в кодинге, code review, чат-боты. Команды с требованиями к приватности могут исключать отдельных агентов из пула.
Fugu Ultra — версия для максимального качества на сложных многошаговых задачах. Ранние пользователи уже применяют его для воспроизведения научных статей, анализа патентов, кибербезопасности и AI-исследований. Один из показательных кейсов: инженер-программист получил от Fugu Ultra более 20 замечаний при code review там, где другие инструменты находили лишь 3.
Оба варианта доступны через единый API, поддерживаются подписочная модель и pay-as-you-go.
Бенчмарки: впечатляет, но с оговорками
Sakana AI публикует сравнительную таблицу, где Fugu Ultra соперничает с топовыми моделями рынка. Ключевые цифры для Fugu Ultra:
- SWE-Bench Pro: 73.7 (против 69.2 у Opus 4.8 и 58.6 у GPT-5.5) - LiveCodeBench: 93.2 (против 87.8 у Opus 4.8) - GPQA-D: 95.5 (лучший результат в таблице) - Humanity's Last Exam: 50.0 (чуть выше 49.8 у Opus 4.8) - TerminalBench 2.1: 82.1 (против 74.6 у Opus 4.8)
Цифры действительно впечатляют. Но здесь важна честность: ни Fable 5, ни Mythos Preview не входят в агентный пул Fugu — эти модели Anthropic просто недоступны публично. Sakana AI признаёт, что с их включением результаты были бы ещё выше. Кроме того, сравнительные данные по конкурентам взяты из публикаций самих провайдеров — независимого аудита пока нет.
При этом Fable 5 всё же обходит Fugu Ultra на нескольких бенчмарках, так что картина «победы по всем фронтам» несколько преувеличена. Но факт остаётся: оркестрация достигла уровня, где она реально конкурирует с монолитными системами на бенчмарках, за которыми следит индустрия.
Главный аргумент: страховка от вендорного локина
Sakana AI делает ставку не только на производительность, но и на геополитический аргумент. Компания прямо указывает на введённые экспортные ограничения для моделей Anthropic как на живой пример того, как доступ к критической AI-инфраструктуре может исчезнуть за одну ночь из-за регуляторных или внешнеполитических решений.
«Для организации или государства зависеть от API одной компании в критической инфраструктуре, финансах или госуправлении — это материальная уязвимость. Этот риск больше не гипотетический», — формулирует Sakana AI свою позицию.
Пул агентов спроектирован как взаимозаменяемый: если один провайдер ограничивает доступ, Fugu автоматически переключается на альтернативные модели. Обновление пула после выхода нового фронтирного релиза занимает около двух недель.
Что это значит для рынка
Fugu — не первая попытка оркестрации LLM, но, пожалуй, самая зрелая коммерческая реализация с академической подложкой. Ручные пайплайны типа LangChain ломаются при смещении распределения запросов — и это хорошо известная боль команд в продакшне. Sakana AI решает именно эту проблему, обучая систему находить оптимальные стратегии самостоятельно.
Однако есть и нерешённые вопросы. Оркестрация нескольких сторонних моделей и их перепродажа как сервиса порождает вопросы соответствия условиям использования каждого провайдера — это риск и для Sakana, и для корпоративных клиентов. Для пользователей из ЕС/ЕЭЗ сервис пока недоступен.
Для российской аудитории: сервис работает по API с OpenAI-совместимым интерфейсом, однако доступность из РФ без VPN на старте остаётся под вопросом — Sakana AI не анонсировала специальной политики для российского рынка.
Я считаю, что подход Sakana AI — это ответ на реальную архитектурную проблему отрасли. Гонка за масштабом одной модели упирается в потолок, а умная координация специалистов даёт прирост производительности при меньших затратах. Если Fugu действительно работает так, как заявлено, это меняет логику выбора AI-инструментов для enterprise: вместо вопроса «какую модель выбрать?» встаёт вопрос «какого дирижёра нанять?»
Информация о запуске Fugu подтверждена несколькими независимыми публикациями в специализированных изданиях.
Похожие новости
iOS 27: ИИ-функции Apple, которые изменят жизнь без Siri
Apple тихо встраивает ИИ в каждый уголок iPhone — и это важнее громкой перезагрузки Siri. Разбираем, что реально изменится в iOS 27 уже этой осенью.
Альтман обвинил целое поколение учёных в торможении ИИ
На лекции в Стэнфорде CEO OpenAI заявил, что скептики масштабирования ЛЯМ на годы замедлили развитие ИИ — и привёл математическое доказательство как аргумент.
Нобелевский лауреат Джон Джампер уходит из DeepMind в Anthropic
Создатель AlphaFold и нобелевский лауреат Джон Джампер покидает Google DeepMind после почти девяти лет работы — и переходит к конкурентам из Anthropic.