Anthropic выпустила Claude Opus 4.8: тысяча агентов в параллели и дешёвый быстрый режим

Тихий, но увесистый апдейт
Anthropic не устраивала шоу с фанфарами — Opus 4.8 вышел 28 мая 2026 года как «скромное, но ощутимое» улучшение. Именно так компания сама его характеризует. И всё же за этой скромностью скрывается целый пакет изменений, которые переворачивают логику работы с агентными системами. Цена осталась прежней — $5 за миллион входных токенов и $25 за выходные — а возможностей заметно прибавилось.
Я слежу за линейкой Claude уже несколько поколений, и Opus 4.8 ощущается как релиз, где инженеры наконец прибрались в доме: починили то, что раздражало в 4.7, добавили архитектурно важные вещи и не забыли снизить порог входа для разработчиков.
Динамические воркфлоу: 1000 агентов — это серьёзно
Главная техническая новинка — динамические воркфлоу в Claude Code (пока research preview). Это не просто «запустить несколько агентов». Это архитектурно другой подход.
Воркфлоу — это JavaScript-скрипт, который Claude сам генерирует под вашу задачу. Дальше рантайм исполняет его в фоне, пока ваша сессия остаётся отзывчивой. Ключевое: план задачи живёт в переменных скрипта, а не в контекстном окне модели. Claude видит только финальный результат. Это принципиально отличает воркфлоу от обычных субагентов.
Жёсткие лимиты: до 16 параллельных агентов одновременно, максимум 1000 агентов на один запуск. Скрипт воркфлоу не имеет прямого доступа к файловой системе — только сами агенты читают, пишут и исполняют команды. Если сессия прервалась — работа возобновляется с того же места, завершённые агенты отдают кэшированные результаты.
Anthropic привела конкретный пример: Jarred Sumner использовал динамические воркфлоу для портирования Bun с Zig на Rust. Результат — ~750 000 строк Rust-кода, 99.8% тестов прошли, от первого коммита до мержа — 11 дней. Сотни агентов работали параллельно, по два ревьюера на каждый файл. Это уже не игрушка.
Требования: Claude Code версии v2.1.154 и выше, доступно на планах Max, Team и Enterprise. Запускается либо словом «workflow» в промпте, либо через режим `ultracode` — он автоматически комбинирует максимальное усилие (`xhigh`) с оркестрацией воркфлоу. Встроенный `/deep-research` тоже реализован как воркфлоу.
Быстрый режим стал втрое дешевле
Fast mode — не отдельная модель, а конфигурация Opus с 2.5-кратным ускорением генерации токенов при сохранении полных возможностей. Переключается командой `/fast` в Claude Code. Для Opus 4.8 его цена снизилась в три раза по сравнению с предыдущими версиями: теперь $10 за миллион входных и $50 за выходные токены.
Для контекста: у Opus 4.7 и 4.6 в быстром режиме было $30/$150. Разница существенная, особенно для интерактивной отладки и быстрых итераций. Standard mode по-прежнему актуален для длинных автономных задач, где скорость не критична.
Что изменилось в самой модели
Opus 4.8 позиционируется как более «честная» модель — и это не маркетинговый эвфемизм. По данным Anthropic, модель в четыре раза реже оставляет ошибки в коде без комментария, активнее флагирует неопределённость и реже делает необоснованные заявления о собственной работе.
На бенчмарке Online-Mind2Web (работа с браузером) Opus 4.8 набрал 84% — это заметный прыжок над Opus 4.7 и, по данным Anthropic, выше GPT-5.5. На внутреннем Super-Agent benchmark он единственный завершил все кейсы от начала до конца. На Legal Agent Benchmark — первый результат выше 10% по стандарту all-pass. На CursorBench превзошёл предыдущие Opus-модели на всех уровнях усилий.
Один из ранних тестеров прямо написал, что Opus 4.8 «исправил проблему с многословными комментариями и вызовами инструментов, которая была в 4.7» — это та самая мелочь, которая в реальной работе раздражает больше всего.
Алайнмент-оценка показала: уровень мисалайнированного поведения (обман, кооперация с вредоносными запросами) у 4.8 сопоставим с Claude Mythos Preview — самой жёстко ограниченной моделью Anthropic.
Контроль усилий и обновление API
Пользователи claude.ai теперь могут управлять тем, сколько усилий Claude вкладывает в ответ. Более высокие настройки — глубже думает, ниже — быстрее отвечает и медленнее сжигает лимиты. Это то, что Google и OpenAI предлагают в схожем виде, но реализация у каждого своя.
Messages API обновлён: теперь можно вставлять системные инструкции прямо внутри массива сообщений. Это позволяет менять инструкции Claude в середине задачи без сброса кэша промптов — критически важно для агентных систем, где нужно обновлять разрешения или контекст окружения на лету.
Доступность и что важно для разработчиков в России
Модель доступна через Claude API (ID: `claude-opus-4-8`), Amazon Bedrock, Google Cloud (Vertex AI) и Microsoft Foundry. Из России прямой доступ к claude.ai по-прежнему требует VPN, российские карты не принимаются. Через AWS или GCP — рабочий вариант для команд с корпоративными аккаунтами на этих платформах.
Mythos не за горами
Anthropic параллельно намекает на скорый широкий релиз моделей класса Mythos — в «ближайшие недели». Сейчас Mythos Preview доступен в жёстко ограниченном режиме из-за продвинутых возможностей в области кибербезопасности. Когда он выйдет широко — Opus 4.8 окажется не вершиной, а хорошим рабочим инструментом для большинства задач.
Моя оценка: Anthropic сделала ставку на инженерную надёжность, а не на рекордные цифры в таблицах. Динамические воркфлоу на 1000 агентов — это инфраструктурный сдвиг, который через полгода станет нормой для крупных миграций кода. Fast mode по новой цене делает Opus экономически оправданным даже для итеративных задач. Для тех, кто строит агентные продукты — это обновление стоит тестировать прямо сейчас.
*Информация подтверждена несколькими независимыми публикациями и официальными материалами Anthropic.*
Похожие новости
GitHub Copilot переходит на токены: разработчики в шоке от новых счетов
С 1 июня Microsoft переводит GitHub Copilot на поштучную оплату токенов. Некоторые пользователи сообщают о росте расходов с $50 до $3000 в месяц.
Genspark AI Slides 5.0: презентации из текста в один клик
Genspark обновил генератор презентаций до версии 5.0 и показал, как перенести слайды в Figma для редактуры. Разбираем возможности и подводные камни.
BadHost: дыра в Starlette угрожает миллионам ИИ-агентов
Критическая уязвимость в пакете с 325 млн загрузок в неделю открывает хакерам доступ к MCP-серверам, базам данных и учётным данным пользователей.