Anthropic: Claude пишет 90% кода компании и требует глобальную кнопку паузы

Когда твой главный разработчик — это ты сам
Представьте: вы приходите на работу, открываете IDE, и понимаете, что последний раз писали код пять месяцев назад. Именно так описывает свою жизнь один из инженеров Anthropic в новом внутреннем отчёте компании. Это не жалоба — это констатация факта. Claude строит Claude. И Anthropic впервые решила показать миру, насколько далеко зашёл этот процесс.
Отчёт, опубликованный через Anthropic Institute, содержит данные, которые раньше не выходили за пределы внутренних переговорных. И цифры там такие, что даже у видавших виды наблюдателей за ИИ-гонкой перехватывает дыхание.
Цифры, которые меняют смысл слова «разработчик»
Итак, факты. Более 80% production-кода в Anthropic сегодня пишет Claude. Если считать скрипты и экспериментальный код — цифра перевалила за 90%. До февраля 2025 года, когда появился Claude Code, этот показатель измерялся единицами процентов. За полтора года — радикальная трансформация.
Инженеры в Q2 2026 года отгружают в 8 раз больше кода в день, чем в 2024-м. Звучит невероятно, и Anthropic сама оговаривается: строки кода — метрика несовершенная. Внутренний опрос 130 сотрудников в марте 2026-го дал медианную оценку реального прироста производительности в 4x. Компания считает, что и это завышено — исследования METR показывают, что разработчики склонны переоценивать вклад ИИ-инструментов.
Но даже 2-3x реального прироста — это переворот в экономике разработки. Для сравнения: GitHub Copilot в лучших своих демо давал 30-40% ускорения на конкретных задачах. Здесь мы говорим о другом порядке величин.
Качество кода: от «чуть хуже» до «лучше людей»
Самый интересный раздел отчёта — честный разговор о качестве. В конце 2025 года код Claude был «несколько хуже» человеческого. Сегодня — примерный паритет. К концу 2026-го Anthropic прогнозирует превосходство над человеческим кодом.
Это не просто слова. Ретроспективный анализ показал: автоматический ревьюер на базе Claude поймал бы треть багов, которые в своё время добрались до продакшна claude.ai. А в апреле 2026-го Claude выдал более 800 исправлений, которые сократили целый класс API-ошибок в 1000 раз. По оценке ответственного инженера, человеку на ту же работу потребовалось бы четыре года.
Это уже не «ИИ-помощник». Это полноценный участник инженерного процесса — с растущей автономией и измеримым влиянием на надёжность продукта.
Горизонт задач: от 4 минут до 12 часов
Одна из самых показательных метрик в отчёте — длительность задач, которые ИИ способен выполнять автономно. В марте 2024-го Claude Opus 3 уверенно справлялся с задачами в диапазоне 4 минут. Год спустя Claude Sonnet 3.7 вышел на полтора часа. Сегодня Claude Opus 4.6 берётся за задачи продолжительностью 12 часов. По данным METR, Mythos Preview держится минимум 16 часов.
Этот показатель удваивается примерно каждые четыре месяца — раньше цикл составлял семь месяцев. Экстраполируйте сами. Через год мы можем говорить о многодневных автономных задачах. Через два — о неделях.
Для понимания контекста: OpenAI с o3 и Deep Research движется в том же направлении, Google с Gemini Ultra тоже. Но Anthropic первой публикует внутренние данные о том, как это выглядит изнутри компании-разработчика.
Кнопка паузы: не паранойя, а инженерная необходимость
И вот здесь начинается самое неожиданное. Компания, которая только что похвасталась, что её ИИ пишет 90% её собственного кода, одновременно бьёт тревогу. Anthropic прямо говорит: рекурсивное самоулучшение — ситуация, когда ИИ полностью автономно проектирует своего преемника — пока не достигнуто, но может наступить раньше, чем большинство институтов успеет подготовиться.
Компания призывает к созданию верифицируемой глобальной кнопки паузы в разработке ИИ. Причём подчёркивает: односторонняя остановка со стороны одной лаборатории бессмысленна. Если Anthropic остановится, а OpenAI, Google и китайские компании продолжат — ничего не изменится. Нужен скоординированный механизм с возможностью проверки.
Это звучит как классический Anthropic: «мы делаем потенциально опасную вещь ответственнее всех остальных». Можно к этому относиться скептически — и я понимаю тех, кто видит в этом PR-ход. Но внутренние данные, которые они опубликовали, придают этому призыву неожиданную серьёзность. Когда ты сам видишь, как быстро растёт автономия твоего же продукта — это меняет тональность разговора.
Что это значит для индустрии и для нас
Для разработчиков сигнал однозначный: инструменты уровня Claude Code — это уже не эксперимент для энтузиастов. Это производственная реальность в одной из ведущих ИИ-лабораторий мира. Если вы ещё не перестроили свой рабочий процесс под агентное кодирование — вы теряете конкурентоспособность.
Для бизнеса: стоимость разработки ПО радикально меняется. Не «станет дешевле», а уже дешевле — и процесс ускоряется. Компании, которые внедрят эти инструменты в 2026-м, получат структурное преимущество перед теми, кто ждёт «стабилизации технологии».
Для российской аудитории: Claude Code доступен через API Anthropic, но с ограничениями по регионам. Прямая оплата российскими картами по-прежнему проблематична — нужны либо зарубежные карты, либо сторонние посредники. Ряд российских компаний работает через партнёрские каналы AWS и GCP, где Anthropic-модели доступны через Bedrock и Vertex AI.
Главный вывод из этого отчёта — не в цифрах производительности. Он в том, что мы впервые видим изнутри, как выглядит компания, уже живущая в мире агентного ИИ. И она одновременно в восторге и напугана. Это, пожалуй, самая честная позиция из всех возможных.
Источники
Похожие новости
Microsoft Build 2026: 7 главных анонсов, которые меняют всё
Сатья Наделла открыл Build 2026 шквалом ИИ-новостей: собственные модели рассуждений, вечно активный агент Scout и мини-компьютер для разработчиков на Nvidia RTX Spark.
OpenAI Codex идёт в офис: 6 новых агентов для белых воротничков
OpenAI расширяет Codex до полноценного рабочего инструмента для офисных профессий — аналитиков, дизайнеров, инвестбанкиров. Уже 5 млн еженедельных пользователей, и это только начало.
JetBrains выпустила Mellum2: 12B MoE-модель для разработчиков в open source
JetBrains открыла исходный код Mellum2 — модели с архитектурой Mixture-of-Experts на 12 млрд параметров, которая вдвое быстрее аналогов при инференсе.