Полмиллиарда за месяц: как одна компания сожгла деньги на Claude

Когда ИИ-энтузиазм встречается с корпоративной безалаберностью
Представьте: вы открываете счёт за месяц и видите цифру с девятью нулями. Полмиллиарда долларов. За один месяц. На одну языковую модель. Именно это, по данным Axios, произошло с некой крупной компанией, которая подключила Claude от Anthropic сотрудникам и... просто забыла поставить лимиты. Звучит как корпоративный анекдот, но это абсолютно реальная история, которая должна стать учебным кейсом для любого CTO, думающего об ИИ-трансформации.
Я не буду делать вид, что это просто смешной инцидент. За этой историей скрывается системная проблема, с которой сейчас сталкиваются сотни компаний по всему миру: они внедряют ИИ с энтузиазмом стартапа, но без дисциплины и экспертизы, необходимой для управления этими системами.
Анатомия катастрофы
Как вообще возможно потратить $500 миллионов за 30 дней на облачный сервис? Ответ прост и одновременно пугающ: корпоративные планы для крупных клиентов часто выглядят как «безлимитные», но стоимость каждого запроса накапливается с безжалостной математической точностью.
Claude — одна из самых дорогих моделей на рынке в своём топовом исполнении. Claude Opus 4, например, стоит в разы дороже GPT-4o или Gemini 1.5 Pro при сравнимых задачах. Если тысячи сотрудников одновременно гоняют длинные контекстные окна с многотысячными токенами — счётчик крутится как таксометр в час пик на Садовом кольце.
Один CTO в той же статье Axios признался, что его сотрудники используют ИИ-ассистентов для проверки погоды. Это работает — но стоит в сотни раз дороже обычного поиска. Умножьте это на корпорацию в 50 000 человек, и вы поймёте механику катастрофы.
Microsoft тоже почувствовал боль
Этот случай — не единичный. Microsoft недавно урезал внутренние лицензии Claude Code для своих разработчиков. Официально — стратегические соображения (зачем платить Anthropic, когда у тебя есть Copilot?), но по факту — и расходы выходили из-под контроля. COO Uber публично заявил, что оправдать ИИ-расходы становится всё сложнее, пока ROI остаётся туманным.
Интересно, что все эти истории происходят именно сейчас, в 2026 году — когда первоначальная эйфория от внедрения ИИ сталкивается с суровой реальностью квартальных отчётов. Компании, которые в 2024-2025 годах радостно раздавали доступ к GPT-4 и Claude всем подряд, теперь смотрят на счета и задают неудобные вопросы финансовым директорам.
Три главных убийцы бюджета
Я выделю три конкретные причины, почему корпоративные ИИ-расходы выходят из-под контроля — и ни одна из них не связана с самими моделями.
Первое — отсутствие контекстной инженерии. Когда сотрудник не умеет правильно формулировать запросы, он компенсирует это объёмом: вставляет весь документ целиком, не обрезает историю диалога, накапливает контекст на десятки тысяч токенов. Каждый токен стоит денег. Правильно выстроенный промпт может сократить расходы в 5-10 раз без потери качества.
Второе — неправильный выбор модели. Зачем использовать Claude Opus 4 для написания приветственного письма клиенту? С этим справится Claude Haiku или GPT-4o mini за 1/20 цены. Sophia Velastegui, бывший руководитель ИИ-направления в Microsoft, точно подметила: компании бросают ИИ на задачи, которые никто не хочет делать, а не на те, что реально генерируют доход.
Третье — ИИ там, где не нужен ИИ. Классический SQL-запрос к базе данных не требует LLM. Простая форма валидации не требует GPT. Детерминированный алгоритм работает быстрее, дешевле и предсказуемее. Умение разграничивать задачи для ИИ и для традиционного ПО — это новая базовая компетенция для каждого технического специалиста.
Качество тоже страдает
Деньги — это только половина проблемы. Недавний случай с Microsoft Copilot в автоматическом режиме наглядно показал: когда вы не контролируете, какая именно модель решает задачу, вы получаете уверенные, красиво оформленные, но глубоко ошибочные ответы. В том конкретном случае анализ данных был выполнен с серьёзными систематическими ошибками — переключение на модель с «мышлением» (thinking model) мгновенно исправило ситуацию.
Это важно: «дёшево и плохо» в ИИ часто дороже, чем «правильно с первого раза». Когда аналитик час разбирается с галлюцинирующим ответом Copilot, это тоже стоит денег — просто они скрыты в потерянном рабочем времени.
Что нужно делать прямо сейчас
Для российских компаний, которые работают с ИИ-инструментами через VPN или через API-прокси — ситуация усложняется дополнительным слоем непрозрачности. Когда вы платите за токены через посредника, контроль над расходами ещё сложнее. Корпоративный доступ к Claude в России де-факто ограничен, большинство компаний работают через API с зарубежными картами или через партнёрские решения.
Независимо от географии, базовые меры одинаковы: установите жёсткие лимиты на уровне API-ключей, внедрите мониторинг расходов в реальном времени, обучите сотрудников основам контекстной инженерии и создайте внутреннюю матрицу «какая модель для какой задачи».
Новые роли — AI agent orchestrator, prompt engineer, AI cost manager — это не buzzwords из LinkedIn, а реальные позиции, которые окупаются. Компания, потратившая $500 млн за месяц, могла бы нанять целый департамент таких специалистов за ту же сумму и никогда больше не сталкиваться с подобными счетами.
Вывод, который никто не хочет слышать
ИИ-трансформация — это не про подключение ChatGPT к Slack и ожидание роста продуктивности. Это про построение новой инфраструктурной экспертизы внутри компании. История с $500 миллионами — это не история про дорогой Claude. Это история про то, что происходит, когда мощный инструмент попадает в руки без понимания того, как им пользоваться.
Анthropіс, OpenAI и Google продают вам лопаты. Копать яму или зарыть в неё деньги — это уже ваш выбор.
Источники
Похожие новости
LLMShare: хакеры прячут вирусы в чатах ChatGPT и Claude
Злоумышленники научились использовать функции публичного доступа к чатам ChatGPT и Claude для распространения вредоносного ПО — и обходят защиту, прячась за доверенными доменами.
Hermes Agent решил проблему раздутого контекста MCP: +74% точности
Nous Research добавила Tool Search в Hermes Agent — и Claude Opus 4 резко вырос в точности с 49% до 74%. BM25-поиск инструментов меняет правила игры для агентных систем.
Claude Opus 4.8 обходит GPT-5.5 и меняет правила агентной разработки
Anthropic выпустила Claude Opus 4.8 — модель, которая бьёт GPT-5.5 в большинстве тестов и в четыре раза реже пропускает баги, не сообщая о них.