Coinbase режет расходы на ИИ вдвое, переходя на китайские модели

Как крупнейшая крипто-биржа США перехитрила OpenAI и Anthropic

Есть что-то символичное в том, что компания, построившая бизнес на децентрализации, теперь децентрализует и свой ИИ-стек — уходя от монополии западных лабораторий к китайским open-weight моделям. Coinbase под руководством Брайана Армстронга сделала именно это, и результат оказался впечатляющим: расходы на ИИ упали вдвое, а потребление токенов при этом продолжает расти.

Армстронг публично объявил, что компания перешла на модели GLM 5.2 от китайской Zhipu и Kimi 2.7 от Moonshot AI. Это не эксперимент в лаборатории — это промышленное внедрение в масштабах одной из крупнейших криптобирж мира, где ИИ уже генерирует около 40% всего кода.

Цифры, которые заставят нервничать инвесторов OpenAI

Посмотрим на экономику вопроса. GLM 5.2 стоит $1.40 за миллион входных токенов и $4.40 за миллион выходных. Для сравнения: Anthropic Opus 4.8 обходится в $5 и $25 соответственно — разница в три-шесть раз. При этом по бенчмарку SWE-bench Pro (ключевой тест на качество генерации кода) GLM 5.2 набирает 62.1 балла против 58.6 у GPT-5.5. То есть дешевле и лучше в реальных задачах — аргумент, который трудно опровергнуть.

Армстронг добавляет прогноз, который звучит как приговор для бизнес-моделей западных ИИ-лабораторий: стоимость ИИ-моделей для большинства рабочих нагрузок упадёт на 99% в ближайшие 12-18 месяцев по мере того, как зрелые open-source решения вытесняют премиум-предложения. Премиальные модели, по его словам, останутся уделом фронтирных исследований — но не повседневной разработки.

Умная инфраструктура: роутинг + кэширование

Переход на китайские модели — лишь часть истории. Coinbase выстроила автоматическую систему роутинга, которая для каждого запроса выбирает оптимальную модель исходя из трёх параметров: тип задачи, стоимость и потенциал кэширования.

Особого внимания заслуживает работа с кэшем. Оптимизация кэширования подняла показатель попаданий с 5% до 60% — это означает, что шесть из десяти запросов теперь обслуживаются из сохранённых результатов без дополнительных вычислений. Разработчикам дали простые инструкции: держать контекст компактным и начинать новую сессию для каждой отдельной задачи. В индустрии это называют «контекстной инженерией» — дисциплиной, которая в 2026 году стала такой же важной, как умение писать промпты.

При этом 91% разработчиков никогда не достигали старых лимитов использования — что само по себе говорит о том, насколько раздутыми были предыдущие квоты. Лимиты убрали совсем, заменив их принципом подотчётности: «Чем больше ты тратишь на ИИ, тем большего результата мы ожидаем», — формулирует Армстронг. Элегантно: вместо бюрократических ограничений — культурная норма.

Coinbase не одинока в этом тренде

Стратегия Coinbase вписывается в более широкий отраслевой сдвиг. CEO стартапа Lindy недавно перевёл компанию на DeepSeek v4. Snowflake тестирует китайские модели как замену OpenAI и Anthropic. Uber израсходовал весь ИИ-бюджет на 2026 год уже к апрелю и теперь ограничивает инженеров суммой $1500 в месяц на инструменты. Meta разослала внутреннее предупреждение об «экспоненциальном росте» ИИ-расходов.

По данным KPMG, только 26% компаний имеют полную прозрачность по ИИ-затратам, а 22% узнают о перерасходе уже после получения счёта. Goldman Sachs прогнозирует рост потребления токенов в 24 раза к 2030 году — до 120 квадриллионов в месяц. На этом фоне оптимизация ИИ-расходов превращается из нишевой задачи в стратегический императив.

Риски, которые нельзя игнорировать

Здесь я должен быть честен: у этой истории есть тёмная сторона. Облачный API Z.ai, через который доступен GLM 5.2, подпадает под действие Закона КНР о национальной разведке. Американские законодатели в мае открыли официальное расследование киберрисков, связанных с китайскими ИИ-системами. Для компании, работающей с финансовыми данными миллионов пользователей, это не абстрактная угроза.

Однако GLM 5.2 распространяется под лицензией MIT — это означает, что компании могут скачать модель, модифицировать её и запускать на собственных серверах, полностью исключая передачу данных во внешнее API. Именно этот путь, судя по всему, и выбрал Coinbase — что принципиально меняет профиль риска по сравнению с прямым использованием китайских облачных сервисов.

Стресс-тест для западных ИИ-лабораторий

Для OpenAI и Anthropic происходящее — настоящий экзистенциальный вызов, особенно на фоне их амбиций по IPO. Обе компании подняли миллиарды долларов под обещание роста выручки, который теперь оказывается под угрозой. Примечательно, что OpenAI уже реагирует: GPT-5.6-Sol позиционируется как более токен-эффективная альтернатива Claude Fable и Mythos при той же цене, что и GPT-5.5, а две более слабые версии 5.6 выходят по значительно сниженным ценам.

Ценовая война между западными лабораториями, которую провоцирует китайская конкуренция, в конечном счёте выгодна корпоративным пользователям. Но она же означает, что венчурные оценки в сотни миллиардов долларов придётся обосновывать не ценой за токен, а чем-то другим — качеством экосистемы, безопасностью, уникальными возможностями frontier-моделей.

Кейс Coinbase показывает: для большинства производственных задач разрыв в качестве между топовыми западными и лучшими китайскими моделями уже не оправдывает разрыв в цене. Это меняет всё.

*Информация подтверждена несколькими независимыми публикациями.*

Coinbase режет расходы на ИИ вдвое, переходя на китайские модели

Как крупнейшая крипто-биржа США перехитрила OpenAI и Anthropic

Цифры, которые заставят нервничать инвесторов OpenAI

Умная инфраструктура: роутинг + кэширование

Coinbase не одинока в этом тренде

Риски, которые нельзя игнорировать

Стресс-тест для западных ИИ-лабораторий

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

CEO-Bench: только 3 ИИ-модели не обанкротились за 500 дней

VibeThinker-3B: крошечная модель бьёт гигантов в математике

iLLaDA от ByteDance: диффузионная LLM, которая не хуже Qwen2.5