A startup claims it broke through a bottleneck that’s holding back LLMs

{ "title": "Стартап заявил, что сломал главный барьер LLM за 9 лет", "excerpt": "Флоридский стартап Subquadratic утверждает, что решил математическую проблему квадратичного масштабирования — и теперь предъявляет независимые доказательства.", "content": "## «AI Theranos» или революция в архитектуре?\n\nКогда малоизвестный стартап из Майами выходит из стелс-режима с заявлением о том, что решил проблему, над которой бились все крупнейшие AI-лаборатории мира почти десятилетие — здоровый скептицизм не просто уместен, он обязателен. Именно так сообщество и отреагировало на анонс Subquadratic в мае 2026 года. Инженер по ИИ Дэн МакАтир сформулировал общее настроение точнее всех: «SubQ — это либо крупнейший прорыв со времён трансформера, либо AI Theranos».\n\nПрошёл месяц. Компания вернулась с независимыми результатами — и разговор стал куда серьёзнее.\n\n## Почему квадратичное масштабирование — это реальная проблема\n\nЧтобы понять масштаб претензий Subquadratic, нужно разобраться в том, как устроены современные языковые модели. Фундамент большинства LLM — архитектура трансформера, описанная Google ещё в 2017 году в знаменитой статье «Attention Is All You Need». Ключевой механизм — плотное внимание (dense attention): каждый токен текста сравнивается с каждым другим токеном.\n\nМатематика здесь жестокая: удвоили длину входного текста — вычислительная стоимость выросла вчетверо. Текст в 10 000 слов генерирует почти 50 миллионов отдельных операций умножения. Именно поэтому LLM — прожорливые энергетические монстры, а обработка длинных контекстов стоит так дорого.\n\nПромышленность выработала целый зоопарк костылей: RAG-системы, разбивка текста на чанки, многоагентная оркестрация, векторные базы данных — всё это инфраструктурные заплатки поверх фундаментального ограничения. Как точно заметил сооснователь Subquadratic и CTO Александр Уэдон: вся эта ручная сборка промптов, цепочки вызовов и условная логика — «трата человеческого интеллекта и ограничение качества продукта».\n\n## Что именно заявляет Subquadratic\n\nКомпания утверждает, что разработала принципиально иную архитектуру — полностью субквадратичную, где вычислительная стоимость растёт линейно с длиной контекста, а не квадратично. Их модель SubQ 1M-Preview якобы:\n\n- Обрабатывает до 12 миллионов токенов за раз — против 128K у большинства моделей и 1M у лучших облачных решений вроде Claude Sonnet и Gemini Pro\n- При контексте в 12 миллионов токенов снижает вычислительные затраты на ~1000 раз по сравнению с трансформерными моделями аналогичного масштаба\n- По качеству на ключевых задачах (код, анализ документов) примерно соответствует лучшим моделям Google DeepMind, OpenAI и Anthropic\n- Потребляет значительно меньше энергии и стоит дешевле в эксплуатации\n\nПомимо базовой модели, компания запустила в закрытое бета-тестирование три продукта: API с полным контекстным окном, агент для написания кода SubQ Code и поисковый инструмент SubQ Search.\n\n## Деньги уже пришли — теперь нужны доказательства\n\nSubquadratic привлекла $29 миллионов в посевном раунде. Среди инвесторов — сооснователь Tinder Джастин Матин, бывший партнёр SoftBank Vision Fund Хавьер Вильямисар и ранние вкладчики Anthropic, OpenAI, Stripe и Brex. Оценка компании, по данным The New Stack, составила $500 миллионов.\n\nПолмиллиарда долларов оценки при отсутствии широко доступного продукта — цифра, которая сама по себе требует объяснений. Инвесторы явно видели что-то, чего не видело сообщество.\n\nИ вот теперь компания предъявляет это «что-то» публично. Независимое тестирование провела компания Appen, специализирующаяся на оценке AI-моделей. Директор по исследованиям генеративного ИИ Appen Жанин Синанан-Сингх не скрывает энтузиазма: «Это было действительно захватывающе — результаты подтвердили их архитектуру. Я подумала: "Вау, это может изменить всё", потому что модели постоянно борются со скоростью и неэффективностью».\n\nСооснователь и CEO Джастин Дэнгель настроен ещё радикальнее: «Мы надеемся запустить новую эпоху эффективности. Я не думаю, что через несколько лет кто-то будет строить на трансформерах».\n\n## Что это значит на практике\n\nДаже если отбросить самые смелые заявления и принять более консервативную интерпретацию — потенциал огромный. Представьте задачи, которые сегодня просто нереализуемы или стоят заоблачных денег: одновременный анализ сотен юридических документов, полная кодовая база крупного проекта в одном контексте, медицинские исследования по всей базе научных статей без потери контекста.\n\nДля разработчиков это означало бы конец бесконечных танцев с RAG и чанкингом. Для бизнеса — радикальное снижение стоимости операций с длинным контекстом. Для обычных пользователей — модели, которые действительно «помнят» весь разговор и весь загруженный документ.\n\nПри этом Subquadratic честно признаёт: SubQ не заменит топовые модели во всех задачах. Речь идёт о колоссальном выигрыше в скорости и стоимости для конкретных сценариев с длинным контекстом — не о превосходстве по всем фронтам.\n\n## Скептицизм остаётся уместным\n\nЯ слежу за этим пространством достаточно долго, чтобы помнить несколько «революционных архитектур», которые тихо растворились после первоначального ажиотажа. Subquadratic пока не открыла широкий доступ к модели — это главное, чего не хватает для окончательного вердикта сообщества.\n\nСам CTO компании признал, что выпустить независимые бенчмарки одновременно с анонсом было бы правильным решением — и это запоздалое признание говорит об определённой незрелости коммуникационной стратегии. Большая наука требует открытых весов, воспроизводимых экспериментов и peer review — ничего из этого пока нет.\n\nТем не менее, одобрение Appen — это не внутренние тесты стартапа. Это первый серьёзный сигнал, что за заявлениями стоит реальная инженерия.\n\nИнформация о компании и её технологии подтверждена несколькими независимыми публикациями, что добавляет достоверности описанным фактам.", "usedSources": [ "https://www.technologyreview.com/2026/06/19/1139313/a-startup-claims-it-broke-through-a-bottleneck-thats-holding-back-llms/", "https://venturebeat.com/technology/miami-startup-subquadratic-claims-1-000x-ai-efficiency-gain-with-subq-model-researchers-demand-independent-proof" ], "primaryCompany": "Subquadratic", "primaryCategory": "chat", "tags": ["Subquadratic", "SubQ", "LLM", "архитектура трансформер", "контекстное окно"], "coverObjects": ["математическая формула квадратичного роста", "линейный график vs квадратичный", "огромная стопка документов", "микросхема процессора", "разбитая цепь"], "coverCamera": "low angle wide shot", "coverMood": "cool blue melancholy", "coverScene": "A miniature research lab diorama lit in cool blue neon light. In the center foreground: two towering graphs side by side — one curving steeply upward (quadratic, glowing red) and one rising gently in a straight line (linear, glowing blue). To the left: a massive teetering stack of tiny paper documents threatening to topple. To the right: a small cracked chain link lying broken on the lab floor, symbolizing a broken bottleneck. A detailed miniature processor chip sits mounted on a pedestal in the background. The Gen-hub mascot stands small in the corner holding a magnifying glass, peering suspiciously at the two graphs, one eyebrow raised — the skeptical observer.", "coverMascotRole": "small observer in corner" }

A startup claims it broke through a bottleneck that’s holding back LLMs

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Нобелевский лауреат Джон Джампер уходит из DeepMind в Anthropic

Запрет Anthropic от Трампа: случайный подарок для репутации компании?

ИИ провалил экзамен по реальной работе: 3% успеха на практике