GBrain: открытый слой памяти для ИИ-агентов от главы Y Combinator

Амнезия как главная проблема современных ИИ-агентов

Каждый, кто хоть раз пытался выстроить рабочий процесс на основе ИИ-агентов, сталкивался с одной и той же стеной: агент блестяще справляется с задачей сегодня, а завтра — снова чистый лист. Никаких воспоминаний о прошлой встрече, никакого контекста о принятых решениях, ни слова о том, что вы обсуждали неделю назад. Это не баг конкретной модели — это архитектурная проблема всей индустрии.

Гарри Тан, президент и CEO Y Combinator — человек, который видит тысячи стартапов в год и явно устал от этого ограничения — решил проблему для себя лично, а потом открыл решение всем. Так появился GBrain.

Что такое GBrain и почему это не просто очередная RAG-обёртка

GBrain — это слой долгосрочной памяти для ИИ-агентов, построенный на Postgres с расширением pgvector. Но называть его просто «RAG-системой» — значит сильно недооценивать архитектуру. Главное отличие: GBrain самостоятельно строит типизированный граф знаний из ваших заметок, писем, твитов и встреч — и делает это без единого вызова к языковой модели на этапе извлечения графа.

Подумайте, что это означает на практике: ноль дополнительных токенов, ноль задержек на вызовы API, ноль лишних затрат при индексации. Граф строится через регулярные выражения и структурированный парсинг markdown-файлов. Типы связей — `works_at`, `founded`, `invested_in`, `attended`, `advises`, `mentions` — извлекаются детерминированно.

Производственный мозг самого Тана сейчас содержит 146 646 страниц, 24 585 людей, 5 339 компаний и 66 автономных cron-задач. Это не демо-стенд — это реальная система, которая работает в его агентах OpenClaw и Hermes прямо сейчас.

Числа, которые говорят сами за себя

GBrain имеет собственный бенчмарк — BrainBench, корпус из 240 страниц насыщенной прозы. Результаты впечатляют: P@5 = 49,1% и R@5 = 97,9%. При отключении графового слоя и использовании только базового поиска P@5 падает на 31,4 процентных пункта. Граф знаний — не украшение, а ключевой компонент точности.

Для поиска используется гибридный подход: векторный поиск + BM25 keyword + Reciprocal Rank Fusion (RRF), а поверх — реранкер от ZeroEntropy. Это примерно то, что крупные RAG-системы собирают из пяти разных библиотек — здесь всё идёт из коробки.

Как это работает технически

GBrain написан на TypeScript и работает на рантайме Bun. Локальная база — PGLite: полноценный Postgres 17, скомпилированный в WASM. Никакого Docker, никакого сервера — база поднимается за две секунды в директории `~/.gbrain/`. Это принципиальное решение: система должна запускаться на ноутбуке разработчика без инфраструктурного оверхеда.

Для эмбеддингов поддерживаются три провайдера: ZeroEntropy (по умолчанию), OpenAI и Voyage. Без ключа API можно запустить только keyword-поиск — векторная часть отвалится. Опционально можно подключить Anthropic API для multi-query expansion при поиске.

Особого внимания заслуживает MCP-сервер: он экспортирует 74 инструмента, через которые Claude Code, Cursor и Windsurf могут читать и писать в мозг напрямую. Это делает GBrain не просто хранилищем, а живым участником рабочего процесса агента.

Почему это важно прямо сейчас

Мы находимся в переломной точке: агентные системы переходят от игрушек к реальным рабочим инструментам. Но без персистентной памяти любой агент — это дорогой ассистент с амнезией. Существующие решения — Mem0, Zep, LangChain Memory — либо требуют облачной инфраструктуры, либо делают слишком много вызовов к LLM при индексации, либо не дают контроля над данными.

GBrain предлагает другую философию: markdown как первичный источник истины, граф строится локально, данные остаются у вас. Это особенно актуально для тех, кто работает с чувствительной информацией — корпоративными переговорами, инвестиционными решениями, персональными данными.

Российский контекст

Проект распространяется под лицензией MIT и доступен на GitHub без каких-либо региональных ограничений. Bun устанавливается через стандартный curl-скрипт, репозиторий клонируется без VPN. Единственное ограничение — для полноценного гибридного поиска нужен API-ключ от ZeroEntropy, OpenAI или Voyage. OpenAI в РФ без VPN недоступен, Voyage — тоже. ZeroEntropy — менее известный провайдер, ситуация с доступом требует проверки. Как запасной вариант: можно использовать локальные эмбеддинги через Ollama, хотя это потребует небольшой доработки конфигурации.

Мой взгляд: это может изменить стандарт

То, что GBrain выпустил именно Гарри Тан — не случайность. Y Combinator видит сотни стартапов, строящих агентные системы, и президент организации лично почувствовал боль отсутствия памяти. Когда человек с таким доступом к ресурсам и экспертизе решает проблему для себя, а потом открывает решение — это сигнал.

Мне особенно нравится решение не использовать LLM для построения графа. Большинство конкурентов гоняют GPT-4 для извлечения сущностей — это дорого, медленно и недетерминированно. GBrain показывает, что для структурированных markdown-заметок хватает умного парсера. Это честная инженерная мысль, а не хайп.

Единственный вопрос, который остаётся открытым: как система справится с неструктурированными источниками — транскриптами звонков, PDF-отчётами, веб-страницами? Markdown-first подход блестящ для дисциплинированных пользователей, но большинство людей не пишут заметки в markdown. Если команда решит эту задачу, не сломав архитектуру — GBrain станет стандартом памяти для агентных систем.

GBrain: открытый слой памяти для ИИ-агентов от главы Y Combinator

Амнезия как главная проблема современных ИИ-агентов

Что такое GBrain и почему это не просто очередная RAG-обёртка

Числа, которые говорят сами за себя

Как это работает технически

Почему это важно прямо сейчас

Российский контекст

Мой взгляд: это может изменить стандарт

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Google прокачал Managed Agents: фоновые задачи, удалённый MCP и обновление токенов

Alibaba запрещает Claude Code: шпионаж или паранойя?

ИИ нашёл 1500 критических уязвимостей за месяц: индустрия не справляется