GBrain: открытый слой памяти для ИИ-агентов от главы Y Combinator

Амнезия как главная проблема современных ИИ-агентов
Каждый, кто хоть раз пытался выстроить рабочий процесс на основе ИИ-агентов, сталкивался с одной и той же стеной: агент блестяще справляется с задачей сегодня, а завтра — снова чистый лист. Никаких воспоминаний о прошлой встрече, никакого контекста о принятых решениях, ни слова о том, что вы обсуждали неделю назад. Это не баг конкретной модели — это архитектурная проблема всей индустрии.
Гарри Тан, президент и CEO Y Combinator — человек, который видит тысячи стартапов в год и явно устал от этого ограничения — решил проблему для себя лично, а потом открыл решение всем. Так появился GBrain.
Что такое GBrain и почему это не просто очередная RAG-обёртка
GBrain — это слой долгосрочной памяти для ИИ-агентов, построенный на Postgres с расширением pgvector. Но называть его просто «RAG-системой» — значит сильно недооценивать архитектуру. Главное отличие: GBrain самостоятельно строит типизированный граф знаний из ваших заметок, писем, твитов и встреч — и делает это без единого вызова к языковой модели на этапе извлечения графа.
Подумайте, что это означает на практике: ноль дополнительных токенов, ноль задержек на вызовы API, ноль лишних затрат при индексации. Граф строится через регулярные выражения и структурированный парсинг markdown-файлов. Типы связей — `works_at`, `founded`, `invested_in`, `attended`, `advises`, `mentions` — извлекаются детерминированно.
Производственный мозг самого Тана сейчас содержит 146 646 страниц, 24 585 людей, 5 339 компаний и 66 автономных cron-задач. Это не демо-стенд — это реальная система, которая работает в его агентах OpenClaw и Hermes прямо сейчас.
Числа, которые говорят сами за себя
GBrain имеет собственный бенчмарк — BrainBench, корпус из 240 страниц насыщенной прозы. Результаты впечатляют: P@5 = 49,1% и R@5 = 97,9%. При отключении графового слоя и использовании только базового поиска P@5 падает на 31,4 процентных пункта. Граф знаний — не украшение, а ключевой компонент точности.
Для поиска используется гибридный подход: векторный поиск + BM25 keyword + Reciprocal Rank Fusion (RRF), а поверх — реранкер от ZeroEntropy. Это примерно то, что крупные RAG-системы собирают из пяти разных библиотек — здесь всё идёт из коробки.
Как это работает технически
GBrain написан на TypeScript и работает на рантайме Bun. Локальная база — PGLite: полноценный Postgres 17, скомпилированный в WASM. Никакого Docker, никакого сервера — база поднимается за две секунды в директории `~/.gbrain/`. Это принципиальное решение: система должна запускаться на ноутбуке разработчика без инфраструктурного оверхеда.
Для эмбеддингов поддерживаются три провайдера: ZeroEntropy (по умолчанию), OpenAI и Voyage. Без ключа API можно запустить только keyword-поиск — векторная часть отвалится. Опционально можно подключить Anthropic API для multi-query expansion при поиске.
Особого внимания заслуживает MCP-сервер: он экспортирует 74 инструмента, через которые Claude Code, Cursor и Windsurf могут читать и писать в мозг напрямую. Это делает GBrain не просто хранилищем, а живым участником рабочего процесса агента.
Почему это важно прямо сейчас
Мы находимся в переломной точке: агентные системы переходят от игрушек к реальным рабочим инструментам. Но без персистентной памяти любой агент — это дорогой ассистент с амнезией. Существующие решения — Mem0, Zep, LangChain Memory — либо требуют облачной инфраструктуры, либо делают слишком много вызовов к LLM при индексации, либо не дают контроля над данными.
GBrain предлагает другую философию: markdown как первичный источник истины, граф строится локально, данные остаются у вас. Это особенно актуально для тех, кто работает с чувствительной информацией — корпоративными переговорами, инвестиционными решениями, персональными данными.
Российский контекст
Проект распространяется под лицензией MIT и доступен на GitHub без каких-либо региональных ограничений. Bun устанавливается через стандартный curl-скрипт, репозиторий клонируется без VPN. Единственное ограничение — для полноценного гибридного поиска нужен API-ключ от ZeroEntropy, OpenAI или Voyage. OpenAI в РФ без VPN недоступен, Voyage — тоже. ZeroEntropy — менее известный провайдер, ситуация с доступом требует проверки. Как запасной вариант: можно использовать локальные эмбеддинги через Ollama, хотя это потребует небольшой доработки конфигурации.
Мой взгляд: это может изменить стандарт
То, что GBrain выпустил именно Гарри Тан — не случайность. Y Combinator видит сотни стартапов, строящих агентные системы, и президент организации лично почувствовал боль отсутствия памяти. Когда человек с таким доступом к ресурсам и экспертизе решает проблему для себя, а потом открывает решение — это сигнал.
Мне особенно нравится решение не использовать LLM для построения графа. Большинство конкурентов гоняют GPT-4 для извлечения сущностей — это дорого, медленно и недетерминированно. GBrain показывает, что для структурированных markdown-заметок хватает умного парсера. Это честная инженерная мысль, а не хайп.
Единственный вопрос, который остаётся открытым: как система справится с неструктурированными источниками — транскриптами звонков, PDF-отчётами, веб-страницами? Markdown-first подход блестящ для дисциплинированных пользователей, но большинство людей не пишут заметки в markdown. Если команда решит эту задачу, не сломав архитектуру — GBrain станет стандартом памяти для агентных систем.
Источники
Похожие новости
Figma выпустила своего ИИ-агента — теперь дизайн рисует себя сам
Компания Figma представила собственного ИИ-агента, который умеет создавать интерфейсы по текстовым запросам. Конкуренция в нише дизайн-инструментов переходит на новый уровень.
Cursor выпустил Composer 2.5 на базе китайской Kimi — дешевле GPT в 6 раз
Редактор кода Cursor представил модель Composer 2.5, построенную на основе китайской Kimi K2.5. Цена — $0.5 за миллион токенов против $5 у GPT-5.5, но компания умолчала об этом до разоблачения.
Ollama v0.30.0: архитектурная революция с llama.cpp и MLX
Ollama полностью переписывает свои внутренности: прямая поддержка llama.cpp, GGUF-совместимость и аппаратное ускорение на Apple Silicon через MLX. Это не просто обновление — это смена фундамента.