Gemini-SQL2 от Google разносит конкурентов: 80% точности в переводе языка в SQL

Когда нейросеть понимает базы данных лучше большинства разработчиков

Представьте: менеджер по продажам спрашивает базу данных на обычном русском — «покажи мне ежемесячную выручку по регионам среди клиентов, которые отписались в течение 90 дней после апгрейда» — и получает правильный SQL-запрос с джойнами, оконными функциями и арифметикой дат. Без единой строчки кода. Именно это умеет делать Gemini-SQL2, которую Google Research тихо представила в июне 2026 года.

Тихо — потому что никакой пресс-конференции не было. Анонс появился в посте в X от команды Google Research, и тем не менее произвёл эффект разорвавшейся бомбы в сообществе разработчиков баз данных.

Что такое Gemini-SQL2 и почему это сложнее, чем кажется

Gemini-SQL2 — это не самостоятельная языковая модель, а специализированная возможность, построенная поверх Gemini 3.1 Pro. Система принимает вопрос на естественном языке и генерирует «execution-ready» SQL-запрос — то есть такой, который не просто выглядит правильно синтаксически, но реально выполняется и возвращает корректные данные.

Это принципиальное различие. Многие системы умеют генерировать SQL, который «похож на правду» — правильные ключевые слова, приличная структура. Но запускаешь его — и получаешь ошибку или, что хуже, неправильный результат без единого предупреждения. Именно поэтому Google особо подчёркивает: их SQL не просто выглядит корректно, он работает.

Сложность задачи хорошо описана самой командой: данные в реальных базах грязные, схемы — запутанные, бизнес-логика — неочевидная. Спросить «какой продукт продаётся лучше всего» кажется простым, но за этим могут стоять десятки таблиц с неочевидными связями и нечёткими названиями колонок.

Цифры, которые говорят сами за себя

На бенчмарке BIRD (BIg Bench for LaRge-scale Database Grounded Text-to-SQL Evaluation) — отраслевом стандарте для оценки таких систем — Gemini-SQL2 набрала 80,04% execution accuracy в треке Single Model.

Для понимания масштаба: BIRD содержит 12 751 пару вопрос-SQL по 95 базам данных из 37 профессиональных отраслей, общим объёмом 33,4 ГБ. Базы намеренно содержат «грязные» значения и требуют внешних знаний — в отличие от устаревшего бенчмарка Spider.

Конкуренты выглядят бледно:

- GPT-5.5-xhigh от OpenAI — около 72,5–72,8% - Claude Opus 4.6 от Anthropic — около 70,1–70,9% - Q-SQL от AWS — примерно 76,5% - Databricks RLVR 32B — около 75,7% - Предыдущий рекорд самого Google (Gemini-SQL, ноябрь 2025) — 76,13%

Таким образом, Gemini-SQL2 превзошла собственного предшественника почти на 4 процентных пункта и обогнала ближайшего внешнего конкурента (AWS Q-SQL) примерно на 3,5 пункта. Разрыв с OpenAI и Anthropic — почти 10 процентных пунктов. Это не просто улучшение, это доминирование.

Единственный ориентир, который пока недостижим — человеческий уровень: 92,96%. До него остаётся около 13 пунктов. Но с учётом темпа прогресса — от 76% в ноябре до 80% в июне — этот разрыв может закрыться быстрее, чем многие ожидают.

Куда это всё пойдёт в продукты

Google пока официально не подтвердила, в какие именно сервисы встроит Gemini-SQL2. Но логика очевидна: BigQuery Studio, AlloyDB AI и Cloud SQL Studio уже используют Gemini для генерации SQL. Gemini-SQL2 — естественный следующий шаг для этих платформ.

Для бизнеса это меняет многое. Представьте аналитика, который вместо написания сложных запросов просто формулирует задачу на языке бизнеса. Или разработчика, который получает черновик BigQuery-трансформации на английском и лишь проверяет его, а не пишет с нуля. Это реальная экономия часов работы.

Однако здесь важна честность: 80% точности — это не 100%. Каждый пятый запрос может быть неверным. Для критических бизнес-решений человеческий контроль остаётся обязательным. Встроенные «ask your data» функции в SaaS-продуктах с такой точностью можно использовать для аналитических задач, но не для финансовой отчётности без проверки.

Интересный паттерн на лидерборде

При внимательном изучении таблицы BIRD видна любопытная тенденция: специализированные 32B-модели для SQL (Databricks RLVR, Tencent SiriusAI, Snowflake Arctic) обходят крупные универсальные фронтирные модели от OpenAI и Anthropic. Это говорит о том, что в узкоспециализированных задачах размер модели и общий «интеллект» не всегда решают — решает правильная специализация и тонкая настройка.

Gemini-SQL2 при этом умудряется быть одновременно и специализированной (заточенной под SQL), и построенной на мощном универсальном фундаменте Gemini 3.1 Pro. Похоже, что именно эта комбинация и даёт выигрыш.

Что это значит для российских пользователей

Прямого публичного доступа к Gemini-SQL2 пока нет — Google не объявляла ни API, ни отдельного продукта. Если возможность появится в составе Google Cloud сервисов (BigQuery, AlloyDB), то российским компаниям потребуется работать через зарубежные юрлица или партнёров — доступ к Google Cloud из РФ ограничен с 2022 года. Тем не менее технология косвенно повлияет на рынок: конкуренты будут вынуждены подтягиваться, и аналогичные возможности появятся в более доступных для российского рынка решениях.

Открытых весов нет, статьи тоже

Исследовательская команда Google пока не опубликовала ни академической статьи, ни технических деталей о методологии. Это несколько разочаровывает: понять, за счёт чего достигнут такой прирост — дополнительного fine-tuning, специальной системы промптов, новой архитектуры поиска по схеме — пока невозможно. Открытых весов также не планируется, по крайней мере, об этом не говорилось.

Тем не менее факт остаётся фактом: на сегодня Gemini-SQL2 — лучшая публично протестированная система перевода естественного языка в SQL. И это подтверждено несколькими независимыми публикациями.

Gemini-SQL2 от Google разносит конкурентов: 80% точности в переводе языка в SQL

Когда нейросеть понимает базы данных лучше большинства разработчиков

Что такое Gemini-SQL2 и почему это сложнее, чем кажется

Цифры, которые говорят сами за себя

Куда это всё пойдёт в продукты

Интересный паттерн на лидерборде

Что это значит для российских пользователей

Открытых весов нет, статьи тоже

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

OpenAI покупает Ona: Codex получит постоянные облачные среды для агентов

Anthropic выпустила Claude Fable 5 и Mythos 5: прорыв в коде и науке

Токенпокалипсис: как ИИ-компании начинают выставлять реальные счета