Google DeepMind
Google DeepMind — британско-американская лаборатория искусственного интеллекта, дочерняя компания Alphabet Inc., занимающаяся фундаментальными исследованиями и разработкой безопасных AI-систем.
О компании
Google DeepMind была основана в ноябре 2010 года Демисом Хасабисом, Шейном Леггом и Мустафой Сулейманом в Лондоне, с междисциплинарным подходом к созданию универсальных AI-систем, объединяющим машинное обучение, нейронауки, математику и инженерию. В 2014 году компания была приобретена Google, а в апреле 2023 года слилась с подразделением Google Brain, образовав единую организацию Google DeepMind под руководством CEO Демиса Хасабиса.
Компания стала автором ряда ключевых прорывов в области AI: AlphaGo победила профессионального игрока в го, AlphaFold произвела революцию в предсказании структур белков, AlphaStar стала первой AI-системой, победившей профессионала в StarCraft II. Также были разработаны AlphaCode (генерация кода), WaveNet (синтез речи), а также генеративные модели Gemini, Imagen (изображения), Veo (видео) и Lyria (музыка).
Миссия Google DeepMind — «решить проблему интеллекта и использовать это для решения всего остального». Компания делает акцент на ответственном и безопасном развитии AI, публикует исследования в ведущих научных журналах (Nature, Science) и стремится к тому, чтобы технологии приносили пользу всему человечеству.
Все модели Google DeepMind (34)
💬ИИ-чат (18)
Лидер бенчмарков 2026 года: 77.1% ARC-AGI-2 и 94.3% GPQA Diamond с контекстом 1 млн.
Флагман Google поколения Gemini 3 (ноябрь 2025): нативно мультимодальная модель (текст, изображение, видео, аудио, код) с контекстом 1M токенов и встроенным рассуждением. Преемник — Gemini 3.1 Pro (февраль 2026) по той же цене. В России без VPN не работает.
Быстрая фронтир-модель Google (релиз 19 мая 2026 на I/O) — Flash, который обошёл прошлогодний Gemini 3.1 Pro в коде и агентных задачах. В 4× быстрее других фронтир-моделей, контекст 1M, dynamic thinking по умолчанию. Цена выросла втрое к Gemini 3 Flash, но всё ещё дешевле Pro. В России без VPN не работает.
Открытое семейство моделей Google (2 апреля 2026, Apache 2.0): от Effective 2B/4B для телефонов до 26B MoE и 31B Dense, плюс мультимодальная 12B без энкодеров (3 июня). Контекст до 256K, 140+ языков, мультимодальный вход. Флагман 31B входит в топ-3 Arena среди текстовых моделей, обходя кратно более крупных конкурентов.
Быстрая и дешёвая мультимодальная модель Google (релиз 17 июня 2025) — первая Flash с режимом рассуждений (thinking). Контекст 1M токенов, ввод текста, изображений, аудио и видео. Лучший баланс цена/качество в линейке Gemini для массовых задач. В России без VPN не работает.
Самая быстрая и дешёвая модель в линейке Gemini 3 от Google (превью — 3 марта 2026, GA — 7 мая): около 380 токенов/сек, контекст 1M, мультимодальный вход (текст, изображения, аудио, видео). Цена $0.25/$1.50 за 1M токенов — под высоконагруженные и латентно-чувствительные задачи. Сильна в мультимодальности для своего класса.
Флагманская мультимодальная модель Google с рассуждениями и контекстом 1 млн токенов.
Быстрая мультимодальная модель с живым режимом речи и видео.
Мультимодальная модель с контекстным окном до 1 миллиона токенов.
Открытая мультимодальная модель с контекстом 128K и пониманием изображений/видео.
Модель для предсказания 3D-структуры белков и молекулярных взаимодействий.
Открытая модель Google для использования непосредственно на устройствах.
Самая лёгкая и быстрая модель семейства Gemini.
Автономный агент Google для многоступенчатого синтеза информации.
Экспериментальная модель генерации текста через диффузию с высокой скоростью.
Открытая языковая модель Google с оптимальным соотношением качества и размера.
Самая мощная модель в семействе Gemini для наиболее сложных задач.
Компактная модель Gemini для работы на мобильных устройствах.
🎨Картинки (6)
Новейшая модель Google для генерации изображений с улучшенным качеством.
Продвинутая модель Google (Gemini 3 Pro Image) с разрешением до 4K и точным текстом на изображениях.
Модель генерации фотореалистичных изображений от Google.
Модель Google (Gemini 3.1 Flash Image) — баланс скорости и качества с улучшенным рендерингом текста.
Модель генерации изображений Google (Gemini 2.5 Flash Image) с быстрой генерацией и логическим пониманием промптов.
Вторая версия Google Imagen с улучшенным фотореализмом и рендерингом текста.
🎬Видео (5)
Улучшенная версия с референс-изображениями, расширением сцен и контролем первого/последнего кадра.
Видеогенератор Google DeepMind с нативным синхронным звуком в одном проходе — диалоги с лип-синком, звуковые эффекты и эмбиент. Клипы по 8 секунд в 720p/1080p/4K, поддержка image-to-video.
ИИ-инструмент Google для кинематографического производства с поддержкой Nano Banana Pro.
Модель генерации видео до 4K и 2 минут длительности.
Первая модель видеогенерации Google DeepMind, представленная на I/O 2024.
💻Генерация кода (3)
Асинхронный автономный кодинг-агент Google (GA с августа 2025): ставите задачу — он работает в изолированной облачной виртуалке с копией вашего репозитория и присылает готовый pull request. Не чат, а «отдал задачу и ушёл». Работает на Gemini (Pro для планирования, Flash для лёгкого), сейчас на уровне Gemini 3.1 Pro.
Эволюционный кодинг-агент Google DeepMind (май 2025) для поиска и улучшения алгоритмов. Связывает Gemini (Flash для широты идей, Pro для глубины) с автоматическими проверщиками в эволюционном цикле. Нашёл способ умножать матрицы 4×4 за 48 умножений — первое улучшение за 56 лет. Не потребительский продукт, а исследовательская система.
Открытая лёгкая модель Google для кода (февраль 2024) на базе Gemma: варианты 2B (быстрое автодополнение) и 7B (генерация + чат по коду). Запускается локально, заточена под дополнение и infill. Сегодня — добротная «классика» начального уровня; новое поколение открытых моделей Google — Gemma 4.
Последние новости Google DeepMind
Google DeepMind сделала Interactions API интерфейсом по умолчанию для Gemini. Старый generateContent уходит в прошлое — все новые агентные функции будут только здесь.
Google DeepMind выпустила DiffusionGemma — текстовую диффузионную модель, которая генерирует текст принципиально иначе, чем все современные LLM. Это первая серьёзная альтернатива трансформерной архитектуре от крупного игрока.
Google DeepMind представила Gemma 4 12B — первую среднеразмерную модель с нативным аудио, которая работает прямо на ноутбуке с 16 ГБ памяти без отдельных энкодеров.
Google DeepMind выпустила Gemma 4 12B — открытую модель с нативной обработкой текста, изображений и аудио, которая работает на ноутбуке с 16 ГБ RAM.
Google DeepMind создал ИИ-систему, которая автономно решила 9 открытых задач Эрдёша — некоторые не поддавались математикам 56 лет — потратив лишь несколько сотен долларов на каждую.