Veo 3
Видеогенератор Google DeepMind с нативным синхронным звуком в одном проходе — диалоги с лип-синком, звуковые эффекты и эмбиент. Клипы по 8 секунд в 720p/1080p/4K, поддержка image-to-video.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Google DeepMind
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к Veo 3 в Gemini App и Google Flow
- Gemini 2.5 Pro и доступ к новым моделям
- 2 ТБ облачного хранилища Google One
- Интеграция с Google Workspace (Docs, Gmail, Slides)
- Лимит генераций включён в подписку
- Максимальный приоритет генерации Veo 3 и Veo 3.1
- Расширенные лимиты и доступ к Deep Research
- 30 ТБ облачного хранилища
- Полный набор Gemini-инструментов на максимальном плане
- Без подписки — оплата только за реально сгенерированные секунды
- 1080p с аудио: ~$0.40/сек, 4K с аудио: ~$0.60/сек
- Image-to-video и Scene Extension через API
- Доступ к Veo 3.1 Lite / Fast / Quality в одном API
- Используется в Vertex AI для продакшен-пайплайнов
Плюсы и минусы
Подробный обзор
Что такое Veo 3
Veo 3 — флагманская видеогенерационная модель от Google DeepMind, представленная 20 мая 2025 года на конференции Google I/O. Это третья итерация линейки Veo и первая модель в индустрии, которая генерирует видео и звук в одном проходе — диалоги с правильным лип-синком, звуковые эффекты и амбиент, попадающий в происходящее на экране. До Veo 3 видеогенераторам приходилось либо отдавать беззвучные клипы, либо доклеивать аудио отдельным шагом, что выдавалось рассинхроном и обрывистыми переходами.
Основные возможности
Модель принимает на вход текстовый промпт или статичное изображение (image-to-video) и за один проход выдаёт ролик длительностью 8 секунд в разрешении 720p, 1080p или 4K со встроенным звуком. Это базовая длина — для более продолжительных сцен используется функция Scene Extension: модель продолжает уже сгенерированный клип, сохраняя персонажа, сеттинг и стилистику; цепочка из нескольких клипов даёт ролики на 60 секунд и больше. Veo 3 умеет управлять движением камеры, выражением лица персонажа и общей кинематографичностью кадра — что выгодно отличает её от ранних видеогенераторов с «эффектом GIF».
Где доступна Veo 3
Google открыла Veo 3 сразу на нескольких площадках:
- Gemini App — генерация прямо в чате Gemini для подписчиков Google AI Pro ($19.99/мес) и AI Ultra ($249.99/мес)
- Google Flow — отдельный творческий инструмент для режиссёров и контент-мейкеров со склейкой сцен
- Google AI Studio + Gemini API — для разработчиков, оплата по секундам без подписки
- Vertex AI — корпоративный уровень для продакшен-пайплайнов с расширенными лимитами и SLA
Цены через API: ~$0.40 за секунду для 1080p с аудио и ~$0.60 за секунду для 4K с аудио. Подписки Google AI Pro/Ultra включают лимиты генераций без поштучной оплаты — это удобнее для индивидуальных авторов.
Место в линейке Veo
Veo 3 остаётся доступной, но с тех пор Google выпустила Veo 3.1 (октябрь 2025) — улучшенная версия с функцией Ingredients to Video (управление консистентностью персонажа через референсы), вертикальным форматом 9:16 для TikTok и Shorts и более точным контролем первого/последнего кадра. В январе 2026 Google добавила Veo 3.1 Lite — самую дешёвую версию для массовой генерации. Для большинства новых задач сейчас рациональнее смотреть на Veo 3.1; Veo 3 актуальна для проектов где уже отстроена интеграция и важна стабильность поведения модели.
Доступность и особенности использования
Veo 3 — не работает в России без VPN. Gemini App (gemini.google.com), Google AI Studio (ai.google.dev) и Google Flow заблокированы для российских IP-адресов; Vertex AI требует Google Cloud аккаунта, который также сложно зарегистрировать из России. Оплата картами российских банков (МИР) недоступна — нужна зарубежная Visa/Mastercard, привязанная к иностранному Google аккаунту. Интерфейс везде только на английском, локализации на русский нет, но сама модель принимает промпты на русском (хотя качественнее работает на английском). При генерации диалогов реплики на русском Veo 3 произносит с заметным акцентом.