Google Omni: ИИ превращает любой контент в видео — тест на плюшевом олене

Когда ИИ умеет всё, но не всегда хорошо
Представьте: вы загружаете фото плюшевой игрушки, пишете несколько строк текста — и получаете видео, где эта игрушка прыгает с парашютом или плывёт на круизном лайнере. Именно это обещает новая модель Google под названием Omni Flash. Звучит как фантастика? Отчасти — да. Но отчасти это уже реальность, пусть и с оговорками.
Google представила Omni на I/O 2026 как «универсальную» генеративную архитектуру — модель, которая в перспективе должна превращать любой тип входных данных (фото, видео, текст, аудио) в любой другой формат. Пока же Omni Flash, первая публично доступная модель семейства, сосредоточена на генерации видео и доступна через платформу Flow — видеоредактор Google на базе ИИ.
Что нового по сравнению с Veo
До Omni у Google была модель Veo, и она тоже умела генерировать видео. Но Omni Flash привносит несколько принципиальных улучшений. Во-первых, теперь можно загрузить существующее видео и использовать его как отправную точку вместе с текстовым промптом. Во-вторых, Google утверждает, что Omni лучше понимает реальный мир — физику, логику сцен, поведение объектов. В-третьих, модель якобы значительно лучше справляется с консистентностью персонажей на протяжении всего ролика.
Это последнее — хроническая боль всех видеогенераторов. Sora от OpenAI, Kling от Kuaishou, Runway Gen-3 — все они страдали от одного и того же: персонаж в начале клипа и в конце — будто разные существа. Если Google действительно решила эту проблему хотя бы частично, это серьёзный шаг вперёд.
Плюшевый олень как стресс-тест
Чтобы проверить эти обещания на практике, журналисты The Verge провели показательный эксперимент — снова запустили в «путешествие» плюшевого оленя по имени Бадди, которого тестировали ещё на Veo пять месяцев назад. Результаты оказались... неоднозначными.
С одной стороны, прогресс очевиден. Некоторые клипы получились заметно лучше, чем с Veo: персонаж узнаваем, сцены логичны, настроение передано верно. Один из промптов попросил Omni придумать смешную деталь — модель сама решила, что Бадди возьмёт в чемодан банку мёда, а потом случайно нальёт его на копыто вместо солнцезащитного крема. Это не дословное следование инструкции — это нарративная импровизация. Для генеративной модели — впечатляющий момент.
С другой стороны, «ИИ-прыжки» никуда не делись. Банка мёда меняет форму и содержимое три раза за один клип. Олень при прыжке с парашютом внезапно разворачивается в воздухе под физически невозможным углом. А в одной сцене у Бадди вдруг появляются рога — хотя это детёныш, и рогов у него нет по определению. Попытка убрать рога через текстовый промпт привела к тому, что в следующем кадре рога появились снова, только в другом месте.
Редактирование через промпты: шаг вперёд, но маленький
Отдельного внимания заслуживает функция текстового редактирования уже готовых видео. В Veo она работала настолько плохо, что проще было генерировать новый клип с нуля. В Omni Flash редактирование стало заметно отзывчивее — модель действительно берёт в расчёт ваши правки. Но «берёт в расчёт» не значит «выполняет правильно». Запрос усилить мимику персонажа привёл к странным гримасам, а не к живой эмоции.
Это важный индикатор зрелости технологии. Генерировать с нуля — одно. Точечно редактировать существующий контент, сохраняя всё остальное нетронутым — совершенно другой уровень задачи, и здесь ИИ-видеогенераторы пока системно проигрывают человеку-монтажёру.
Что это значит для обычных пользователей
Оmni Flash доступна через платформу Flow. Для россиян ситуация привычная: сервис работает с VPN, российские карты не принимаются, но можно использовать зарубежные платёжные методы или пробный период. Flow входит в экосистему Google One AI Premium — подписка стоит $19.99 в месяц.
Для бизнеса и контент-мейкеров это уже рабочий инструмент — особенно для создания черновиков, концептов, storyboard-анимаций. Финальный продакшн пока требует человеческой доработки, но порог входа стремительно снижается. Чтобы сделать приличное промо-видео для соцсетей, сегодня не нужен оператор, монтажёр и три дня работы. Нужен хороший промпт и немного терпения.
Мой взгляд: это не сингулярность, но тренд очевиден
Google честно называет Omni «семейством моделей, которое однажды сможет всё». Ключевое слово — «однажды». Сегодня Omni Flash — это эволюция, а не революция. Значительно лучше Veo, местами впечатляет, но всё ещё далека от того уровня контроля и предсказуемости, который нужен профессионалам.
Мне кажется, самое честное сравнение сейчас — это Omni Flash против Kling 2.0 от Kuaishou и Sora от OpenAI. Kling стабильнее в физике движений, Sora лучше с реализмом, но у Google есть козырь: интеграция в огромную экосистему, Flow как удобный интерфейс и потенциал мультимодальности, который конкуренты пока не реализовали в таком масштабе.
История с плюшевым оленем — это не просто милый эксперимент. Это точный индикатор того, где мы находимся: инструменты уже достаточно мощные, чтобы удивлять, но ещё недостаточно надёжные, чтобы полностью доверять. И именно в этом промежутке живёт самое интересное время для наблюдения за ИИ-видео.
Источники
Похожие новости
NVIDIA SANA-WM: минутное 720p видео с одной видеокарты
NVIDIA выпустила открытую модель SANA-WM на 2,6 млрд параметров — она генерирует 60-секундное видео в 720p с точным управлением камерой и работает на одном RTX 5090.
Google Gemini Omni: видеомодель, которая видит и понимает в реальном времени
Google представил Gemini Omni — мультимодальную модель с нативной поддержкой видео. Теперь ИИ анализирует видеопоток в реальном времени, а не кадр за кадром.
OpenAI хоронит Sora: уходит создатель и топ-менеджеры
Билл Пиблс, руководивший командой Sora, покидает OpenAI вслед за закрытием проекта. Компания режет «побочные квесты» и делает ставку на код и корпоративных клиентов.