Google Omni: ИИ превращает любой контент в видео — тест на плюшевом олене

Когда ИИ умеет всё, но не всегда хорошо

Представьте: вы загружаете фото плюшевой игрушки, пишете несколько строк текста — и получаете видео, где эта игрушка прыгает с парашютом или плывёт на круизном лайнере. Именно это обещает новая модель Google под названием Omni Flash. Звучит как фантастика? Отчасти — да. Но отчасти это уже реальность, пусть и с оговорками.

Google представила Omni на I/O 2026 как «универсальную» генеративную архитектуру — модель, которая в перспективе должна превращать любой тип входных данных (фото, видео, текст, аудио) в любой другой формат. Пока же Omni Flash, первая публично доступная модель семейства, сосредоточена на генерации видео и доступна через платформу Flow — видеоредактор Google на базе ИИ.

Что нового по сравнению с Veo

До Omni у Google была модель Veo, и она тоже умела генерировать видео. Но Omni Flash привносит несколько принципиальных улучшений. Во-первых, теперь можно загрузить существующее видео и использовать его как отправную точку вместе с текстовым промптом. Во-вторых, Google утверждает, что Omni лучше понимает реальный мир — физику, логику сцен, поведение объектов. В-третьих, модель якобы значительно лучше справляется с консистентностью персонажей на протяжении всего ролика.

Это последнее — хроническая боль всех видеогенераторов. Sora от OpenAI, Kling от Kuaishou, Runway Gen-3 — все они страдали от одного и того же: персонаж в начале клипа и в конце — будто разные существа. Если Google действительно решила эту проблему хотя бы частично, это серьёзный шаг вперёд.

Плюшевый олень как стресс-тест

Чтобы проверить эти обещания на практике, журналисты The Verge провели показательный эксперимент — снова запустили в «путешествие» плюшевого оленя по имени Бадди, которого тестировали ещё на Veo пять месяцев назад. Результаты оказались... неоднозначными.

С одной стороны, прогресс очевиден. Некоторые клипы получились заметно лучше, чем с Veo: персонаж узнаваем, сцены логичны, настроение передано верно. Один из промптов попросил Omni придумать смешную деталь — модель сама решила, что Бадди возьмёт в чемодан банку мёда, а потом случайно нальёт его на копыто вместо солнцезащитного крема. Это не дословное следование инструкции — это нарративная импровизация. Для генеративной модели — впечатляющий момент.

С другой стороны, «ИИ-прыжки» никуда не делись. Банка мёда меняет форму и содержимое три раза за один клип. Олень при прыжке с парашютом внезапно разворачивается в воздухе под физически невозможным углом. А в одной сцене у Бадди вдруг появляются рога — хотя это детёныш, и рогов у него нет по определению. Попытка убрать рога через текстовый промпт привела к тому, что в следующем кадре рога появились снова, только в другом месте.

Редактирование через промпты: шаг вперёд, но маленький

Отдельного внимания заслуживает функция текстового редактирования уже готовых видео. В Veo она работала настолько плохо, что проще было генерировать новый клип с нуля. В Omni Flash редактирование стало заметно отзывчивее — модель действительно берёт в расчёт ваши правки. Но «берёт в расчёт» не значит «выполняет правильно». Запрос усилить мимику персонажа привёл к странным гримасам, а не к живой эмоции.

Это важный индикатор зрелости технологии. Генерировать с нуля — одно. Точечно редактировать существующий контент, сохраняя всё остальное нетронутым — совершенно другой уровень задачи, и здесь ИИ-видеогенераторы пока системно проигрывают человеку-монтажёру.

Что это значит для обычных пользователей

Оmni Flash доступна через платформу Flow. Для россиян ситуация привычная: сервис работает с VPN, российские карты не принимаются, но можно использовать зарубежные платёжные методы или пробный период. Flow входит в экосистему Google One AI Premium — подписка стоит $19.99 в месяц.

Для бизнеса и контент-мейкеров это уже рабочий инструмент — особенно для создания черновиков, концептов, storyboard-анимаций. Финальный продакшн пока требует человеческой доработки, но порог входа стремительно снижается. Чтобы сделать приличное промо-видео для соцсетей, сегодня не нужен оператор, монтажёр и три дня работы. Нужен хороший промпт и немного терпения.

Мой взгляд: это не сингулярность, но тренд очевиден

Google честно называет Omni «семейством моделей, которое однажды сможет всё». Ключевое слово — «однажды». Сегодня Omni Flash — это эволюция, а не революция. Значительно лучше Veo, местами впечатляет, но всё ещё далека от того уровня контроля и предсказуемости, который нужен профессионалам.

Мне кажется, самое честное сравнение сейчас — это Omni Flash против Kling 2.0 от Kuaishou и Sora от OpenAI. Kling стабильнее в физике движений, Sora лучше с реализмом, но у Google есть козырь: интеграция в огромную экосистему, Flow как удобный интерфейс и потенциал мультимодальности, который конкуренты пока не реализовали в таком масштабе.

История с плюшевым оленем — это не просто милый эксперимент. Это точный индикатор того, где мы находимся: инструменты уже достаточно мощные, чтобы удивлять, но ещё недостаточно надёжные, чтобы полностью доверять. И именно в этом промежутке живёт самое интересное время для наблюдения за ИИ-видео.

Google Omni: ИИ превращает любой контент в видео — тест на плюшевом олене

Когда ИИ умеет всё, но не всегда хорошо

Что нового по сравнению с Veo

Плюшевый олень как стресс-тест

Редактирование через промпты: шаг вперёд, но маленький

Что это значит для обычных пользователей

Мой взгляд: это не сингулярность, но тренд очевиден

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Adobe поглощает Topaz Labs: ИИ-апскейлинг войдёт в Creative Cloud

xAI запускает Grok Imagine Video 1.5: фото оживают со звуком в 720p

Meituan открыла фреймворк для создания цифровых людей