Какая модель сильнее на дрон-шотах в 2026
По результатам Artificial Analysis Video Arena (декабрь 2025) на категории «aerial / landscape» рейтинг моделей по человеческому ELO:
| Модель | ELO на природе | Сильна в | Слаба в |
|---|---|---|---|
| Veo 3.1 (Google) | 1342 | вода, листва, физика тумана, нативное аудио | стилизация, аниме |
| Sora 2 Pro | 1318 | физика движения, длинные планы | дороже всех, ограниченный доступ |
| Runway Gen-4 | 1276 | стилизованный кинолук, цветокор | прямая физика воды, мелкая листва |
| Kling 3.0 | 1264 | азиатская эстетика, anime stylization | реалистичный туман, западные пейзажи |
| Seedance 2.0 | 1198 | image-to-video из готового референса | text-to-video с нуля |
Для природного дрон-шота в 2026 топ — Veo 3.1. Лучше всего обрабатывает воду, листву, движение тумана между деревьев. Без VPN на genova-ai.ru.
Runway Gen-4 — лучше когда нужен стилизованный кинематограф (тил-оранж grade, anamorphic lens flare). Для documentary-стиля — слабее.
Kling 3.0 — оптимально для аниме / стилизованных дрон-шотов. На реальной природе уступает Veo, но в 2-3 раза дешевле.
Какие ключевые слова движения камеры реально работают
Из обсуждений на r/RunwayMl и r/aivideo разработчики и пользователи сходятся на короткой шортлисте — то что модели последовательно интерпретируют:
- «slow forward dolly push» — медленное движение вперёд (работает лучше чем «zoom in»)
- «orbit around subject» — облёт вокруг объекта по кругу
- «tracking shot following» — камера следует за движущимся объектом
- «tilt up gradually revealing» — наклон вверх с раскрытием сцены
- «crane up» / «crane down» — вертикальный подъём/спуск
- «static shot» — статичная камера (нужно когда модель сама шевелится)
Что НЕ работает стабильно ни в одной модели:
- «dolly zoom» / «vertigo effect» — модели не понимают одновременное движение фокуса и камеры
- «handheld shake» — даёт случайное дрожание, не стилизованную тряску
- «whip pan» / «crash zoom» — резкие движения = распадающийся кадр
- «rack focus» — переключение фокуса между планами почти никогда не работает
Почему 5 секунд — sweet spot, а не 10
Все крупные модели имеют деградацию когерентности на длинных клипах. Это видно в технических обзорах Two Minute Papers и подтверждается в r/StableDiffusion:
- 0-5 секунд — модель держит сцену стабильно. Объекты не морфят, движение плавное
- 5-8 секунд — начинают появляться артефакты: руки персонажей пропадают, текст переписывается, перспектива «плывёт»
- 8-10 секунд — обычно последняя секунда смазана
- 10+ секунд — нужны multi-shot stitching, и швы видны
Для дрон-шота 5 секунд горизонталь 16:9 — оптимум. Если нужно длиннее — генерь 2-3 пятисекундных клипа с разными планами и склеивай в Premiere / DaVinci.
16 слов промпта, которые делают разницу
Из MidJourney v7 video docs и Runway Gen-4 prompt guide: эффективный видео-промпт состоит из 4 блоков по 4 категории.
Блок 1 — Тип кадра и масштаб:
- cinematic / documentary / commercial — общий тон
- aerial drone shot / low angle / over-the-shoulder — позиция камеры
- wide angle 24mm equivalent — конкретное фокусное (модели понимают mm)
- ultra wide / tight close-up — масштаб
Блок 2 — Что в кадре:
- основной субъект (горная долина, океан, лес)
- атмосфера (туман, дождь, снег) — конкретный тип, не «погодные условия»
- 1-2 детали (snow-capped peaks, dense pine forest, crashing waves)
Блок 3 — Движение и время суток:
- движение камеры из шортлиста выше
- время суток: sunrise / golden hour / blue hour / magic hour (важно — модели обучены на этих терминах)
- движение в кадре: drifting fog, crashing waves, swaying branches
Блок 4 — Технические и стилистические триггеры:
- cinematic teal-and-orange grade — тил-оранж color grading (стандарт Голливуда)
- ARRI Alexa look / RED camera — триггер кинокамеры
- anamorphic lens flare — горизонтальные блики (стилизация)
- 5 second duration, 16:9 horizontal, 1080p — техника
Куда вставлять промпт
Интерфейсы видео-генераторов отличаются от картинок: чаще всего есть отдельные поля под промпт и параметры.
| Сервис | Куда вставлять | Параметры отдельно |
|---|---|---|
| Runway Gen-4 | поле «Prompt» | Aspect ratio, Duration (5s или 10s), Camera motion (можно выбрать) |
| Veo 3.1 | большое поле текста | Aspect, Duration, Style, Audio (новое — нативный звук) |
| Kling 3.0 | поле «Prompt» | Mode (Standard / Pro), Duration (5/10s), Negative prompt |
| Seedance 2.0 | поле «Prompt» + загрузка картинки | Image strength, Duration |
В Veo 3.1 появилось поле для нативного аудио — модель сама генерирует звук пейзажа (ветер, плеск воды). Не пиши в промпте «with sound» — есть отдельная галочка Generate audio.
В Kling Pro mode — длиннее ожидание (5-7 минут), но качество движения заметно выше дефолта. Для финального ролика всегда Pro.
Без VPN из России: рабочий стек
Runway, Sora и оригинальный Veo требуют VPN. Что реально работает без VPN:
- Veo 3.1 через genova-ai.ru — топовое качество природы, рублёвая оплата за токены
- Kling 3.0 через genova-ai.ru — для стилизованных и анимешных кадров
- Seedance 2.0 через genova-ai.ru — если есть готовая картинка-референс
- Kling 2.6 Motion Control — для контроля движения через картинку-вход
Типичные провалы дрон-шота в AI
| Симптом в видео | Что в промпте чинит |
|---|---|
| Камера дёргается, а не плавно движется | Добавить slow steady drone motion no shake в конец промпта |
| Объекты «плывут» (морфят форму) | Сократить промпт до 30-40 слов, убрать противоречия |
| Слишком статичная сцена | Добавить движение в кадре: drifting fog, crashing waves, swaying branches |
| Цвет невыразительный, серый | cinematic teal-and-orange grade, warm highlights cool shadows |
| Туман выглядит «приклеенным» | low-altitude fog drifting through trees (drifting — ключевое) |
| Картинка плоская, без глубины | deep atmospheric perspective with cool blue distant peaks |
| Длина обрезана | Указывать 5 second duration явно, не полагаться на дефолт |
Стоимость в реальных цифрах
Для одного 5-секундного дрон-шота 1080p:
- Runway Gen-4 (с VPN, runwayml.com) — ~30 кредитов, при Plus $15/мес ≈ 4 ролика, Pro $35/мес ≈ 12 роликов
- Veo 3.1 на genova-ai.ru — ≈40-60 ₽ за ролик при стандартном тарифе
- Kling 3.0 на genova-ai.ru — ≈25-35 ₽ за ролик
- Sora 2 Pro — только через ChatGPT Pro $200/мес или Plus $20/мес с лимитами
Если делать 1-2 ролика в месяц — genova-ai по токенам дешевле любой подписки. Если 30+ роликов в месяц — Runway Pro или Gemini Pro $20 (включает Veo).
