ElevenLabs Music v2: опера переходит в метал без потери музыкальной логики

Когда опера превращается в метал — и это звучит органично
Представьте: трек начинается с оперного сопрано, затем без видимого шва переходит в тяжёлый риффовый металл, а потом врывается скоростной рэп с нечеловеческой плотностью слогов. Именно это обещает новая модель ElevenLabs Music v2, вышедшая 27–28 мая 2026 года. Я слежу за гонкой ИИ-музыки уже несколько лет, и должен признать: заявка серьёзная.
ElevenLabs — компания, которую большинство знает по голосовым технологиям, — выпустила первую версию своего музыкального генератора около 10 месяцев назад. Music v2 — это не косметическое обновление, а переосмысление архитектуры работы с жанрами, вокалом и структурой трека.
Что реально изменилось в Music v2
Главная техническая фишка — межжанровая связность. Модель умеет перемещаться между оперой, хэви-металом и рэпом внутри одной композиции, не теряя музыкальной логики. Это не просто коллаж из разных кусков: переходы остаются гармоничными. Дополнительно модель справляется с плотной лирической доставкой — быстрый рэп больше не «каша» из слогов — и умеет органично вписывать немузыкальные звуковые эффекты прямо в ткань трека.
Второе ключевое нововведение — улучшенный инпейнтинг. Теперь можно выделить конкретную секцию — скажем, бридж — и перегенерировать только её, не трогая куплет и припев. Это меняет рабочий процесс кардинально: вместо «сгенерировал и молись» получаешь нечто похожее на нелинейный монтаж в DAW.
Третье — посекционная сборка треков. Можно строить песню блоками: интро, куплет, припев, аутро — и сшивать их вместе с сохранением структурной и тональной преемственности. Короткие клипы остались в прошлом, максимальная длина через API — 5 минут.
Четвёртое — мультиязычность. Вокал, лирика и аранжировки теперь стабильнее работают на разных языках. Для русскоязычного рынка это потенциально важно, хотя конкретный список поддерживаемых языков компания пока не раскрывает в деталях.
Три платформы, три аудитории
ElevenLabs разделила доступ к модели на три продукта:
- ElevenMusic — для музыкантов и креаторов. Студия: задаёшь лирику, настроение или референс-трек, получаешь полноценную композицию, можешь ремиксовать. - ElevenAPI — для разработчиков. Программный доступ к генерации, инпейнтингу и референс-матчингу. Цена — $0.15 за минуту, качество аудио — 44.1 кГц, 128–192 кбит/с. Доступность через API анонсирована как «скоро». - ElevenCreative — для брендов и контент-команд. Можно ставить задачу как креативный директор: «соник-муд», жанр, темп, голос бренда. Без синхронизационных сборов и задержек на клиринг.
При этом ElevenLabs объявила о снижении цен до 50% на Music v1 и v2 для ElevenAPI и до 40% для ElevenCreative. Это агрессивный ход на фоне обострившейся конкуренции.
Лицензионный вопрос — ключевой дифференциатор
ElevenLabs особо подчёркивает: модель обучена исключительно на лицензированных данных, в том числе через партнёрство с музыкальным лейблом Believe. Все сгенерированные треки доступны для коммерческого использования начиная с тарифа Starter+. Никаких синхронизационных сборов, никаких юридических хвостов.
Это прямой ответ на проблемы конкурентов. Suno и Udio столкнулись с судебными исками от крупных лейблов именно из-за вопросов авторского права при обучении. ElevenLabs выбрала другой путь — строить легальную базу с самого начала. В долгосрочной перспективе это может оказаться важнее любых технических показателей.
Конкурентный контекст: кто ещё в гонке
Последние месяцы в ИИ-музыке действительно жаркие. Google на I/O добавил в Flow Music возможность создавать кавер-версии, редактировать треки по секциям и генерировать музыкальные видео. Stability AI и Suno также выпустили обновления с поддержкой более длинных и сложных треков. Рынок движется в одном направлении: от генерации клипов к полноценному продакшну.
ElevenLabs входит в эту гонку с преимуществом в виде уже выстроенной инфраструктуры для голоса и API-экосистемы. Разработчикам, которые уже используют ElevenLabs для озвучки, логично добавить музыкальный слой из той же системы. Это синергия, которую Google и Suno обеспечить не могут — у них нет такой же глубины в голосовых технологиях.
Работает ли в России
Доступ к ElevenLabs из России по-прежнему требует VPN — сервис не работает напрямую с российскими IP-адресами. Оплата через российские карты недоступна, нужна иностранная карта или криптовалюта через посредников. Это стандартная история для западных ИИ-сервисов в 2026 году, ничего нового.
Tем не менее для разработчиков и агентств, работающих через зарубежные юрлица, Music v2 через API — реальный инструмент для автоматизации производства музыкального контента: рекламные джинглы, фоновая музыка для видео, подкасты.
Мой вывод
Music v2 — это не революция, но очень уверенный шаг. Межжанровые переходы без потери связности, инпейнтинг по секциям и лицензионная чистота — три вещи, которые одновременно закрывают главные боли пользователей. Снижение цен вдвое добавляет серьёзности намерениям компании занять рынок.
Следить стоит за одним: насколько заявленные возможности работают на практике, а не только в промо-демо. История ИИ-музыки знает немало случаев, когда маркетинговые видео выглядели убедительнее реального вывода модели. Проверю на практике — и расскажу.
*Данные подтверждены несколькими независимыми публикациями, включая официальный блог компании и ведущие технологические издания.*
Похожие новости
ElevenLabs Music v2: ИИ меняет жанры прямо посреди трека
ElevenLabs выпустила Music v2 — модель, способная переключаться между оперой, хэви-металом и рэпом в рамках одной песни, не теряя связности.
Stable Audio 3: музыка на 6 минут прямо на вашем MacBook
Stability AI открыла веса новых аудиомоделей, способных генерировать полноценные треки длиной более шести минут — и всё это на потребительском железе без облака.
Stability AI выпустила Stable Audio 3.0: треки до 6 минут на лицензионных данных
Stability AI представила семейство аудиомоделей Stable Audio 3.0 — от компактной on-device версии до флагмана на 2,7B параметров, способного генерировать полноценные треки длиной более шести минут.