Музыкальная индустрия разрабатывает технологии для отслеживания песен, созданных ИИ
Кошмар музыкальной индустрии стал реальностью в 2023 году, и он звучал очень похоже на Дрейка.
«Heart on My Sleeve», убедительно поддельный дуэт Дрейка и The Weeknd, набрал миллионы прослушиваний, прежде чем кто-либо смог объяснить, кто его создал или откуда он появился. Трек не просто стал вирусным — он разрушил иллюзию, что кто-то контролирует ситуацию.
В попытке реагирования на это, новая категория инфраструктуры тихо формируется, и её цель — не остановить генеративную музыку, а сделать её отслеживаемой. Системы обнаружения внедряются по всей цепочке создания музыки: в инструменты, используемые для обучения моделей, на платформы, где загружаются песни, в базы данных, лицензирующие права, и в алгоритмы, формирующие рекомендации. Цель — не просто выявить синтетический контент после его появления, а идентифицировать его на ранних этапах, добавить метаданные и управлять его движением через систему.
«Если вы не встроите это в инфраструктуру, вы будете гоняться за собственным хвостом», — говорит Мэтт Аделл, соучредитель Musical AI. «Вы не можете продолжать реагировать на каждый новый трек или модель — это не масштабируется. Вам нужна инфраструктура, которая работает от обучения до распространения».
Цель — не удаление, а лицензирование и контроль
Стартапы появляются, чтобы внедрить обнаружение в процессы лицензирования. Платформы, такие как YouTube и Deezer, разработали внутренние системы для пометки синтетического аудио при его загрузке и управления тем, как оно появляется в поиске и рекомендациях. Другие музыкальные компании, включая Audible Magic, Pex, Rightsify и SoundCloud, расширяют функции обнаружения, модерации и атрибуции во всем, от обучающих наборов данных до распространения.
В результате формируется фрагментированная, но быстро растущая экосистема компаний, которые рассматривают обнаружение контента, созданного ИИ, не как инструмент правоприменения, а как базовую инфраструктуру для отслеживания синтетических медиа.
Вместо того чтобы обнаруживать музыку, созданную ИИ, после её распространения, некоторые компании создают инструменты для её пометки с момента создания. Vermillio и Musical AI разрабатывают системы для сканирования готовых треков на предмет синтетических элементов и автоматического добавления метаданных.
Рамка TraceID от Vermillio идет дальше, разбивая песни на компоненты — например, вокальные тона, мелодические фразы и лирические паттерны — и помечая конкретные сегменты, созданные ИИ, что позволяет правообладателям обнаруживать имитацию на уровне компонентов, даже если новый трек заимствует только части оригинала.
Компания говорит, что её фокус — не удаление, а активное лицензирование и аутентифицированный выпуск. TraceID позиционируется как замена систем, таких как Content ID от YouTube, которые часто пропускают тонкие или частичные имитации. Vermillio оценивает, что лицензирование, аутентифицированное с помощью таких инструментов, как TraceID, может вырасти с 75 миллионов долларов в 2023 году до 10 миллиардов долларов в 2025 году. На практике это означает, что правообладатель или платформа может пропустить готовый трек через TraceID, чтобы увидеть, содержит ли он защищенные элементы, и, если это так, система пометит его для лицензирования перед выпуском.
«Мы пытаемся количественно оценить творческое влияние, а не просто поймать копии».
Некоторые компании идут ещё дальше, обращаясь к самим обучающим данным. Анализируя, что входит в модель, их цель — оценить, насколько сгенерированный трек заимствует у конкретных исполнителей или песен. Такой вид атрибуции может позволить более точное лицензирование, с гонорарами, основанными на творческом влиянии, а не на спорах после выпуска. Идея перекликается с старыми дебатами о музыкальном влиянии — например, иск «Blurred Lines» — но применяет их к алгоритмическому поколению. Разница сейчас в том, что лицензирование может произойти до выпуска, а не через судебные разбирательства после факта.
Musical AI также работает над системой обнаружения. Компания описывает свою систему как многослойную, охватывающую загрузку, генерацию и распространение. Вместо фильтрации выводов она отслеживает происхождение от начала до конца.
«Атрибуция не должна начинаться, когда песня готова — она должна начинаться, когда модель начинает обучаться», — говорит Шон Пауэр, соучредитель компании. «Мы пытаемся количественно оценить творческое влияние, а не просто поймать копии».
Deezer разработал внутренние инструменты для пометки полностью сгенерированных ИИ треков при загрузке и снижения их видимости в алгоритмических и редакционных рекомендациях, особенно если контент выглядит спамным. Главный инновационный директор Aurélien Hérault говорит, что по состоянию на апрель эти инструменты обнаруживали примерно 20 процентов новых загрузок каждый день как полностью сгенерированные ИИ — более чем вдвое больше, чем в январе. Треки, идентифицированные системой, остаются доступными на платформе, но не продвигаются. Hérault говорит, что Deezer планирует начать маркировку этих треков для пользователей напрямую «через несколько недель или несколько месяцев».
«Мы вовсе не против ИИ», — говорит Hérault. «Но большая часть этого контента используется недобросовестно — не для творчества, а для эксплуатации платформы. Вот почему мы уделяем этому столько внимания».
Протокол DNTP (Do Not Train Protocol) от Spawning AI продвигает обнаружение ещё раньше — на уровне набора данных. Протокол отказа позволяет художникам и правообладателям обозначить свои произведения как запрещенные для обучения моделей. В то время как визуальные художники уже имеют доступ к подобным инструментам, мир аудио всё ещё догоняет. Пока что мало консенсуса о том, как стандартизировать согласие, прозрачность или лицензирование в масштабе. Регулирование может в конечном итоге заставить решить этот вопрос, но пока подход остается фрагментированным. Поддержка со стороны крупных компаний, занимающихся обучением ИИ, также была неоднозначной, и критики говорят, что протокол не получит распространения, если он не будет управляться независимо и широко принят.
«Протокол отказа должен быть некоммерческим, контролируемым несколькими разными участниками, чтобы ему можно было доверять», — говорит Драйхерст. «Никто не должен доверять будущее согласия непрозрачной централизованной компании, которая может обанкротиться — или, что еще хуже».