Напряженность между крупными технологическими компаниями и защитниками авторских прав продолжает нарастать. Федеральный суд Манхэттена постановил, что иск, поданный в апреле Джорджем Р.Р. Мартином (вместе с группой, состоящей из других авторов-авторов) против OpenAI и Microsoft, должен быть продолжен. Судья усмотрел достаточные признаки нарушения авторских прав.
По словам судьи Сидни Стейна, жалоба — это не просто несогласие с тем, как работают языковые модели. Результаты, полученные ChatGPT (в частности, предложение о продолжении четвертой книги саги «Битва королей»), имеют «существенное сходство« с охраняемой работой. То есть для суда существует реальная возможность того, что модель была обучена с использованием нелицензионных материалов, защищенных авторским правом, и что чат-бот воспроизводит ее в нетрансформированном виде.
Это продолжение… звучит для меня. В иске адвокаты попросили ChatGPT разработать схему альтернативного продолжения «Битвы королей», которое не следовало бы сюжету «Бури мечей». Модель ответила «Танцем теней», историей, в которую вошли неизвестная наследница Таргариенов, древняя магия драконов и секта Сынов леса. Хотя он отклонялся от канонических событий работы Мартина, стиль, элементы повествования и структура были достаточно близки, чтобы поднять тревогу.
У авторов есть четкий вывод: ИИ использует защищенные авторским правом произведения для создания производного контента без разрешения, компенсации или указания авторства. Это выступление соответствует тому, что мы уже видели в последние годы в других коллективных исках писателей, журналистов, иллюстраторов или музыкантов.
Проблемы для индустрии. Это дело рассматривается в контексте, который является особенно деликатным для технологических компаний:
- Anthropic собирается заключить сделку на 1,5 миллиарда долларов за массовую загрузку пиратских книг для обучения своей модели.
- Meta сталкивается с многочисленными судебными исками после того, как стало известно, что она загрузила более 80 ТБ защищенного контента из LibGen и Z-Library для обучения Лама.
- OpenAI уже проиграл первое судебное разбирательство в Германии, где было постановлено, что воспроизведение текстов песен, выученных во время обучения, нарушает права на эксплуатацию. Он сталкивается с потоком судебных исков
Дело Мартина усиливает давление в Соединенных Штатах, где такие СМИ, как The New York Times, также обвиняют OpenAI в использовании его статей без разрешения. Адвокат СМИ описывает это как прямую угрозу профессии: «Генеративный ИИ может наводнить рынок посредственными работами, основанными на наших текстах».
Последствия для индустрии. Решение суда не является обвинительным приговором, но является предупреждением правосудия: обучение моделей с защищенным контентом недопустимо без соглашений, лицензий и компенсаций. И если пример Anthropic войдет в тренд, экономические показатели могут стать рекордными.

