Дикторы попросили Госдуму защитить их голоса от копирования искусственным интеллектом
Союз спикеров парламента России направил письмо главе комитета Госдумы по информационной политике Александру Хинштейну — организация рекомендует возглавляемому им комитету разработать специальный регламент по технологии синтеза речи с использованием искусственного интеллекта (искусственного интеллекта). Об этом пишет «Коммерсантъ» со ссылкой на копию обращения к депутату.
Союз спикеров подтвердил подлинность письма, которое, по словам самого Хинштейна, не было получено. Авторы письма сообщают о методах воспроизведения голоса человека на основе записей для использования в голосовых помощниках, онлайн-синтезаторах и других целях. по их мнению, получать синтетические голоса станет дешевле, чем записывать дикторов, а многие дикторы потеряют работу.
Диктор записывает факты «кражи» голоса с помощью ИИ. «Нет нормы, нет практики, нет понимания того, как писать претензию. Клиент ссылается на пункты договора, которые имеют права уступки, права распоряжения и передачи третьим лицам», — пишут авторы обращения. Члены Союза предлагают принять закон, запрещающий передачу прав исполнителей при использовании синтеза речи и по аналогии с защитой прав на товарные знаки и правил звукозаписи перейти на лицензионные договоры «с четко определенным сроком действия». Синтезированная речь может использоваться только в определенные проекты.
Как ранее сообщал «Коммерсантъ», в озвучивании аудиокниг стали активно внедряться инструменты искусственного интеллекта; это может снизить затраты и ускорить производственный процесс. «Издателям нужны дикторы, чтобы обеспечить качественный дубляж по доступной цене — защищая карьеру, которую многие делали годами», — сказал Николай Боронин, руководитель аудиопроектов Alpina Digital. По его словам, у владельца или разработчика искусственного интеллекта должен быть контракт на использование голоса. Собеседники признают, что от откровенного пиратства не застрахован никто.
Издательская группа «Эксмо-АСТ» назвала опасения диктора «не совсем обоснованными». Служба новостей издателя сообщила, что SpeechKit, сервис Яндекса, который работает с группой, заключил сделку с диктором, чей голос синтезируется. Качество автоматических звуков не может быть достигнуто без личного участия экспертов, звуки которых подбираются по специальным параметрам, добавляемым в группу.
Дмитрий Теплицкий, руководитель VS Robotics (Speech-Based Solutions), отмечает, что теоретически возможно синтезировать чей-то голос без длинных записей — «записей выступлений на основе отрывков из фильмов публичных выступлений». По его словам, для создания такого звука важно, чтобы запись была максимально чистой и сопровождалась расшифровкой. На практике, по словам Теплицкого, для создания новых голосов преобразования текста в речь компании выбирают спикеров и записывают их живую речь в течение пяти и более часов.
Генеральный директор НТЦ Дмитрий Дырмовский отметил, что ведущие компании в области голосовых технологий обеспокоены законностью использования голоса «и этикой искусственного интеллекта в целом». Голоса нельзя «дублировать», считает Юрий Федюкин, управляющий партнер Enterprise Legal Solutions. По его словам, закон защищает не звук, а "фонограммы, созданные с его использованием". Юристы отмечают, что менять законодательство в России нет смысла: в случае введения запрета обращение с фонограммами вещателя будет передано другим странам.