Бум аудиокниг: В 2023 году появится 10 тысяч озвученных ИИ текстов
Компания по предоставлению цифровых, медийных и телекоммуникационных сервисов «МТС», в которую входит книжный сервис «Строки», сообщила о старте проекта по озвучиванию до 10 тысяч произведений с помощью технологий искусственного интеллекта, запущенного MTS AI.
Создание аудиокниг из текстовых произведений MTS AI осуществит на основе возможностей собственной платформы для распознавания и синтеза речи Audiogram. В этом продукте используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP). Платформа позволяет записывать аудиопроизведения в распространенном формате EPUB.
«В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенно сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа», — комментирует технический директор MTS AI Дмитрий Буланцев.
Возможности платформы позволяют не только синтезировать речь, но и правильно расставлять ударения и паузы, воспроизводить интонации, характерные для текстов, в том числе вопросительные, побудительные.
Как сообщают в компании, технология MTS AI для озвучивания текстов и платформа для распознавания и синтеза речи Audiogram может использоваться не только для озвучивания книг, но и в образовательных процессах, в том числе в EdTech, для подготовки аудиолекций, для озвучивания видео, статей, для создания материалов для людей с ограниченными возможностями, в том числе слабовидящих.