Ученые Новосибирского государственного университета (НГУ) разработали инновационный сервис, который автоматически создает аудиоверсии научной литературы с использованием нейросетей. Это новшество позволяет значительно ускорить процесс озвучивания, превращая текст из научных публикаций в звук в 16 раз быстрее, чем традиционное чтение диктором.
Сервис извлекает текст из PDF-файлов, обрабатывает его и создает звуковую версию. Он не претендует на полную замену дикторского чтения, а предоставляет альтернативный способ доступа к текстам, что особенно актуально для студентов и ученых.
На данный момент сервис прошел этап апробации, и уже озвучено более 100 книг. Разработчики планируют расширить проект и перевести в аудиоформат все книги, представленные в электронной библиотеке НГУ, что составляет около 7 тысяч изданий.
Этот сервис использует фреймворк "Каппа", разработанный в Центре искусственного интеллекта НГУ. Он позволяет тестировать и управлять моделями ИИ, снижая риски ошибок при создании аудиоформатов. Разработчики уверены, что в будущем такие технологии смогут сделать научную литературу еще доступнее для широкой аудитории.
Согласно планам, проект будет расширен на другие библиотеки после успешного завершения пилотного этапа.
