Следующий этап проекта «Сохрани родной язык», инициированного Национальной библиотекой республики и АГИКИ в феврале этого года, стартует осенью.
В рамках проекта был создан портал voice.nlrs.ru, главная цель которого — сбор аннотированных аудиозаписей. Институт и библиотека подготавливают тексты на якутском языке, после чего любые носители языка могут записывать аудиозаписи с чтением этих фрагментов через портал.
Заместитель директора Национальной библиотеки республики Василий Борисов отметил, что теперь стоит задача разработки синтеза и распознавания речи на якутском языке. Он добавил, что начиная с сентября-октября будет использован собранный за предыдущие полгода объем данных.
Также отмечается, что аудиозаписи, полученные на портале, проходят проверку.
«Любой носитель языка может проверять записи. Если пользователь считает, что аудиозапись хорошая и соответствует прочитанному тексту, он может поставить ей высокую оценку», — сказал Борисов.
По сообщениям, с момента запуска портала было собрано около 11,45 тысяч аудиозаписей, и более 11 тысяч из них успешно прошли проверку. Проект реализуется в рамках федеральной программы «Приоритет-2030. Дальний Восток».
В дальнейшем с помощью этих голосовых записей искусственный интеллект будет способствовать изучению языка, переводу, озвучиванию текстов, созданию аудиокниг, видео и другого контента, а также генерированию оригинального контента на якутском языке.
«Применение новых технологий — ключ к сохранению языка. Такие технологии используются для всех распространенных языков мира, и наша задача — сделать так, чтобы якутский язык также имел серьезную технологическую поддержку для своего развития», — добавил Василий Борисов.