Национальная библиотека Якутии запустила проект по обучению ИИ чтению книг на якутском языке

52

Правильным ударениям искусственный интеллект быстро научится и скоро начнёт говорить на якутском языке. Новый проект "Истинг" или "Слушайте" запустили в Национальной библиотеке Якутии для сохранения языкового богатства народов республики.

Пробную озвучку записали сами сотрудники библиотеки, но чтобы нейросеть быстрее обучалась правильному произношению, ей нужно как можно больше примеров. Для этого совместно с Арктическим институтом культуры и искусств создаётся банк аудиозаписей.

"Мы туда выкладываем небольшие отрывки текста, а наши читатели включают микрофон и их зачитывают, именно тот фрагмент, который сейчас на экране. Мы таким образом собираем набор данных и с помощью этого набора данных обучаем искусственный интеллект, чтобы он читал текст на якутском языке", - отметил Василий Борисов, ведущий библиотекарь Национальной библиотеки РС(Я).

Главным произведением, которое в будущем зазвучит голосом нейросети, должен стать героический эпос "Олонхо". Шедевр нематериального наследия человечества первым озвучил Глава Якутии Айсен Николаев, прочитав отрывок произведения своего деда — народного сказителя Андрея Титарова.

Работу по оцифровке книг в Национальной библиотеке ведут уже более 20 лет. Ежедневно сотрудники сканируют до тысячи страниц, проверяя качество изображения и хронологический порядок.

"У меня в руках книга известного якутского писателя Ивана Гоголева "Чёрный стерх", и, судя по её состоянию, она очень востребована у читателей. Раньше, чтобы с ней ознакомиться, нужно было прийти в библиотеку, а теперь достаточно открыть браузер и прочитать из любой точки мира. А совсем скоро, благодаря искусственному интеллекту, можно будет ещё и послушать", - Анна Лебединская, корреспондент.

Помимо книг, в лаборатории с помощью специальных сканеров создают 3D копии различных изделий: фигурок, одежды, утвари - своеобразный цифровой музей.

"Не у многих есть возможность посещать музеи Якутии, не у многих есть возможность детально посмотреть, увидеть, как выглядит, допустим, орнамент на чорооне. И всё это у нас здесь, в центре цифровизации культурного и языкового наследия, делают наши специалисты", - сказала Аина Прибылых, заведующая медиа-центром Национальной библиотеки РС(Я)

Параллельно с обучением нейросети, сотрудники Национальной библиотеки помогают известному в России поисковому сервису в создании якутско-русского переводчика. Это станет хорошим подспорьем для тех, кто планирует или уже учит язык крупнейшего региона страны.