Skip to Content

ПОКА 55 ТЫСЯЧ, НО ЭТО ТОЛЬКО НАЧАЛО

В работе над электронным ресурсом «Национальный корпус удмуртского языка» сотрудники Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН создают новые технологии в лингвистике
По словам и.о. руководителя УИИЯЛ УдмФИЦ УрО РАН И.Л. Поздеева, программисты продолжают наполнение базы данных: «Сейчас наша основная задача — полностью автоматизировать работу: то есть чтобы программа при вводе текста сама проверяла его на ошибки, преобразовала слова и вводила их в корпус… Мы надеемся, что через несколько лет у нас будет переводчик с технологией нейросетей, когда текст вводится целиком, скажем, на русском языке, а программа переводит на удмуртский язык». 
Уже сейчас пользователям доступны полезные функции национального корпуса языка. На сайте http://udmcorpus.udman.ru/home есть подробный словарь, способствующий точному переводу многих слов. В корпусе уже находятся 55 тысяч слов с толкованием и примерами употребления. После того как в него будут введены все удмуртские слова и их формы, появится возможность для создания интерактивных сервисов по переводу и озвучиванию текстов на удмуртском. Одним из таких новшеств станет робот, проговаривающий текст на удмуртском языке.
По материалам сайта УИИЯЛ УдмФИЦ УрО РАН
подготовила Е. Изварина
Год: 
2020
Месяц: 
июль
Номер выпуска: 
13-14
Абсолютный номер: 
1216
Изменено 22.07.2020 - 10:33


2021 © Российская академия наук Уральское отделение РАН
620049, г. Екатеринбург, ул. Первомайская, 91
document@prm.uran.ru +7(343) 374-07-47