Ru | En
ПОКА 55 ТЫСЯЧ, НО ЭТО ТОЛЬКО НАЧАЛО
В работе над электронным ресурсом «Национальный корпус удмуртского языка» сотрудники Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН создают новые технологии в лингвистике
По словам и.о. руководителя УИИЯЛ УдмФИЦ УрО РАН И.Л. Поздеева, программисты продолжают наполнение базы данных: «Сейчас наша основная задача — полностью автоматизировать работу: то есть чтобы программа при вводе текста сама проверяла его на ошибки, преобразовала слова и вводила их в корпус… Мы надеемся, что через несколько лет у нас будет переводчик с технологией нейросетей, когда текст вводится целиком, скажем, на русском языке, а программа переводит на удмуртский язык».
Уже сейчас пользователям доступны полезные функции национального корпуса языка. На сайте http://udmcorpus.udman.ru/home есть подробный словарь, способствующий точному переводу многих слов. В корпусе уже находятся 55 тысяч слов с толкованием и примерами употребления. После того как в него будут введены все удмуртские слова и их формы, появится возможность для создания интерактивных сервисов по переводу и озвучиванию текстов на удмуртском. Одним из таких новшеств станет робот, проговаривающий текст на удмуртском языке.
По материалам сайта УИИЯЛ УдмФИЦ УрО РАН
подготовила Е. Изварина
Год:
2020
Месяц:
июль
Номер выпуска:
13-14
Абсолютный номер:
1216