Ученые Удмуртского федерального исследовательского центра Уральского отделения Российской академии наук разработли синтезатор удмуртской речи, позволяющий преобразовывать любой печатный текст на удмуртском языке в стандартный звуковой файл, который можно прослушать на компьютере, телефоне, смартфоне или любом другом подобном цифровом устройстве.
Эта работа — итог взаимодействия сотрудников двух научных подразделений УдмФИЦ УрО РАН: лингвистов Удмуртского института истории, языка и литературы и специалистов в области искусственного интеллекта лаборатории машинного обучения и обработки «больших» данных производственных киберсистем. Такой результат стал возможным благодаря созданному учеными УдмФИЦ УрО РАН в 2019 году Национальному корпусу удмуртского языка, позволяющему широко использовать удмуртский в компьютерных технологиях (распознавателях и синтезаторах речи, навигаторах, автоматических переводчиках и т.д.).
Синтезатор удмуртской речи разработан на основе глубокой нейронной сети Tacotron. Для обучения нейросети были задействованы мощные ресурсы вычислительного кластера Института математики и механики УрО РАН (Екатеринбург) и использованы специально подготовленные тексты, озвученные Светланой Пикулевой — профессиональной ведущей радио «Моя Удмуртия». Таким образом, удмуртская речь, сгенерированная синтезатором, воспроизводится сегодня голосом известной радиоведущей.
— Пока мы говорим только о первой версии синтезатора, — рассказывает младший научный сотрудник лаборатории машинного обучения и обработки «больших» данных производственных киберсистем УдмФИЦ УрО РАН Григорий Григорьев. — Данная нейронная сеть проста и хорошо обучаема. Она выдает приемлемый результат, но, возможно, пока еще не такой совершенный и естественный. Например, по синтезированным нейронной сетью предложениям на удмуртском языке можно определить, что говорит не человек, а программа. В дальнейшем мы планируем использовать более совершенную нейронную сеть следующего поколения, которая сможет генерировать искусственный голос, неотличимый от голоса реального человека. В настоящее время ведется работа по интеграции обученной нейронной сети синтезатора удмуртской речи и сайта Национального корпуса удмуртского языка. Уже вскоре синтезатор должен появиться в открытом доступе.