Skip to Content

ОБЪЯСНИТЬ МАШИНЕ, КАК УСТРОЕН МИР

Молодой ученый из Института математики и механики УрО РАН Дмитрий Усталов вместе с коллегами из Германии разрабатывает методы, которые позволят улучшить качество понимания компьютерами текста и связей между словами. Полученные результаты будут способствовать созданию систем искусственного интеллекта. В прошлом году работа ученого уже была отмечена премией губернатора Свердловской области. Значительной оказалась и поддержка проекта исследований со стороны Microsoft — грант от компании в размере 20 тысяч долларов позволил получить доступ к инфраструктуре, критически важной для дальнейшей работы. Подробнее о проекте корреспонденту «НУ» рассказал сам Дмитрий.
— Я занимаюсь компьютерной лингвистикой и задачами машинного понимания текста. Поясню на примере: имеется некий текст, в котором есть слова, и машине нужно определить, в каких значениях употреблены эти слова и какие существуют между ними смысловые связи. В частности, речь может идти о родо-видовых отношениях, допустим: человек — это и млекопитающее, и личность. Возможность точнее определить понятия позволяет лучше представить, о чем тот или иной документ. В целом такие задачи помогают машине понимать тексты и взаимоотношения объектов реального мира.
Заявка на грант Microsoft — наша совместная идея с коллегами из Дармштадтского технического университета, к которым в прошлом году я ездил на стажировку по стипендии Германской службы академических обменов. Поездка была удачной, и мы решили продолжить работу. Для решения наших задач было необходимо мощное оборудование. С каждым днем компьютерная лингвистика и связанные с ней области требуют все больше вычислительных мощностей для построения статистических моделей и подбора их параметров. Для хранения данных необходимы значительные объемы памяти. Все эти ресурсы, как правило, дорогие.
У Microsoft есть так называемая облачная платформа Azure — сервис, за плату предоставляющий вычислительные мощности во временное пользование. И существует программа грантов Azure for Research Award, которая позволяет исследовательским группам пользоваться оборудованием бесплатно. На лицевой счет зачисляется некоторая сумма, которой можно оплачивать услуги сервиса. С учетом наших требований выделенных средств нам хватит ровно на год.
— Необходимые мощности имеются только у таких крупных фирм, как Microsoft, или они создаются и в исследовательских учреждениях?
— Есть программы финансирования вычислительных центров и центров коллективного пользования в университетах и академических институтах. Там, как правило, используется такое же дорогое оборудование, как и в дата-центрах крупных IT-компаний, но выполнение задач идет в пакетном режиме. Среди пользователей институтов или внешних заказчиков формируется очередь задач, которая затем последовательно соблюдается без возможности внести какие-либо оперативные изменения. Похоже на конвейер. На входе есть команда, машина начинает ее выполнять, и пока не закончит, все заблокировано. 
В нашем случае мы могли бы воспользоваться кластером «УРАН» Института математики и механики УрО РАН или кластером, расположенным в Уральском федеральном университете, но они оба ориентированы на пакетную обработку данных. А наши задачи связаны с интерактивной обработкой: нам нужно зайти на машину, попробовать разные вещи, посмотреть результаты и, возможно, что-то поменять. Такой подход создал бы огромные неудобства всем остальным пользователям здешних суперкомпьютеров. А грант позволяет нам не отвлекать других пользователей.
— Взаимодействуете ли вы с филологами?
— Да, мы тесно работаем с коллективом лингвистов Уральского федерального и Санкт-Петербургского государственного университетов, которые обсуждают с нами результаты, помогают нам в подготовке данных и оценке того, насколько хорошо или плохо работают те или иные варианты разрабатываемых нами методов.
Лингвистика — наука строгая, но не точная. Поэтому мы обсуждаем с коллегами допущения о языке — нюансы, которые иногда приходится проигнорировать, что упрощает построение той или иной модели. Ведь для понимания того, о чем идет речь в тексте, необязательно знание всех особенностей языка.
— Компьютерная лингвистика — направление в науке относительно новое. Должен ли человек, который хочет этим заниматься, одинаково хорошо разбираться в программировании и лингвистике?
— Путь, о котором вы говорите, больше распространен в академической среде. Есть люди, которые изначально занимались языкознанием, но поняли, что стоящие перед ними задачи можно более эффективно решать с помощью компьютеров. Такой вариант возможен. Есть и обратный путь. Основоположник машинного распознавания речи Фредерик Йелинек говорил: каждый раз, когда лингвист покидает коллектив, качество распознавания речи возрастает.
Я могу судить лишь по своему опыту и по опыту знакомых мне людей, занимающихся решением таких задач в коммерческих компаниях и не имеющих филологического образования. Компьютерная лингвистика по своей сути такова, что если вы способны разобраться в вещах, связанных с компьютерными науками — формальными грамматиками или математической статистикой, — то лингвистика пойдет у вас довольно легко. Закономерности в языках довольно легко формализуются и усваиваются, поэтому особых проблем при работе с ними на компьютере возникнуть не должно.
— Каким может быть практический выход исследования?
— Полученные результаты могут найти применение при разработке интеллектуальных систем. В этой сфере главная задача — «объяснить» машине, как устроен мир. Для этого есть специальные базы знаний, записанные на машинных языках, со сведениями о том, какие существуют виды объектов и как они подчинены друг другу. Например, здание — это строение, другие строения — это дом, сарай и т.д. Такие сведения при разработке интеллектуальных систем, нацеленных на понимание текста и взаимодействие с людьми, используются в первую очередь.
— Насколько подходы к разным языкам в компьютерной лингвистике универсальны?
— С каждым годом разница в языках для машин нивелируется. Методы, которые применяются сегодня, сильно отличаются от тех, что были популярны 10, 20 или 30 лет назад. Сегодня модели языка основываются на статистических закономерностях. Становится все менее важно, какой язык вы используете в качестве материала для исследования.
На стажировке мы занимались преимущественно английским языком. Но изначально задача распознавания отношений между словами была сформулирована для русского, поскольку для того, чтобы эти отношения предсказать или построить, соответствующих ресурсов и наборов данных для нашего языка было не слишком много. Нашей задачей было обобщить имеющиеся данные и сделать так, чтобы их стало больше, повысить их качество.
— В нынешнем проекте вы работаете с английским?
— И с английским, и с русским. Для этого есть одна серьезная причина. Хорошие научные конференции разбросаны по всему миру. Они есть в России, есть и в других странах. Когда вы заявляете доклад об обработке русского языка, в России его примут спокойно. Аналогичная заявка на конференцию, где участвуют люди, занимающиеся немецким, японским, арабским и другими языками, понимания не встретит. Если вы проверяли свою модель только на русском, то рецензенту из США или, например, Франции будет довольно трудно понять, насколько ваша модель хороша. Мир так сложился, что по-хорошему вы еще должны провести оценку на английском языке. Тогда вас поймут. Но в этом есть свои плюсы: вы заодно проверяете, нет ли где-то ошибки.
— Работа по гранту только началась, но что вы будете делать по истечении года?
— Попросим Microsoft о продлении финансирования… А если серьезно, то год — это достаточный срок. Эксперименты, которые мы сейчас проводим, оптимально нагружают оборудование. В течение года мы сможем расширить модель, объединить ее с другими нашими результатами и снизить системные требования для расчетов. Также мы планируем предоставить другим исследователям и разработчикам возможность пользоваться тем, что мы сделали, в гораздо более простых конфигурациях. Это важно, потому что не все могут себе позволить дорогое оборудование и машинное время на подбор параметров. Тем не менее преждевременная оптимизация — это плохо. Сначала надо сделать нечто работающее, а уже потом «сжать» это до разумных для практического использования пределов.
Беседу вел Павел КИЕВ
 
Год: 
2017
Месяц: 
март
Номер выпуска: 
5
Абсолютный номер: 
1152
Изменено 14.03.2017 - 16:29


2021 © Российская академия наук Уральское отделение РАН
620049, г. Екатеринбург, ул. Первомайская, 91
document@prm.uran.ru +7(343) 374-07-47