... Как милый образ распознать?

 
 

В марте этого года стали известны имена молодых ученых, получивших гранты Президента Российской Федерации. В числе победителей всероссийского конкурса — руководитель сектора распознавания образов Института математики и механики УрО РАН и профессор кафедры математической экономики математико-механического факультета УрГУ, тридцатипятилетний доктор физико-математических наук Михаил Юрьевич Хачай.


 



 

Доктор физико-математических наук Михаил Юрьевич Хачай.   О своей работе и связанных с ней научных интересах и практических решениях Михаил Юрьевич рассказывает:

   
— То, чем я занимаюсь, — математическая теория распознавания образов — возникла, должно быть, одновременно с теорией искусственного интеллекта, являясь одним из ее разделов. Специалисты по распознаванию образов пытаются построить алгоритмы, повторяющие элементы человеческого мышления (прежде всего — абстрактного) и предшествующего ему обучения на конкретных примерах. По-видимому, одна из первых задач распознавания образов была сформулирована в работах биолога Ф.Розенблатта, посвященных имитации зрительного анализатора. Потребовалось построить алгоритм распознавания простейших изображений — например, цифр или букв. И до сих пор задачи такого рода остаются в распознавании образов наиболее популярными. Другими задачами, в которых эффективными оказываются подходы распознавания образов, являются задачи анализа больших массивов эмпирических данных. К примеру, нам иногда приходится помогать медикам — в частности, с математическим обеспечением дифференциальной диагностики. В этом случае в качестве объектов для распознавания выступают таблицы, содержащие огромное количество цифр — результатов различных медицинских исследований. Так, общий анализ крови человека включает порядка пятидесяти разных показателей, изучив которые, врач должен принять какое-то решение. Хороший врач, как правило, принимает это решение, опираясь на свой профессиональный опыт. Вот и наша задача была — построить такой алгоритм принятия решения, чтобы, основываясь на прежнем опыте (базах данных по реальным историям болезни), опознавать новые случаи, помогая практикующему врачу с постановкой диагноза.
 

— То есть искусственный интеллект алгоритмически должен повторять человеческий?
 

— В том-то и дело, что мы до сих пор не совсем представляем себе, как построен человеческий интеллект. Но мы точно знаем, что человек учится на прецедентах, методом проб и ошибок. И разрабатываемые нами алгоритмы строятся похожим образом.
 

— Судя по списку ваших научных публикаций, вам приходилось работать и с экономистами…
 

— Должен признаться, что сам я конкретными приложениями занимаюсь мало. Однако несколько лет назад я входил в состав исполнителей одного регионального проекта, руководил которым мой учитель, профессор Владимир Данилович Мазуров. Целью данного проекта была классификация различных регионов УрФО по ряду макроэкономических показателей. Требовалось построить математические решающие правила для обработки статистических данных, характеризующих развитие отдельных отраслей экономики.
 

Мне более интересны математические задачи, связанные с дискретной оптимизацией, с теорией сложности алгоритмов, статистическими задачами принятия решений. Допустим, для обучения предоставлен некий материал. В случае медицинской диагностики это может быть обширная база данных по обследованию больных и здоровых людей. Наша задача – на ее основе построить алгоритм, некое решающее правило, которое можно впоследствии использовать для диагностики. Причем главной проблемой является экстраполяционная (обобщающая) способность этого правила: с какой вероятностью оно будет правильно классифицировать нового пациента, данные о котором не использовались при обучении? По мере развития теории распознавания образов появляются все более совершенные алгоритмы и математические утверждения, позволяющие прогнозировать, что при каких-то условиях заданный алгоритм будет выдавать именно те значения, которые мы ожидаем. Как раз в этом направлении и удается получать довольно любопытные результаты. Здесь следует упомянуть заслуги советских математиков В.Н. Вапника, А.Я. Червоненкиса, Ю.И.Журавлева и др. Свердловская школа распознавания образов, родоначальником которой является профессор Вл.Д.Мазуров (к которой я с гордостью отношу и себя) является одной из ведущих в России. Разработанная здесь теория комитетных алгоритмов распознавания опирается на результаты Сергея Николаевича Черникова и Ивана Ивановича Еремина по теории линейных неравенств и математического программирования.
 

— Какова предыстория получения вами президентского гранта 2006 года?
 

— В функционировании искусственного интеллекта различаются две основных фазы: фаза обучения, как правило, длительная по времени, и более быстрая фаза применения алгоритма. Всегда хочется заранее знать количество компьютерного времени, которое потребуется для того, чтобы наш алгоритм приобрел желаемое качество. В этом состоит его так называемая вычислительная сложность. Понятно, что если даже новый алгоритм теоретически очень хорош (когда получаемое в результате обучения решающее правило обладает высокой обобщающей способностью), но фаза обучения при современном состоянии техники измеряется, допустим, тысячами лет — то этот алгоритм, к сожалению, неприменим на практике. Вот меня и заинтересовала задача оценки вычислительной сложности обучения различных классов алгоритмов распознавания образов. Собственно, эта работа уже не связана непосредственно с теорией распознавания образов, относясь скорее к дискретной математике, однако инициирована она именно задачами распознавания.
 

— То есть найденные вами решения применяются в более широкой области задач?
 

— Совершенно верно. Они дают ответ на вопрос: можно ли для решения данной задачи в нашем классе решающих правил построить такой алгоритм, который будет уметь обучаться за время, оцениваемое некой не очень быстро растущей функцией от длины исходной базы эталонов, которая используется на этапе обучения. Если удается получить такую оценку временной сложности — считается, что задача обучения решена.
 

Либо задача попадает в разряд так называемых трудных задач, для которых по общепринятой гипотезе не существует эффективных (полиномиальных) алгоритмов решения.
 

— Насколько разрешимой в настоящее время вам видится комплексная задача создания искусственного интеллекта?
 

— Думаю, что на современном этапе развития вычислительной техники эта задача пока неразрешима. Однако в частных случаях компьютерный мозг может работать ничуть не хуже человеческого. Например, американская почтовая служба объявила конкурс на создание наиболее точно работающего алгоритма по распознаванию рукописных цифр для автоматизации обработки корреспонденции. Для чистоты эксперимента эмпирические массивы, предназначенные для обучения и тестирования алгоритмов, были фиксированы заранее. В результате были созданы алгоритмы, обеспечившие меньший процент ошибок на контроле, чем человек-эксперт.
 

Что же касается будущего идеи искусственного интеллекта… Уже сегодня много говорится о так называемых квантовых вычислениях и квантовых компьютерах. Возможно, когда квантовые машины станут реальностью, мы и подойдем к решению этой задачи.
 

— В прессе встречается мнение, что завоевание космоса осуществляется значительно медленнее, чем предполагалось, поскольку даже богатейшие сверхдержавы сейчас не могут его финансировать. Можно ли сказать, что и создание машинного разума требует колоссального (и пока недостижимого) сосредоточения средств?
 

— Боюсь, что здесь проблема сложнее. Как мне кажется, она заключается не только и не столько в финансовом, сколько в теоретическом, научном обеспечении. К сожалению, в теоретической науке задачи не решаются только путем денежных вливаний…
 

— Докторскую диссертацию вы защитили в 35 лет. Должно быть, рано начали заниматься наукой?
 

— Интерес к распознаванию образов привил мне мой учитель, Владимир Данилович Мазуров. Он читал у нас, студентов математико-механического факультета УрГУ соответствующие спецкурсы, затем руководил моими курсовыми и дипломной работами. По окончании университета я поступил к нему в аспирантуру, одновременно начав работу в Институте математики и механики УрО РАН. Вообще между нашим институтом и математико-механическим факультетом еще со времен Сергея Борисовича Стечкина установилась очень тесная связь. Большинство ведущих научных сотрудников преподают в университете, студенты, в свою очередь, приобщаются к науке, а институт получает молодые кадры — существует взаимная заинтересованность, и она оправдывается.
 

— Часто ли вам случается выезжать на научные форумы, общаться с иногородними, зарубежными коллегами?
 

— Примерно раз в год или чуть чаще приходится бывать на всероссийских или международных конференциях. У нас в стране периодически созываются две конференции по распознаванию: «Математические методы распознавания образов» и «Распознавание образов и анализ изображений». Оргкомитетом в обоих случаях руководит академик Юрий Иванович Журавлев, известный ученый, классик в нашей области.
 

Конечно же, участие в такого рода встречах очень важно. Правда, сейчас, с глобальным проникновением во все сферы жизни Интернета, необходимость в личном общении коллег уменьшается, многие вопросы решаются в переписке. Благодаря средствам связи нам доступны самые современные работы по нашей тематике, публикующиеся по всему миру. И здесь с сожалением приходится констатировать, что сегодня наиболее интересные результаты чаще появляются за рубежом.
 

— Каким же странам принадлежит первенство?
 

— Сейчас много говорят о глобализации, причем с точки зрения рядового обывателя — чаще всего с негативным оттенком. Но для научного работника глобализация — скорее некое чудо, огромное подспорье. Когда на международных форумах встречаются единомышленники — исследователи, занимающиеся одной и той же задачей, интересующиеся одной и той же темой, — страна, в которой они живут в настоящее время, как правило, не имеет значения. Более того, центрами общения коллег по отдельным проблемам все чаще выступают специальные веб-порталы, расположенные, как правило, там, где их просто удобнее было открыть: в Америке, в Австралии, очень много таких серверов в Европе. Поэтому сейчас уже не важно выяснять уровень и влияние математиков какой-либо одной страны в данной дисциплине.
 

В России сложилось достаточно сильное, уважаемое в мире сообщество ученых, занимающихся теорией распознавания образов, идейными руководителями которого являются: академик Ю.И. Журавлев, член-корреспондент К.В. Рудаков из Москвы, профессоры Г.С. Лбов из Новосибирска, В.Д. Мазуров и многие другие, перечислять можно долго. Ближайшая конференция, на которой должно собраться это сообщество, состоится в начале июня в Алуште, и я, конечно же, планирую туда поехать…
 


Беседовала Е. ИЗВАРИНА.
 

 

 

25.05.06

 Рейтинг ресурсов