В распознавании образов достигнут серьезный успех

12.04.2004, ПН, 02:16, Мск

Специалисты Массачусетского технологического института (MIT) сообщают о существенном прогрессе в понимании принципов распознавания образов (в частности, изображений лиц) человеком. Новое достижение позволит существенно повы Суть открытия, сделанного в MIT, в следующем. Представим снимок, на котором изображена цепочка бегущих марафонцев. Лица первых из них наблюдатель может различить вполне отчетливо, однако даже лица самых удаленных, плохо различимых на снимке бегунов также с уверенностью идентифицируются наблюдателем именно как "человеческие лица". При этом, однако, на них содержится очень мало визуальной информации, по которой объект можно было бы идентифицировать как лицо человека - при большом увеличении мы увидим просто размытые пятна, практически лишенные деталей. Тем не менее, мы с легкостью понимаем, что видим в данном случае именно лицо человека. Для компьютеров, даже самых мощных, подобная задача пока что не под силу. Они уже сейчас неплохо справляются с задачей идентификации человеческих лиц на качественных изображениях, однако при падении качества снимков их эффективность стремительно падает, и до человека им далеко.

Профессор факультета когнитивных исследований и мозга (Department of Brain and Cognitive Sciences, BCS) Паван Синха (Pawan Sinha) и его коллеги показали, что та область мозга, которая активируется при наблюдении отчетливо видимых человеческих лиц, также активируется и при разглядывании очень размытых объектов неопределенных очертаний - но лишь в той мере, в какой на изображении присутствуют окружающие эти пятна объекты, позволяющие однозначно интерпретировать "пятна" как "лица". "Иными словами, - поясняет г-н Синха, - нейронные сети мозга человека могут использовать контекст образов для компенсации даже крайне значительной деградации изображений".

Исследования человеческого поведения, а также работы многих художников уже позволили ученым сделать вывод, что контекст изображения играет существенную роль в его распознавании. "Новизна работы, - говорит Синха, - в том, что получено прямое подтверждение того, что особенности контекста изображения вызывают характерный для объектов определенного рода отклик нейронной сети".

Для картографирования нейронных откликов в так называемом "веретеновидном лицевом участке" мозга (fusiform face area, FFA) при просмотре различных изображений ученые использовали метод функционального магнитного резонанса. Использовались четкие изображения лиц, размытые изображения лиц без тел, тела без лиц, а также размытые изображения лиц, помещенные в неверный графический контекст.

В ходе исследований обнаружилось, что сильный отклик в области FFA вызывает только просмотр четких изображений лиц, а также размытых лиц в правильном контексте. Тем самым получено подтверждение давней идеи о том, что распознавание строится не только на выделении характерных особенностей собственно лица, но и на обработке информации, относящейся к контексту.

Помимо развития принципов автоматического распознавания образов, открытие поможет усовершенствовать методы диагностики ряда неврологических заболеваний - таких, как аутизм, который связан с ухудшением способностей объединения разнородной информации.