Семантическая сеть для распознавания визуальных образов

Распознавание визуальных объектов – сложная задача. Текущая технология компьютерного зрения хорошо справляется с распознаванием небольшого количества объектов, но перестает справляться в случае большого числа объектов, особенно если они принадлежат различным классам. Много работы сфокусировано на решение этих проблем, чтобы увеличить эффективность систем распознавания объектов. Недавняя работа из INRIA посвящена изучению семантических иерархий, закодированных в WordNet, чтобы улучшить существующие алгоритмы распознавания образов.

WordNet это большая семантическая сеть моделирования знаний  психолингвистики человека на основе английского языка (English language modeling human psycholinguistic knowledge), группирующая синонимы в синсеты (synset – множество, состоящее из синонимов) и записывающая различия между ними. Проще говоря, WordNet кодирует большое число отношений между объектами, как, например факт, что автомобиль и мотоцикл – средство передвижения с колесами, поэтому их присутствие на изображении подразумевает наличие колес. Такой подход используют Marcin Marszalek и Cordelia Schmid в их работе 2007 года CVPR (CVPR – Computer Vision and Pattern Recognition – Компьютерное зрение и распознавание паттернов) «Семантические иерархии для распознавания визуальных объектов».

Два исследователя показывают, как априорное знание о классах объектов и их отношениях, закодированное в WordNet, можно использовать для улучшения распознавания визуальных объектов, используя вспомогательные векторные машины (Support Vector Machines, SVM). Идея состоит в том, что у системы распознавания спрашивают: «На изображении есть машина?». Система делает запрос в WordNet об априорных знаниях, относящихся к понятию «машина». Семантическая сеть, полученная в результате, может содержать дополнительные знания о машинах, как, например, о том, что на изображении следует одно или несколько колес. Алгоритм распознавания объектов может точнее ответить на поставленный выше вопрос, если будет использовать специальный детектор машин и колес. Эксперименты показали небольшое улучшение существующих алгоритмов зрения. Тем не менее, предстоит еще много работы, чтобы достичь уровня распознавания, как у человека.

Подробнее – на постере CVPR здесь (pdf), или в тексте статьи здесь (pdf).

Адрес новости здесь.

Метки: , , ,

Добавить комментарий