Распознавание лиц

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Пример локализации лиц на фотографии

Распознавание лиц — практическое приложение теории распознавания образов, в задачу которого входит автоматическая локализация лица на фотографии и, в случае необходимости, идентификация персоны по лицу. Функцию идентификации людей на фотографиях уже активно используют в программном обеспечении для управления фотоальбомами (Picasa, iPhoto и др.).

Технология[править | править вики-текст]

Методы автоматического распознавания лиц

Задача идентификации и распознавания лиц – это одна из первых практических задач, которая стимулировала становление и развитие теории распознавания и идентификации объектов. Существует девять категорий объектов, которые соответствуют гностическим областям и вызывают зрительные образы:

  • объекты, которыми можно манипулировать (чашка, ключи, часы и т.д.);
  • объекты, которыми можно частично манипулировать (автомобили, материалы и т.д.);
  • объекты не манипулируемые (деревья, здания и т.д.);
  • лица;
  • выражения лиц;
  • живые существа (животные, фигура человека);
  • печатные знаки (буквы, символы, знаки);
  • рукописные изображения;
  • характеристики и расположение источников света (луна, солнце).

Интерес к процедурам, лежащим в основе процесса узнавания и распознавания лиц, всегда был значительным, особенно в связи с возрастающими практическими потребностями: охранные системы, верификация, криминалистическая экспертиза, телеконференции и т.д. Несмотря на ясность того житейского факта, что человек хорошо идентифицирует лица людей, совсем не очевидно, как научить ЭВМ проводить эту процедуру, в том числе как декодировать и хранить цифровые изображения лиц. Еще менее ясными являются оценки схожести лиц, включая их комплексную обработку. Можно выделить несколько направлений исследований проблемы распознавания лиц:

  • нейропсихологические модели;
  • нейрофизиологические модели;
  • информационно – процессуальные модели;
  • компьютерные модели распознавания.

Проблема распознавания лиц рассматривалась еще на ранних стадиях компьютерного зрения. Ряд компаний на протяжении более 40 лет активно разрабатывают автоматизированные, а сейчас и автоматические системы распознавания человеческих лиц: Smith & Wesson (система ASID – Automated Suspect Identification System); ImageWare (система FaceID); Imagis, Epic Solutions, Spillman, Miros (система Trueface); Vissage Technology (система Vissage Gallery); Visionics (система FaceIt).

Технологии распознавания лиц позволяют производить автоматический поиск и распознавание лиц в графических файлах и видеопотоке.

Основные характеристики:

  • возможность поиска и распознавания нескольких лиц;
  • устойчивость к изменениям в прическе, наличию/отсутствию усов и бороды, очкам (кроме солнцезащитных), возрастным изменениям (кроме детей), поворотам (до 30 градусов)
  • практически линейная масштабируемость производительности при установке на многопроцессорные, многоядерные системы и компьютерные кластеры;
  • возможность привязки к изображениям ключевых слов (например, «политик», «бизнесмен» и т.д.) и краткого описания для дальнейшей автоматической классификации обрабатываемого контента;
  • возможность многокадрового анализа видеопотока, обеспечивающего повышение точности распознавания;
  • вывод результатов распознавания в виде простого текста, либо XML-документа, включающего информацию о положении и размере найденных лиц, результатах распознавания и временных метках;
  • слабая зависимость скорости работы от размера используемой галереи лиц. Например, при увеличении галереи со 100 до 1000 лиц, скорость работы уменьшается менее чем на 10%;
  • работа с видео в режиме реального времени.

История[править | править вики-текст]

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

Литература[править | править вики-текст]

Ссылки[править | править вики-текст]