АВТОМАТИЧЕСКАЯ ОЦЕНКА РАКУРСА ЛИЦА В КАДРЕ И ПРИВЕДЕНИЕ ИЗОБРАЖЕНИЯ К НУЛЕВЫМ УГЛАМ ПОВОРОТА
С.Г. Небаба, А.А. Захарова, С.Ю. Андреев
Институт кибернетики Национального исследовательского Томского политехнического университета
E-mail: stepan-lfx@mail.ru, zaa@tpu.ru, serga@td.tomica.ru
Содержание
3. Методы автоматической расстановки особых точек лица на изображении
4. Методы построения трехмерной модели лица
6. Оценка вычислительных затрат
Аннотация
В статье рассмотрены методы автоматического определения особых точек лица на растровом изображении, методы формирования трехмерной модели лица. Выбран оптимальный алгоритм поиска особых точек. Предложен метод формирования трехмерной модели лица из одного растрового изображения и построения изображения лица повернутого на заданный угол. Продемонстрированы результаты работы алгоритма оценки ракурса и алгоритма поворота изображения лица.
Ключевые слова: компьютерное зрение, распознавание лиц, особые точки лица, оценка ракурса, контроль ракурса, активные модели форм, трехмерная модель лица.
Работы по решению задачи идентификации личности на основе анализа изображений лица ведутся с самых ранних этапов развития компьютерного зрения [1,2,3]. Задача распознавания лиц является одной из первых практических задач, которая послужила стимулом для эволюции теории распознавания объектов. Данное направление появилось в начале 1980-х годов, но его развитие началось в 1990-х годах в процессе создания информационно-поисковых систем распознавания для идентификации личности. В последнее время в различных сферах деятельности возрастает потребность быстрой и правильной идентификации личности человека в видеопотоке.
Задача поиска лиц на изображении на сегодняшний день успешно решена и применяется во многих технических устройствах. Например, в фототехнике поиск лиц используется для автоматического выбора точки фокусировки.
Задача автоматизированного распознавания (идентификации) лиц является более сложной, и на данный момент не существует алгоритма, который бы приблизился к точности распознавания лиц человеком. В последние годы был предложен ряд различных подходов к обработке, локализации и распознаванию объектов. Однако эти подходы обладают недостаточной точностью, надежностью и скоростью в реальной обстановке, характеризующейся присутствием шумов на видеопоследовательностях, различными условиями съемки. Методы, применяемые для решения задачи распознавания лиц, должны обеспечивать приемлемую точность распознавания и высокую скорость обработки видеопоследовательностей.
Жесткие требования к ракурсу съемки опознаваемого лица обусловлены используемыми алгоритмами, самые лучшие из которых не позволяют получать удовлетворительные результаты распознавания даже при небольших углах поворота фронтальной плоскости лица по отношению к оптической оси объектива регистрирующей камеры. Как правило, существуют рекомендации, что угол поворота не должен превышать 15 градусов.
В связи с этим становится актуальной задача оценки и нормализации положения лица на изображении.
Контроль положения лица человека относительно оптической оси камеры является важной проблемой в связи с чувствительностью алгоритмов распознавания к ракурсу. Наиболее известным методом оценки ракурса является POSIT (Pose from Orthography and Scaling with Iterations), он отличается высокой производительностью и быстрой сходимостью.
Алгоритм POSIT вычисляет матрицу поворота и вектор параллельного переноса так, чтобы ошибка между проекцией характерных точек трехмерной модели на плоскость изображения и соответствующими им размеченными точками на изображении была минимальна. Метод POSIT комбинирует два алгоритма. Первый, POS (Pose from Orthography and Scaling), аппроксимирует перспективную проекцию с помощью масштабированной ортографической проекции и вычисляет матрицу поворота и вектор параллельного переноса объекта посредством решения СЛАУ. Второй, POSIT (POS with Iterations), в цикле использует результаты работы POS для нахождения более точной масштабированной ортографической проекции характерных точек, и затем применяет POS к полученным точкам, а не к исходным. В итоге алгоритм POSIT сходится к точному решению за несколько итераций [4].
Проблема использования алгоритма на практике заключается в том, что для его работы необходимо изображение, на котором должны быть отмечены характерные точки лица, что в общем случае не является автоматизированной процедурой. Существующие методы автоматической расстановки характерных точек допускают серьезные погрешности, но на малых углах поворота позволяют оценить ракурс лица с достаточной точностью [5].
При верной расстановке характерных точек лица алгоритм оценки ракурса лица позволяет получить коэффициенты для задачи коррекции ракурса изображений лиц и вычислить нормированное изображение.
Существует несколько методов автоматической расстановки особых точек лица, все они в своей основе содержат активные модели форм (Active Shape Models).
Активные модели формы - это статистические модели формы объектов, которые могут многократно деформироваться, для подгонки к объекту, присутствующему на изображении. Эти модели были разработаны Тимом Кутесом и Крисом Тейлором в 1995 году [6]. Формы ограничены моделью распределения точек, из-за чего изменение возможно только в пределах размеченных примеров из обучающей выборки. Форму объекта представляет множество точек, контролируемое формой модели. Цель алгоритма ASMs - сопоставить модель с новым изображением. Алгоритм состоит из двух чередуемых действий:
Чтобы найти лучшую позицию для каждой точки можно искать четкие края, а можно совместить статистическую модель с тем, что ожидается для данной точки. Оригинальный метод предполагает использование расстояние Махаланобиса для вычисления лучшей позиции для каждого ориентира точки [6].
Этот метод широко применяется для анализа изображений лиц, механических узлов и медицинских изображений (в 2D и 3D).
Авторами были изучены различные модификации оригинального алгоритма ASM [6, 7, 8, 9] и выбрана модификация, которая более устойчива к большим углам поворота.
В целом можно предположить, что точность и надежность всех методов расстановки точек зависит в большей степени от методики построения обучающей выборки. На рис. 1 представлено сравнение разметки особых точек лица с большим углом поворота относительно объектива камеры для нескольких разных модификаций ASM.
а) |
б) |
в) |
Рис. 1. а) разметка, выполненная ASM-модификацией, обученной преимущественно на фронтальных лицах; б), в) разметки, выполненные оптимально обученной ASM-модификацией
Тестирование алгоритма POSIT (8-точечная модель, уголки глаз + рот) в сочетании с алгоритмом автоматической расстановки особых точек лица показало, что погрешность оценки угла поворота лица не превышает 5 градусов по каждой из осей, что является хорошим результатом для заданных условий.
Для задачи оценки положения лица и автоматической расстановки особых точек лица существуют различные алгоритмы. В то же время, задача коррекции ракурса никогда не рассматривалась в качестве метода, позволяющего улучшить качество работы алгоритмов распознавания по растровому изображению лица. В первую очередь это связано с проблемой определения трехмерной модели анализируемого лица.
К проблеме получения третьей недостающей координаты можно подойти с разных позиций:
Учитывая выше изложенное, можно заключить, что все рассмотренные методы определения трехмерной модели обладают недостатками и сложно реализуются, что обуславливает необходимость разработки нового метода для получения модели лица.
В качестве основы выбран метод использования готовых трехмерных моделей лица, но для упрощения системы сделано допущение, что в качестве модели глубины изображения лица можно использовать некоторую обобщенную модель, предполагая похожий рельеф основных черт, таких как глаза, брови, нос и рот. Такое допущение понизит точность модели, но позволит избежать её вычисления для каждого человека.
В качестве обобщенной трехмерной модели лица была выбрана модель, изображенная на рисунке 2, представляющая собой массив значений глубины 181x122.
Рис. 2. Изображение карты третьей координаты лица, построенное в среде MATLAB
Для решения задачи коррекции ракурса необходимо произвести следующие операции:
а) |
б) |
Рис. 3. а) сетка, наложенная на исходное изображение; б) нормированное изображение
а) |
б) |
Рис. 4. Сетка из тысячи треугольников: а) полученная с критерием разбиения по максимальной площади; б) полученная с критерием разбиения по максимальной длине стороны
В результате этих операций получается изображение лица, нормированное по углам поворота.
Результат обработки изображения лица показан на рис. 5.
а) |
б) |
Рис. 5. а) изображение лица, повернутого на 15 градусов по оси X; б) изображение лица, скорректированного на 15 градусов
Выполнение разработанного алгоритма коррекции ракурса на изображении размером 250x250 пикселей занимает от 1100 до 1900 миллисекунд на компьютере в следующей конфигурации: процессор Intel Core i7-3770, 16ГБ ОЗУ, под управлением ОС Windows 7.
В статье проведен анализ существующих алгоритмов автоматического поиска особых точек лица на растровом изображении и методов формирования трехмерной модели лица. Выбран оптимальный алгоритм автоматического поиска особых точек. К реализации предложен способ совмещения обобщенной трехмерной модели лица с особыми точками лица и разработан алгоритм приведения изображения лица к заданному ракурсу. Представлены результаты работы реализованного алгоритма оценки ракурса и поворота изображения лица.
Разработанный алгоритм оценки и корректировки положения лица может найти применение в большинстве систем распознавания личности по растровому изображению лица.
Работа выполнена за счет средств субсидии в рамках реализации Программы повышения конкурентоспособности Томского политехнического университета.
AUTOMATIC ESTIMATION OF THE FACE ANGLE IN THE FRAME AND TRANSFORMATION OF IMAGES INTO ZERO ROTATION ANGLES.
S.G. Nebaba, A.A. Zaharova, S.J. Andreev
Institute of Cybernetics of Tomsk Polytechnic University
E-mail: stepan-lfx@mail.ru, zaa@tpu.ru, serga@td.tomica.ru
Abstract
Methods of automatic detection of equilibrium face points in the raster image and methods of forming 3D face model are described in the article. The optimal search algorithm for equilibrium points is chosen. Method of forming a 3D face model from a single bitmap image and construction of face image rotated at a predetermined angle is proposed. Algorithm for estimating the angle and the algorithm of the face image rotation are implemented.
Key words: computer vision, facial recognition, equilibrium face points, face position estimation, face position control, active shape models, 3D face model.