Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО МЕТОДА ОБРАБОТКИ ИЗОБРАЖЕНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ РАСПОЗНАВАНИЯ ЛИЦ НА ОСНОВЕ ЛОКАЛЬНЫХ БИНАРНЫХ ШАБЛОНОВ

Забержинский Б.Э. 1 Золин А.Г. 1
1 ФГБОУ ВО «Самарский государственный технический университет»
Распознавание лиц является компьютерным приложением, способным обнаруживать, отслеживать, идентифицировать или верифицировать человеческие лица на изображении или видео. Несмотря на то, что в последнее время достигнут значительный прогресс в области распознавания и обнаружения лиц для целей безопасности, идентификации и учета, все еще есть проблемы, препятствующие достижению или повышению точности распознавания на уровне человека. Эти проблемы включают вариации в формировании изображения человеческого лица, такие как изменение условий освещения, шума на изображениях, масштаба и положения. Представленная статья предлагает новый метод, использующий алгоритм Local Binary Pattern (Локальные бинарные шаблоны) (LBP) в сочетании с современными методами обработки изображений, такими как коррекция контраста, двойной фильтр, эквализация гистограммы и смешивание изображений, для решения некоторых проблем, затрудняющих точность распознавания лиц и улучшения LBP, тем самым повышая общую точность системы распознавания лиц. Результаты проведенных исследований показывают, что предлагаемый метод выше по точности, более надежен и устойчив в случае системы распознавания лиц. На практике использование данного решения может быть реализовано, например, в системе автоматического учета посещаемости.
распознавание лиц
алгоритмы машинного обучения
методы обработки изображений
точность алгоритмов
1. Айткенова М.К., Кусаинова У.Б., Нуран Ш.К. Технология распознавания лиц // Наука и реальность / Science & Reality. 2022. № 2 (10). C. 87–89.
2. Тимергалин А.Р., Ахметов Р.Д., Князев О.А. Распознавание лиц с использованием глубокого обучения // Мировая наука. 2021. № 7 (52). C. 129–133.
3. Карцов С.К., Куприянов Д.Ю., Зыков А.Н. Анализ методов фрактального кодирования и применение метода LBP (local binary patterns) для обработки изображения // Известия Тульского государственного университета. Технические науки. 2013. № 11. C. 235–240.
4. Маршалко Г.Б., Круглова С.И. Исследование возможности обхода биометрических систем идентификации по лицам, использующих алгоритм LBP // Вопросы кибербезопасности. 2019. № 1 (29). C. 45–52.
5. Михеев М.Ю., Жашкова Т.В., Братцев К.Е. Алгоритм нейросетевой идентификации сложных сигналов с применением преобразования Хаара // Труды Международного симпозиума «Надежность и качество». 2011. № 2. C. 356–361.
6. Алиев М.В., Шовгенов Д.А. Идентификация лица человека по заданному примитиву // Вестник Адыгейского государственного университета. Серия 4: Естественно-математические и технические науки. 2014. № 3 (142). C. 185–188.
7. Антончик А.В., Дерюшев А.А. Обзор методов распознавания лица на изображении // Доклады Белорусского государственного университета информатики и радиоэлектроники. 2009. № 2 (40). C. 67–72.
8. Золин А.Г., Беда Д.А., Богданова Е.М., Гусинская Д.А., Маркова Э.А. Разработка алгоритма визуализации и определения характеристик дорожных аномалий для автономных транспортных средств // Современные наукоемкие технологии. 2022. № 4. С. 40–45.
9. Пирова Д.Ф., Забержинский Б.Э., Золин А.Г. Возможности интеллектуальных информационных систем в задачах диагностического прогнозирования пневмонии // Южно-сибирский научный вестник. 2021. № 6 (40). С. 248–251.

Человеческое лицо является сложной многомерной структурой, которая может передавать много различной информации о человеке, включая выражение, эмоции, особенности лица. Эффективный анализ особенностей, связанных с лицевой информацией, является сложной научной задачей, которая требует много времени, усилий и методологии интерпретации полученных данных. Основными проблемами успешной системы распознавания и обнаружения лиц являются условия освещения, масштаб, заслонение, положение, фон, выражение и т.д.

В нашей исследовательской работе применены алгоритмы машинного обучения для распознавания лиц на цифровых изображениях [1]. На входе будет использоваться камера для захвата изображений, например, сотрудников, входящих в офис или здание, на которой применяются некоторые передовые техники обработки изображений, такие как корректировка контраста, уменьшение шума с помощью двустороннего фильтра, эквализация гистограммы изображения, а затем применяется алгоритм Хаара для обнаружения отдельных лиц, которые будут использоваться в качестве входных данных для системы распознавания лиц [2].

Вдобавок ко всему вышеперечисленному будет использована техника смешивания изображений (Image Blending technique) [3]. Она будет применена заранее к обучающим (шаблонным) изображениям лиц, затем измененные входные изображения будут сравниваться с улучшенными обучающими изображениями с помощью алгоритма бинарных шаблонов, чтобы получить улучшенные коды LBP для распознавания лиц, таким образом, точность распознавания лиц будет улучшена по сравнению с традиционными кодами LBP без нашего метода.

1. Предлагаемая методология

Первый предлагаемый подход к улучшению заключается в применении метода корректировки контраста к нашим входным изображениям лица, как определено в уравнении (1). Мы протестировали этот метод с различными альфа и бета, чтобы выбрать то значение, которое дает наилучший результат точности обнаружения и распознавания, а именно 1,5 (α) и 0,0 (β).

missing image file (1)

Во втором подходе мы сравнили эффекты этих трех типов фильтров: Гауссова фильтра размытия, медианного фильтра и двустороннего фильтра на показатели точности нашей системы распознавания лиц [4]. Мы выбрали фильтр, который дает наилучший результат в нашем случае, а именно двусторонний фильтр, как определено в уравнении

missing image file, (2)

где W(x, y) – весовая функция фильтра, I(x, y) – пиксель окрестности входного изображения лица, а знаменатель – нормировка весовой функции, и F(x, y) – результат двустороннего фильтра, примененного к 2N + 1 окрестности. Теперь мы определили CF (x, y) в уравнении (3) как функцию для уменьшения шума и контроля эффектов контраста во входных изображениях, где g(x, y) в уравнении (3) – контрастное изображение, а F(x, y) – применяемый фильтр.

missing image file (3)

Пиксели результирующего изображения, полученные из вышеприведенного уравнения, нормируются с помощью метода выравнивания гистограммы изображения, определенного в уравнении (4), чтобы окончательно решить проблемы глобального освещения в обработанных изображениях лица.

missing image file (4)

где H’ – это нормализованное кумулятивное распределение с максимальным значением 255. Наконец, мы применили алгоритм LBP к нашим обнаруженным изображениям лица для извлечения и сравнения характеристик [5]. Первый оператор LBP использует фиксированное 3X3 окно окрестности.

Более формальное описание оператора LBP может быть дано следующим уравнением:

missing image file (5)

где (Xc, Yc) – значение оттенков (уровня) серого центрального пикселя с, ip и ic является интенсивностью соседнего пикселя, а p – окружающие пиксели в окружности радиусом r, и S(X) – знаковая функция, определенная в уравнении (6), она используется для порогового ограничения фиксированной 3X3.

missing image file (6)

missing image file

Рис. 1. Принципиальный алгоритм распознавания лиц

missing image file

Рис. 2. Результаты показателей точности

В нашем подходе мы продемонстрировали эффект от использования уравнений (1)–(4) для улучшения общего качества входных изображений лиц, чтобы повысить точность алгоритма распознавания, как показано на рис. 1, где в качестве входного потока выступают фотографии с наличием в них изображения лиц.

При рассмотрении каждого окна 3 × 3 соседних пикселей результирующих изображений из уравнений (3), (4), проблемы шума, освещенности, резкости и разрешения были сильно смягчены. После применения уравнений (1)–(4) к исходным входным изображениям мы получили улучшенные высококачественные изображения с помощью нашего метода, который лучше подчеркивает особенности изображения и позволяет получить более точные гистограммы для сравнения изображений лица, что приводит к улучшению LBP-кодов, позволяя повысить общую точность распознавания лиц [6].

2. Экспериментальные исследования

В этой научной статье мы представляем эффективный и действенный подход, использующий передовые методы обработки изображений для повышения точности распознавания лиц на основе алгоритма локальных бинарных паттернов. В этом разделе мы приведем результаты экспериментов из двух взаимосвязанных частей для демонстрации нашего метода.

В первой части метода каскадный классификатор LBP используется для многократного обнаружения и отслеживания лиц. Сначала мы получаем лица с камеры в реальном масштабе времени или используем цифровое изображение образа и применяем алгоритм каскадного классификатора LBP для обнаружения лиц. Чтобы повысить точность алгоритма обнаружения лиц LBP до уровня алгоритма обнаружения лиц с каскадным классификатором Хаара [7] или даже лучше, при сохранении скорости, мы воспользовались методами обработки изображений, определенными в уравнениях (1)–(4).

Результат нашего эксперимента для этой части представлен на рис. 2. Используя наш подход, мы смогли улучшить показатель точности обнаружения лиц, который является неотъемлемой частью общего показателя точности распознавания лиц, и в то же время уменьшить количество ложноположительных и ложноотрицательных результатов.

В этом исследовании алгоритм классификатора Хаара используется для обнаружения лиц на изображении. Алгоритм Хаара состоит из четырех этапов: интегральное изображение, Хаароподобные признаки, каскадный классификатор, в котором входные изображения лиц сначала представляются в виде интегральных изображений для вычисления Хаароподобных характеристик, а для оптимизации и выбора характеристик используется AdaBoost [8]. Затем полученный набор выбранных характеристик пропускается через каскадный классификатор для определения лиц на изображении.

Помимо алгоритма классификатора Хаара, для обнаружения лиц на изображении также используется предложенный нами улучшенный метод LBP. Сравнивая два метода, можно сделать вывод, что предлагаемый метод превосходит алгоритм Хаара для обнаружения лиц. На рис. 2 для обнаружения лиц с использованием алгоритма Хаара, оригинального LBP и улучшенного LBP с помощью нашего метода сравниваются на наборе данных из 226 изображений, и во всех случаях предлагаемый подход дает лучший результат.

3. Линейное смешивание демонстрационных изображений

После процедуры обнаружения лица мы используем алгоритм LBP с помощью предлагаемых методов обработки изображений, определенных в уравнениях (1)–(4), для лучшего извлечения деталей с изображения, с целью сравнения и распознавания человеческих лиц.

missing image file

Рис. 3. Модельный пример смешивания двух разных изображений

Во второй части методики, перед применением алгоритма LBP для распознавания обнаруженных лиц на фотографиях, мы применили технику смешивания изображений на наших обучающих наборах данных. Смешивание изображений – это линейная интерполяция [9], часто используемая для смешивания двух изображений f0 и f1, как показано на рис. 3, для улучшения визуального качества изображений путем минимизации эффектов изменения интенсивности. Линейное смешивание определяется уравнением (7), где (α) и (1-α) – доли смешивания, используемые в средневзвешенном значении каждого компонента каждого пикселя.

missing image file (7)

В представленной работе мы создали три различных набора данных, каждый из которых содержит различные ориентации и состояния лиц, ограниченные 181×181 пикселями: набор данных [I], набор данных [II] и набор данных [III]. В наборе данных [I] не применялось смешивание изображений, в наборе данных [II] применялось линейное смешивание 1,0 альфа (α), а в наборе данных [III] – линейное смешивание 0,5 альфа (α). Мы протестировали улучшенный алгоритм распознавания лиц LBP на этих трех наборах данных и выбрали тот, который дает наилучший результат точности распознавания лиц в нашей системе, а именно набор [III].

В табл. 1 приведена качественная оценка работы оригинального алгоритма LBP, который был запущен на нашем наборе данных [I], наборе данных без какой-либо обработки изображений. В нашей оценке мы использовали следующие метрики: Ложные отрицания, Неизвестные лица и Ложное распознавание [3]. Нами рассчитан коэффициент распознавания лиц следующим образом:

Коэффициент распознавания лиц = = (Общее количество лиц – общее количество ложных распознаваний) / (Общее количество лиц) × 100 %.

Таблица 1

Показана оценка качества оригинального оператора LBP с использованием набора данных [I]

Всего лиц

Ложноотрицательные

Неизвестные лица

Ложное распознавание

354

17

1

33

358

7

3

25

362

26

0

38

418

6

4

48

370

11

5

34

Таблица 2

Оценка качества улучшенного алгоритма LBP с использованием набора данных [III]

Всего лиц

Ложноотрицательные

Неизвестные лица

Ложное распознавание

765

1

4

1

772

0

9

0

763

0

12

0

761

0

8

1

762

2

4

0

Кроме того, в табл. 3 точность распознавания лиц предложенным нами методом сравнивается с тремя другими существующими методами в контролируемой среде соответственно.

Таблица 3

Сравнение методов по точности распознавания лиц

Метод

Точность, в %

LBP + SVM + PSO

96,52

Original LBP

89,4

DCP + LBP + SVM

97,6

Предложенный метод

98,9

Результаты, приведенные в табл. 3, показывают, что исследуемый метод, по сравнению с другими, оказывается надежным для применения в реальной среде, а новизна заключается в сочетании алгоритма LBP с новыми методами обработки изображений, такими как регулировка контраста, двусторонний фильтр, выравнивание гистограммы и смешивание изображений как для входных изображений, так и для обучающих изображений, что является скорее дополнительным вкладом в улучшение LBP [4].

Заключение

В заключение следует отметить, что представленный в статье метод позволяет повысить точность распознавания лиц на основе алгоритма локальных бинарных паттернов. Результаты экспериментов подтверждают улучшение показателей точности обнаружения лиц в сравнении со стандартным алгоритмом. Таким образом, предлагаемый метод является значительным улучшением и расширением метода LBP, позволяя получить более надежные результаты в контролируемой реальной среде с использованием передовых подходов к обработке изображений. Полученные результаты подтверждают высокую надежность и эффективность представленного решения, что может быть полезным для выполнения различных практических задач в области компьютерного зрения и распознавания образов.

Дальнейшие исследования и разработки на основе данного метода могут быть направлены на распознавание лиц в условиях низкой освещенности, измененных условий визуального окружения и повышения скорости обработки изображений.


Библиографическая ссылка

Забержинский Б.Э., Золин А.Г. РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО МЕТОДА ОБРАБОТКИ ИЗОБРАЖЕНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ РАСПОЗНАВАНИЯ ЛИЦ НА ОСНОВЕ ЛОКАЛЬНЫХ БИНАРНЫХ ШАБЛОНОВ // Современные наукоемкие технологии. – 2023. – № 7. – С. 22-26;
URL: https://top-technologies.ru/ru/article/view?id=39689 (дата обращения: 21.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674