Введение.
Нейронные сети претендуют на то, чтобы стать универсальным аппаратом, решающим различные специфические задачи из разных областей в геоинформационных системах. Такая универсальность обусловливается тем, что нейронные сети дают стандартный способ решения многих нестандартных задач. К одной из таких задач относится преобразование растровых изображений в векторные графические модели. Основными достоинствами такой модели является возможность масштабирования без потери качества и сравнительно небольшой размер файлов.
Процесс векторизации растровых изображений включает три этапа: предобработка изображения, классификация объектов изображения, оконтуривание классифицированных объектов. В свою очередь, одним из компонентов предобработки изображения является улучшение контраста [5].
Методы.
Одним из подходов к улучшению изображений является их обработка в пространственной области, описываемая уравнением:
где f(x,y) - входное изображение, g(x,y) -обработанное изображение, а T - функция преобразования f определенная в некоторой окрестности точки (x,y).
Решение этой задачи состоит в аппроксимации подобной функции, основанной на распределении некоторых статистических характеристик по окрестности каждого элемента изображения.
Если T{f(x,y)} имеет вид, показанный на рис.1, то эффект от такого преобразования выразится в получении более высокого контраста по сравнению с оригиналом, а также в затемнении пикселей со значениями меньшими m и повышении яркостей пикселей со значениями большими m на исходном изображении. Этот метод известен, как метод усиления контраста [1], а функция T, как «сжимающая» сигмоидная функция, представленная на рис.1 и выражаемая формулой
Обработка изображения происходит попиксельно. Определение окрестности вокруг точки (x,y) заключается в использовании квадратной или прямоугольной области Sxy Sху . Центр этой области передвигается от точки к точке и для каждого нового положения окрестности подсчитывается гистограмма интенсивностей входящих в нее точек.
Для улучшения визуального качества изображения можно использовать некоторые статистические параметры, полученные из гистограмм - математическое ожидание mSxy, как меру среднего уровня яркости, и дисперсию σ2Sxy, как меру контраста.
где rk- значение яркости пикселя -го уровня яркости внутри окрестности; pSxy(rk)-вероятность появления пикселя k-го уровня яркости внутри окрестности; nrk - число пикселей яркости rk внутри окрестности; nSху- общее число пикселей внутри окрестности.
Таким образом, изменение яркости пикселя можно представить в общем виде следующим преобразованием [4]:
где g(x,y) - новое значение яркости пикселя (x,y) , f(x,y) - старое значение яркости пикселя и M - среднее значение яркости пикселей входного изображения.
К нейронным сетям, решающим задачу аппроксимации функций, относятся сети обратного распространения ошибки. В качестве функции активации нейрона подходит вышеописанная передаточная логистическая функция.
Среди методов, используемых при обучении нейронных сетей, стоит выделить алгоритм Левенберга-Марквардта [2, 3], относящийся к классу квазиньютоновых методов, и, являющийся комбинацией простейшего градиентного метода и метода Гаусса-Ньютона. Этот алгоритм использует матрицу Гессе приближенно вычисленную, как
а градиент по формуле
где Е - функция ошибки обучения;
- матрица Якоби производных функционала ошибки по настраиваемым параметрам, вычисляемая на основе стандартного метода распространения ошибки; e - вектор ошибок сети.
Матрица.
Алгоритм Левенберга - Марквардта использует аппроксимацию гессиана следующего вида:
В зависимости от величины коэффициента ц, алгоритм ищет минимум ошибки двумя методами - при ц=0 методом Ньютона, иначе методом градиентного спуска. Поскольку метод Ньютона имеет большую точность и скорость сходимости, коэффициент ц уменьшается после каждой успешной итерации и возрастает в противном случае. Изменение градиента и коэффициента ц показано на рис. 2.
Для оценки отношения между целевыми и выходными значениями работы нейронной сети используется регрессионный анализ (рис. 3). Выходы сети обозначены кружками, наилучшая подгонка -пунктирной, а точная - сплошной линией. Линия регрессии отражает распределение выходов нейронной сети, а крутизна её наклона характеризует зависимость между целевыми и выходными значениями. В данном случае наклон и смещение линии равны соответственно 0.971048 и 0.014768, а коэффициент корреляция 0.958063, что указывает на существенную корреляцию между выходами и целями. Таким образом, можно сказать, что аппроксимация функции выполнена очень точно.
Для оценивания качества полученного изображения будет использоваться формула Мунтеану-Роса [6]:
где E - суммарная интенсивность пикселей на контурах на изображении, η - количество пикселей на контурах; N и M -соответственно ширина и высота изображения; l- доля пикселей с i-м уровнем яркости. Согласно этой оценке, чем больше значение MR, тем лучше визуальное качество.
Результаты.
Для экспериментальной проверки предлагаемого метода будем использовать следующие алгоритмы и параметры для обработки и оценки изображений:
- однослойная нейронная сеть прямой передачи сигнала с одним нейроном;
- детектор края Собеля [1];
- размер области пикселей 3x3;
- для обучения использовались два изображения, размером 65х100 пикселей (рис. 4а) и 120х120 пиксель (рис. 46).
Результат обработки низконтрастного изображения (рис. 5а) географической карты размером 843x981 пикселей с использованием обученной нейронной сети представлен на рис. 5б,в. Время обучения нейронной сети составило 2.5 секунд.
Время обработки изображения составило 90 секунд. Выводы.
Результаты исследований предложенного метода визуального улучшения качества изображений показывают его применимость для решения поставленной задачи.
Работа в данном направлении только начата. В дальнейшем планируются подробные исследования предложенного метода по следующим направлениям:
- дальнейшая предобработка изображения, в том числе усовершенствование предложенного метода и обработка изображений с шумами и искажениями;
- классификация объектов изображения;
- оконтуривание классифицированных объектов.
СПИСОК ЛИТЕРАТУРЫ:
1. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс; пер с англ. под ред. П.А. Чочиа.- М.: Техносфера, 2005. -1070 с.
2. Медведев, В.С. Нейронные сети. Mat-lab 6 / В.С. Медведев, В.Г. Потемкин: под общ. ред. к.т.н. В.Г. Потемкина. - М.: Диалог-МИФИ, 2002. - 496 с.
3. Тархов, Д. А. Нейронные сети. Модели и алгоритмы. / Д. А. Тархов. - М.: Радиотехника, 2005. - 256 с.
4. Цой, Ю.Р. Нейроэволюционное улучшение качества изображений / Ю.Р. Цой, В.Г. Спицын, А. В. Чернявский // Научная сессия МИФИ - 2006. VIII Всероссийская научно-техническая конференция "Нейро-информатика-2006": Сборник трудов. В 3-х частях. Ч.1. - М.:МИФИ, 2006. - с. 181-189.
5. Ширма А.А. Некоторые аспекты векторизации изображений. / А.А Ширма, А.А. Чулюков // Междунар. начн.-практ. конф. " Перспективные инновации в науке, образовании, производстве и транспорте ´2008": сб.научн.тр. - Одесса: Черноморье, 2008. -Том 2. Технические науки - с.29-31.
6. Munteanu C., Gray-scale image enhancement as an automatic process driven 202 by evolution / C. Munteanu, A. Rosa // IEEE Trans. on Systems, Man, and Cybernetics - part B: Cybernetics. - 2004. - Vol. 34, no. 2