Главная страница   Список литературы  

Введение

Выделение признаков является очень важным шагом в обработке для распознавания образа. В ряде статей (O.D. Trier, A.K. Jain, T. Taxt, Feature extraction methods for character, G.C.H. Chang, C.C. Jay Kuo, Wavelet descriptor of planar curves: theory and applications) одномерные характеристики извлекались из двухмерных (2-D) образов. Преимущество этого метода в том, что сокращается необходимый объем информации для поиска. Недостаток - в том, что показатель опознавания не может быть очень высоким, поскольку удержан минимальный объем информации от первоначального изображения. В других работах [2,4] используются признаки построенные на основе моментов или корреляции. В данной работе инвариантный относительно движений признак строится как комбинации подхода основанного на моментах и использования вейвлет разложении [1].

Для большей ясности изложения алгоритма рассмотрим случай непререрывного изображения в виде числовой функция f(x,y) заданной в прямоугольной области . Будем предполагать, что функция f(x,y) равна нулю в окрестности границы D. Инвариантность относительно сдвига может быть достигнута путем выделения инвариантной точки изображения - центра яркости изображения, обозначенной, координаты которой находятся по формулам:

, ,
где . Далее для того, чтобы добиться инвариантности относительно поворота возьмем круг В с центром в точке и максимального радиуса r, который помещается в D. Находим главные "оси яркости" у этого круга (оси ковариационной матрицы, если использовать терминологию теории вероятности):



Матрица симметричная, положительно определенная. В общем случае собственные числа этой матрицы различны , соответствующие собственные векторы правой ориентации возьмем в качестве новых осей CX',CY' с центром в точке C. Далее возьмем максимальный квадрат Q с центром в C, который помещается внутри круга B, и стороны которого параллельны осям CX',CY'. Отображение


назовем предобработкой изображения.Чтобы выяснить смысл трех чисел в квадратных скобках рассмотрим модельный случай, пусть функция g(x,y) в круге B имеет вид:
Тогда



Из этих трех равенств, зная r, можно найти коэффициенты a, b, c:



Предположим, что два изображения {f, D} и {f', D'} исследуются на совпадение, после предобработки получим:
,
.
Далее находим коэффициенты {a,b,c}, {a',b',c'}, В случае совпадения коэффициентов далее сравниваем между собой вейвлет коэффициенты ({g,Q},r) и ({g',Q'},r) (точнее сужения этих функций на меньший из двух квадратов), в случае несовпадения коэффициентов
,
делаем подгонку функций g и g' с помощью скалирования (умножения на константу и масштабирования), с тем чтобы коэффициенты совпали.Это возможно только в том случае если

Пусть , тогда выполним умножение и скалирование функций g и g'

После чего сравним между собой вейвлет-коэффициенты 2D разложения функций , (точнее сужения этих функций на меньший из двух квадратов Q, ), далее можно переходить к сравнению вейвлет разложений.

Замечание 1.1   Равенство (9) вообще говоря имеет смысл лишь для модельной функции, и фактически проверяется до некоторой фиксированной точности.

Замечание 1.2   Если рассмотреть группу аффинных преобразований, то выполнение равенства (9) можно не проверять, а сразу переходить к скалированию и масштабированию функций g, g'


где , , после чего можно переходить к сравнению вейвлет разложений функций , .

Случай дискретного изображения сводится к непрерывному путем интерполяции. Данный алгоритм обеспечивает инвариантность относительно сдвига, поворота и масштабирования. Использование вейвлет - преобразований является хорошим средством против сильной зашумленности данных. Алгоритм реализован в системе MatLab. Проведенные эксперименты с бинарными изображениями для серии элементарных фигур показали устойчивость данного инвариантного вейвлет-дескриптор.

Главная страница   Список литературы