Способ сегментации сложноструктурированных растровых полутоновых изображений на основе составных морфологических операторов. Обработка и распознавание изображений в системах превентивной безопасности: Учебное пособие

Kirsch compass masks are yet another type of derivative mask which are used for edge detection. This operator is also known as direction mask. In this operator we take one mask and rotate it in all the eight compass directions to get edges of the eight directions.

We are going to use OpenCV function filter2D to apply Kirsch operator to images. It can be found under Imgproc package. Its syntax is given below −

Filter2D(src, dst, depth , kernel, anchor, delta, BORDER_DEFAULT);

The function arguments are described below −

Sr.No.	Argument
1	It is source image.
2	It is destination image.
3	It is the depth of dst. A negative value (such as -1) indicates that the depth is the same as the source.
4	It is the kernel to be scanned through the image.
5	It is the position of the anchor relative to its kernel. The location Point (-1, -1) indicates the center by default.
6	It is a value to be added to each pixel during the convolution. By default it is 0.
7	BORDER_DEFAULT We let this value by default.

Apart from the filter2D() method, there are other methods provided by the Imgproc class. They are described briefly −

Sr.No.	Method & Description
1	cvtColor(Mat src, Mat dst, int code, int dstCn) It converts an image from one color space to another.
2	dilate(Mat src, Mat dst, Mat kernel) It dilates an image by using a specific structuring element.
3	equalizeHist(Mat src, Mat dst) It equalizes the histogram of a grayscale image.
4	filter2D(Mat src, Mat dst, int depth, Mat kernel, Point anchor, double delta) It convolves an image with the kernel.
5	GaussianBlur(Mat src, Mat dst, Size ksize, double sigmaX) It blurs an image using a Gaussian filter.
6	integral(Mat src, Mat sum) It calculates the integral of an image.

Example

The following example demonstrates the use of Imgproc class to apply Kirsch operator to an image of Grayscale.

Import org.opencv.core.Core; import org.opencv.core.CvType; import org.opencv.core.Mat; import org.opencv.highgui.Highgui; import org.opencv.imgproc.Imgproc; public class convolution { public static void main(String args) { try { int kernelSize = 9; System.loadLibrary(Core.NATIVE_LIBRARY_NAME); Mat source = Highgui.imread("grayscale.jpg", Highgui.CV_LOAD_IMAGE_GRAYSCALE); Mat destination = new Mat(source.rows(),source.cols(),source.type()); Mat kernel = new Mat(kernelSize,kernelSize, CvType.CV_32F) { { put(0,0,-3); put(0,1,-3); put(0,2,-3); put(1,0-3); put(1,1,0); put(1,2,-3); put(2,0,5); put(2,1,5); put(2,2,5); } }; Imgproc.filter2D(source, destination, -1, kernel); Highgui.imwrite("output.jpg", destination); } catch (Exception e) { System.out.println("Error: " + e.getMessage()); } } }

Изобретение относится к средствам обработки цифровых изображений. Техническим результатом является повышение точности выделения границ сложноструктурируемых изображений за счет формирования множества фильтрованных по направлению изображений из исходного полутонового изображения путем локальной обработки составным морфологическим оператором. В способе указанный оператор формируют из линейных структурообразующих элементов с различными параметрами ориентации относительно растра изображения равной длины, каждое фильтрованное изображение получают взаимодействием линейного структурообразующего элемента составного морфологического оператора с исходным изображением, яркости пикселей в фильтрованном изображении получают посредством выполнения для каждого пикселя исходного изображения трех морфологических операций взаимодействия исходного изображения с линейным структурообразующим элементом. 6 ил.

Рисунки к патенту РФ 2510897

Предлагаемое изобретение относится к области цифровой обработки изображений. Сегментация, то есть выделение однородных областей на исходном цифровом изображении, является одной из наиболее важных задач в системах машинного зрения, которые применяются во многих научно-технических и производственных отраслях: медицине, металлографии, аэрофотосъемке, робототехнике, дефектоскопии, системах безопасности и охраны правопорядка и других.

Реальные растровые изображения, получаемые с ПЗС-матриц видеокамер, могут содержать затененные и засвеченные участки. На одном и том же изображении могут встречаться светлые объекты на темном фоне и, наоборот, темные объекты на светлом фоне с различной степенью затененности. В результате получается сложноструктурируемое изображение, разбиение которого на сегменты является неоднозначной задачей. В этом случае для повышения качества сегментации необходимо использовать технологии выделения сегментов, основанные на моделировании процессов сегментации, реализующихся в зрительном анализаторе человека.

На сегодня известно множество различных методов сегментации, среди которых можно выделить методы, использующие информацию о связности областей: выращивание областей, объединение областей по заданному правилу, разделение и слияние областей, сегментация по морфологическим водоразделам, приложения методов теории графов.

Метод выращивания областей в простейшей его реализации [Гонсалес Р.С. Цифровая обработка изображений [Текст] / Р.С.Гонсалес, Р.Э.Вудс. - М.: Техносфера, 2005. - 1072 с. - ISBN 5-94836-028-8. - С.875] можно описать так:

На исходном изображении выбираются точки (центры кристаллизации), предположительно принадлежащие выделяемым областям, например, это могут быть точки с максимальным уровнем яркости;

Далее из этих точек начинается рост областей, то есть присоединение к уже имеющимся точкам области соседних, при этом используется определенный критерий их близости, например разница в яркости, заданная некоторой пороговой величиной;

Остановка роста областей по какому-либо условию, например максимальному отклонению яркости новых точек области от уровня яркости центра кристаллизации или максимальной площади сегментов.

Недостатком данного способа является то, что пиксели одного и того же сегмента могут иметь уровни яркости, разность которых превосходит априорно заданную, а на других фрагментах этого же изображения может быть противоположная ситуация, когда пиксели разных сегментов будут идентифицироваться как пиксели одного и того же сегмента, так как их разности уровней яркости не превосходят априорно заданную.

Другим способом, близким к предыдущему, является алгоритм слияния областей / M.Baatz, A.Schape. - Journal of Photogrammetry and Remote Sensing. Volume 58. Issue 3-4. - Herbert Wichmann Verlag, 2004, р.239-258]. В его основу заложена идея о том, что пиксели исходного изображения уже по сути являются гомогенными областями, но при этом обладают равно минимальными размерами. В этом случае способ сегментации должен выполнять объединение соседних областей, наиболее близких по какому-либо параметру (например, по цвету или текстуре), определенному на основе анализа расстояния (гетерогенности, функцией стоимости слияния), до тех пор, пока не будет выполнено (либо нарушено) некоторое заданное условие (например, на размер сегментов или их количество). Для данного алгоритма целиком отпадает проблема определения центров кристаллизации, но особенно актуальной становится проблема определения момента завершения процесса слияний. В указанной реализации, как и во многих других, для этого используется ограничение на размер и количество сегментов, которое сильно снижает гибкость метода.

При проведении выращивания и слияний областей часто используется текстурная информация / Shaw M. ; Bhaskar R. ; Ugarriza L.G. ; Saber E. ; Amuso V. ]. Однако использование текстурной информации при выращивании ограничивается тем, что для анализа текстуры (обычно это вычисление различных признаков, описанных в математической статистике), как правило, уже требуется иметь область размером более одного пикселя, что при выращивании (добавление единственного пикселя к области) невозможно.

Близким к заявленному является способ сегментации / Mantao X. , Qiyong G. , Hongzhi L. , Jiwu Z. ], принципиально состоящий из двух этапов: выращивания и последующего слияния сегментов. Выращивание областей в данном случае используется для выполнения начальной заведомо избыточной сегментации (initial oversegmentation), а слияние областей, основанное на методах теории графов, имеет своей целью достижение окончательного оптимального состояния сегментации. Определение центров кристаллизации в данном методе происходит в автоматическом режиме на основе градиентного изображения, полученного из исходного с помощью масочного оператора Кирша (Kirsch). Использование здесь градиентного изображения позволяет достаточно универсально решить проблему автоматического обнаружения центров кристаллизации, так как минимумам функции градиентного изображения будут соответствовать точки с максимально однородной окрестностью (потенциальные центры роста сегментов). Однако недостатком применения оператора Кирша в данной ситуации является его пространственная ограниченность (анализируется окрестность только 3×3 пикселей), тогда как при поиске центров кристаллизации было бы полезным исследовать окрестность точки на больших масштабах, чтобы учесть низкочастотные изменения функции яркости изображения и, таким образом, провести более точное последующее определение центров роста. Данного недостатка лишен подход [Минченков М.В. Алгоритм автоматической сегментации растровых изображений, основанный на росте кластеров от максимумов R-величины [Электронный ресурс] / М.В.Минченков. - Материалы конференции Graphicon 2004. - Режим доступа: /2004/ Proceedings /Technical_ru/sl.pdf. - с.2], основанный на релеевском детекторе границ площадных объектов, который использует области анализа различных размеров.

Общим недостатком всех указанных способов является жесткое правило для завершения процесса слияний, основанное на количестве сегментов на изображении либо их размерах. Такое условие резко снижает универсальность метода при заданной конфигурации.

Выделение контуров объектов на полутоновых растровых изображениях можно осуществлять совместно с выделением самих объектов. Для этого обычно используют пороговые методы сегментации на основе среднего значения яркости пикселей, например [патент РФ № 2325044 «Градиентный способ выделения контуров объектов на матрице полутонового растрового изображения»] предложен градиентный способ выделения контуров объектов на матрице полутонового растрового изображения, заключающийся в том, что для всех пикселей растрового изображения вычисляют норму или квадрат нормы градиента изменения их яркости, затем на новой черно-белой монохромной матрице черным цветом на белом фоне выделяют все элементы, у которых значение нормы или квадрата нормы градиента больше порогового значения, а в качестве контуров объектов на монохромной матрице принимают связные конфигурации элементов черного цвета, для выбранного способа вычисления градиента экспериментально определяют коэффициент, затем рассчитывают пороговое значение квадрата нормы градиента как произведение данного коэффициента на сумму квадратов средних величин модулей изменения яркости соседних пикселей по строкам и столбцам, у которых значения превышают общие средние уровни ненулевых изменений соответственно по строкам и столбцам, а среди связных конфигураций элементов черного цвета на монохромной матрице сразу отбрасывают конфигурации, у которых число входящих элементов менее 5-7 элементов, для оставшихся конфигураций вычисляют среднюю степень соседства - частное от деления суммы по всем элементам конфигурации соседних с ним элементов на сумму элементов в конфигурации, причем те конфигурации, у которых средняя степень соседства менее 3, отбрасывают, а оставшиеся принимают в качестве искомых контуров объектов.

К недостаткам данного способа можно отнести слишком большое число эмпирически настраиваемых параметров, что не позволяет получить решающие правила, пригодные для изображений одного и того же класса, полученных при различных условиях или при различных уровнях помех. При нечетких сегментах такие параметры подобрать практически невозможно.

Наиболее близким к заявленному является способ обработки изображения по патенту США N 5351305, опубликованному 27.09.94, МКИ G06К 9/40, в котором из исходного изображения путем частотной фильтрации получают множество изображений, фильтрованных по направлению. Выходное изображение формируют путем выборки каждого элемента изображения либо из одного из фильтрованных по направлению изображений, либо из исходного изображения в зависимости от наличия или отсутствия контрастной границы, соседней с выбранным (обрабатываемым) элементом исходного изображения. При этом наличие контрастной границы для выбранного элемента изображения определяют путем вычисления собственного вектора и сравнения его длины с предопределенным пороговым значением. При отсутствии границы соответствующий элемент выходного изображения принимается равным соответствующему элементу входного изображения. При наличии границы соответствующий элемент выходного изображения принимают равным соответствующему элементу того фильтрованного по направлению изображения, в котором направление фильтрации наиболее близко определенному направлению границы.

В описанном выше способе обработки изображения при определении границы изображения возможен случай, когда длина собственного вектора для соседних элементов изображения изменяется вблизи порогового значения. В этом случае может произойти избирательное усиление шума, вызванное выборкой соседних элементов изображения из разных изображений (исходного и фильтрованного по направлению), что приводит к ухудшению качества выходного изображения.

Кроме того, исходные изображения с различным уровнем шума требуют существенно различных пороговых значений, в то время как данный способ не предусматривает адаптивного изменения этого порогового значения, что приводит к невозможности качественной обработки изображений с различным уровнем шума.

Выборку элементов выходного изображения при наличии границы производят только из одного из фильтрованных по направлению изображений, что приводит к полному подавлению всех деталей исходного изображения, которые отличаются по направлению от обнаруженной границы, даже в случае, когда эти детали хорошо видны в исходном изображении.

Технической задачей предлагаемого способа является повышение точности выделения границ сегментов сложноструктурируемых изображений и, как следствие, повышение качества сегментации (большее соответствие восприятию изображения человеком), а также повышение степени автоматизации процесса анализа и классификации сегментов изображения.

Поставленная задача достигается тем, что из исходного полутонового изображения путем локальной обработки составным морфологическим оператором формируют множество изображений, фильтрованных по направлению. Выходное изображение образуется из фильтрованных изображений, получаемых в результате обработки исходного изображения составным морфологическим оператором. При этом составной морфологический оператор формируют из линейных структурообразующих элементов равной длины V, но с различными параметрами ориентации относительно растра изображения. Каждое фильтрованное изображение получают посредством взаимодействия линейного структурообразующего элемента составного морфологического оператора с исходным изображением F. Яркости пикселей в фильтрованном изображении получают следующим образом. При помещении центра линейного структурообразующего элемента в пиксель р с координатами ij исходного изображения F линейный структурообразующий элемент В р () выделяет из множества пикселей изображения F три подмножества:

1) ;

где V>q,s>1; sl,k>1; k>l.

После определения трех подмножеств вычисляют суммарное значение яркости пикселей в подмножествах A1:S1 и А2:S2. Затем вычисляют разность D=S1-S2. Новое значение яркости пикселей определяют по рекуррентным формулам, в множестве А2: lk = lk +D и в множестве A3: qs = qs -D.

После того, как маска составного морфологического оператора пройдет все пиксели исходного изображения F, то есть после определения фильтрованных изображений для всех линейных структурообразующих элементов составного морфологического оператора, определяют итоговое изображение G путем суммирования яркостей пикселей фильтрованных изображений с одинаковыми координатами, определяют минимальную яркость пикселя итогового изображения Gmin и максимальную яркость итогового изображения Gmax и смещают и нормируют его согласно формуле

На фиг.1 представлена схема алгоритма, реализующего представленный способ.

На фиг.2 представлено продолжение схемы алгоритма, реализующего представленный способ.

На фиг.3 представлен пример линейного структурообразующего элемента составного морфологического оператора В( , V) при =1, V=3, =3.

На фиг.4 показан пример обработки бинарного изображения составным морфологическим оператором, представленным на фиг.3 согласно схеме алгоритма, представленного на фиг.1 и фиг.2.

На фиг.5 показан пример обработки бинарного изображения составным морфологическим оператором, представленным на фиг.3 согласно схеме алгоритма, представленного на фиг.1 и фиг.2.

На фиг.6 показан пример обработки изображений, представленных на фиг.4, посредством детектора Превитта.

Способ осуществляется согласно схеме алгоритма, представленной на фиг.1 и фиг.2. В блоке 1 осуществляется ввод в компьютер пикселей исходного растрового полутонового изображения F, размер которого по вертикали N, а по горизонтали М. В блоке 2 формируется составной морфологический оператор , включающий линейных структурообразующих элементов длиной V. Блок 3 организует цикл по структурообразующим элементам составного морфологического оператора. В результате этого цикла получаем фильтрованных по направлению изображений.

На фиг.3 представлен пример формирования составного морфологического оператора. На ней выделен единицами один структурообразующий элемент составного морфологического оператора, соответствующей направлению фильтрации =1 для V=3 и =3.

Для каждого значения в блоках 4-19 определяется изображение F(), фильтрованное по направлению . Сущность фильтрации по направлению состоит в следующем. При помещении центра линейного структурообразующего элемента в пиксель р с координатами ij исходного изображения F линейный структурообразующий элемент В р () выделяет из множества пикселей F три подмножества:

1) ;

где V>q,s>1; sl,k>1; k>l.

Каждый составной морфологический оператор дает триаду множеств А1, А2 и A3 для каждого значения параметра и пикселя р. Подмножество A1 - это подмножество элементов множества F, которые лежат на структурообразующем элементе В(). Подмножество А2 - это подмножество элементов множества F, которые лежат выше или левее структурообразующего элемента В(). Подмножество A3 - это подмножество элементов множества F, которые лежат ниже или правее структурообразующего элемента В(). Полагаем, что существует вероятность, что каждый структурообразующий элемент составного морфологического оператора является элементом границы сегмента. Тогда средние яркости пикселей по обе стороны границы сегмента должны отличаться друг от друга. Сравнение этих яркостей может подтвердить или опровергнуть выдвинутую гипотезу. Элементы изображения F, которые находятся по обеим сторонам границы сегмента, определяют подмножества А2 и A3.

В блоках 6-9 определяется сумма S1 яркостей пикселей подмножества А2 для линейного стрктурообразующего элемента В р (). При этом параметры циклов k и l в блоках 7 и 8 принимают в зависимости от параметра для пикселя с координатами ij следующие значения:

0: k=i-int(V/2), i-1; l=j-int(V/2), j-int(V/2)+V-1;

1: k=i-int(V/2), i+int(V/2)-1; l=j-int(V/2), j+int(V/2)+V-1-k;

2: k=i-int(V/2), i+int(V/2); l=j-int(V/2), j-1;

3: k=i-int(V/2)-1, i+int(V/2); l=k-1, j+int(V/2)-1.

В блоках 10-12 определяется сумма S2 яркостей пикселей множества A3 для линейного стрктурообразующего элемента В р (). При этом параметры циклов s и q в блоках 10 и 11 принимают в зависимости от параметра для пикселя с координатами ij следующие значения:

0: s=i-1, i+int(V/2); q=j-int(V/2), j-int(V/2)+V-1; j+int(V/2);

3: s=i-int(V/2), i+int(V/2); q=j-int(V/2)-1, k-1.

В блоке 13 вычисляется параметр D=S1-S2, который определяет, насколько значимо различие яркости пикселей множества А2 и множества A3. Для накопления этой значимости к яркости пикселей множества А2 добавляют параметр D, а из яркости пикселей множества A3 вычитают параметр D. Эти процедуры реализуется в блоках 14-16 и 17-19 соответственно.

В блоках 20-26 определяют выходное изображение G. Для этого суммируют яркости в пикселях с одноименными координатами в полученных фильтрованных изображениях (блоки 20-23). Определяют максимальный Gmax и минимальный Gmin элементы полученного изображения и затем смещают и нормируют его согласно формуле

Процесс обработки тестовых изображений предлагаемым способом иллюстрируют фиг.4-6. На фиг.4а показано тестовое бинарное изображение, имеющее четкую границу сегментов, со спектром, лежащим в области нижних пространственных частот. На фиг.4б показано это изображение после обработки составным морфологическим оператором, реализованным согласно алгоритму фиг.1 и фиг.2 и со структурообразующими элементами, показанными на фиг.3.

На фиг.5а показано тестовое бинарное изображение, имеющее четкую границу сегментов, со спектром, лежащим в области верхних пространственных частот. На фиг.5б показано это изображение после обработки составным морфологическим оператором, реализованным согласно алгоритму фиг.1 и фиг.2 и со структурообразующими элементами, показанными на фиг.3.

Проведем на экспертном уровне сравнительную оценку эффективности выделения краев предложенным составным морфологическим оператором и оператором, основанным на детекторе краев Превитта. На фиг.6а показано изображение (фиг.4а), полученное после обработки его детектором краев Превитта, а на фиг.6б показано изображение (фиг.5а), полученное после обработки его детектором краев Превитта.

Тестовое изображение фиг.4а относится к изображениям, спектр которых лежит в области нижних пространственных частот. Тестовое изображение фиг.5а относится к изображениям, спектр которых лежит в области верхних пространственных частот. Таким образом, мы можем получить сравнительные характеристики обработки изображений с различными пространственными спектрами.

При экспертном оценивании качества сегментации учитывался динамический диапазон между средней яркостью пикселей исходного изображения (фоном) и средней яркостью пикселей на действительной границе сегмента в обработанных изображениях. При этом полагалось, что чем больше этот динамический диапазон, тем устойчивее процесс сегментации к влиянию помех.

Анализ экспериментальных результатов по обработке тестовых изображений посредством предложенного морфологического оператора показал, что границы сегментов имеют вид «мексиканская шляпа» независимо от пространственных частот, которые занимает изображение, что значительно повышает динамический диапазон на границах сегмента и тем самым увеличивает помехозащищенность процесса сегментации.

ФОРМУЛА ИЗОБРЕТЕНИЯ

Способ сегментации сложноструктурируемых растровых полутоновых изображений на основе составных морфологических операторов, заключающийся в том, что из исходного полутонового изображения путем локальной обработки составным морфологическим оператором формируют множество изображений, фильтрованных по направлению, а выходное изображение получают из фильтрованных изображений, отличающийся тем, что составной морфологический оператор формируют из линейных структурообразующих элементов с различными параметрами ориентации относительно растра изображения равной длины V и каждое фильтрованное изображение получают посредством взаимодействия линейного структурообразующего элемента составного морфологического оператора с исходным изображением F, при этом яркости пикселей в фильтрованном изображении получают посредством выполнения для каждого пикселя р исходного изображения F трех морфологических операций взаимодействия исходного изображения F с линейным структурообразующим элементом В р (), в результате выполнения которых получают три подмножества

1) ;

где V>q, s>1; sl,k>1; k>l; после определения которых вычисляется суммарное значение яркости пикселей в подмножествах A1: S1 и А2: S2, затем вычисляют разность D=S1-S2, новое значение яркости пикселей определяют по рекуррентным формулам, в множестве А2: f lk =f lk +D и в множестве AS: f qs =f qs -D, после чего переходят к определению очередных трех подмножеств в следующем пикселе р исходного изображения, после определения фильтрованных изображений для всех линейных структурообразующих элементов составного морфологического оператора определяют итоговое изображение G путем суммирования яркостей пикселей фильтрованных изображений с одинаковыми координатами, определяют минимальную яркость пикселей итогового изображения Gmin и максимальную яркость пикселей итогового изображения Gmax и смещают и нормируют его согласно формуле

УДК: 004.932.72Ч ГРНТИ: 28.23.15 DOI: 10.15643/jscientia.2016.6.195

ОПТИМАЛЬНЫЕ АЛГОРИТМЫ ВЫДЕЛЕНИЯ КОНТУРОВ ИЗОБРАЖЕНИЯ В СИСТЕМЕТЕХНИЧЕСКОГО ЗРЕНИЯ

Е. Е. Пелевин*, С. В. Балясный

Тульский государственный университет Россия, 300012, г. Тула, пр-т Ленина, 92 * email: [email protected]

В статье рассматривается вопрос распознавания контуров изображения в робототехнике. В качестве объектов исследования выступают четыре алгоритма идентификации контуров: Кирша, Робинсона, Канни и Marr-Hildreth. С помощью данных алгоритмов, часто применяющихся в современной робототехнике, было проведено исследование по эффективности выделения контуров изображений в системах технического зрения с принимающими на вход различными типами объектов. Результаты проведенных исследований показали, что наиболее эффективным в выделении контуров на изображении является метод Канни. В процессе работы было выявлено, что данный метод позволяет достигнуть высокой резкости, а также детализации. Вторым по эффективности выделения линейных контуров стал метод Marr-Hildreth. Исходя из результатов исследования, можно сделать вывод о том, что существуют наиболее универсальные алгоритмы, но каждый из них по-своему подходит для определенных классов изображений.

Ключевые слова: Кирш, Робинсон, Канни, Marr-Hildreth, оператор, распознавание, контур, робототехника, система технического зрения (СТЗ).

OPTIMAL ALGORITHM OF EDGE DETECTION WITHIN THE SYSTEM OF COMPUTER VISION

E. E. Pelevin*, S. V. Balyasny

Tula State University

Prospect Lenina 92, 300012, Tula, Russia

* email: [email protected]

The article touches upon the edge detection of digital images in robotics. Four algorithms of edge identification singled out by Kirsh, Robinson, Canny and Marr-Hildreth serve as the subject matter of the research. With the help of these algorithms widely used in the modern robotics, the research of efficiency of edge detection of images within the systems of computer vision which accept various input types of objects has been done. The results of the research done have shown that the method of Canny is the most effective in edge detection of images. During the work process, it has been found out that this method allows achieving both high definition and refinement. The method of Marr-Hildreth has become the second efficient method in edging of line contours. Based on the research results, the following conclusion can be drawn: there are more universal algorithms, but each of them differently fits particular classes of images.

Keywords: Kirsh, Robinson, Canny, Marr-Hildreth, operator, edge detection, contour, robotics, computer vision system.

Несомненно, в век компьютерных технологий все большее место в современной науке занимает робототехника. Это связанно с внедрением нового оборудования на заводах, автозаправочных станциях, в аэропортах и в других сферах жизнедеятельности человека. Частью этих нововведённых систем является программа с тем или иным алгоритмом распознавания контуров изображений, например, реализация выделения контуров различных деталей или механизмов. От эффективности данного алгоритма зависит и вся последующая работа роботизированной системы в целом.

В настоящее время существует большое количество различных алгоритмов выделения контуров, но лишь некоторые из них получили широкое распространение, а именно за счет своей универсальности. В этой работе будут рассмотрены наиболее популярные алгоритмы: оператор Кирша, оператор Робинсона, детектор границ Канни и метод Marr-Hildreth . Для тестирования этих методов будет использоваться тестовое изображение (рис.1).

Первым из рассматриваемых методов является оператор Кирша. Этот метод был разработан Русселом А. Киршем в 1971 году . Данный алгоритм основывается на использовании обнаруживающей матрицы (маски), которую последовательно вращают по восьми основным сторонам

Рис. 1. Исходное изображение для обнаружения контуров.

света: север, северо-запад, запад, юго-запад, юг, юго-восток, восток и северо-восток. После исследования Руссел А. Кирш вывел следующие маски для каждой стороны света :

5 5 5 -3 0 -3 -3 -3 -3J

COMPUTER SCIENCE | Juvenis scientia 2016 № 6

В данном случае величина границы определяется как максимальное значение, которое может быть найдено при помощи маски. Определенная маска помогает направлению выдать максимальную величину. Из этого можно сделать вывод, что маска ко позволяет выделять вертикальные границы, а маска к5 - диагональные. Из масок так же заметно, что последние похожи на первые четыре, но являются их зеркальным отражением по центральной оси используемой матрицы .

В ходе обработки тестового изображения, можно получить следующий результат (рис. 2).

Рис. 2. Идентификация контуров оператором Кирша.

Позднее в 1977 году был разработан оператор Робинсона, который, по сути, являлся аналогом метода Кирша, но благодаря использованию коэффициентов о, 1 и 2 стал более простым в реализации. Матрицы, которые использует данный оператор, являются симметричными относительно своих центральных осей, каждая из которых заполнена нулями. Благодаря этому можно использовать лишь первые четыре матрицы, а остальные результаты получить, инвертируя первые. Оператор Робинсона будет выглядеть следующим образом:

Рис. 3. Результат работы оператора Робинсона.

Несмотря на простоту предыдущего оператора, наибольшую популярность в итоге получил детектор границ Канни. Метод впервые был описан в 1983 году ученым Джоном Канни в своей магистерской диссертации. Данный метод превосходит по эффективности своей работы многие современные, даже если и был разработан более тридцати лет назад. Его отличительной особенностью является устранение шума на контурах изображения, что, несомненно, оказывает влияние на конечный результат. Данный алгоритм заключается в выполнении следующих шагов:

Размытие исходного изображения с) с помощью метода Гаусса ^(г, с). ^(г, c)=f(r,c)*G(r,c,6);

Выполнить поиск градиента. Границы намечаются там, где градиент принимает максимальное значение;

Подавление не-максимумов. Только локальные максимумы отмечаются как границы;

Итоговые границы определяются путем подавления всех краев, не связанных с определенными границами.

Результатом работы алгоритма являются контуры на изображении. За счет своих особенностей данный метод мало восприимчив к шуму (рис. 4).

Из матриц следует, что после того, как каждая из них будет последовательно применена к пикселю и его окружению, максимальное значение, которое он получит, будет считаться величиной градиента. Тогда угол градиента можно аппроксимировать как угол линии, заполненной нулями в маске, дающей максимальный отклик.

Как и в предыдущем случае, можно провести обработку исходных изображений (рис. 3).

Рис. 4. Результат работы метода Канни.

Последний метод обнаружения границ цифровых изображений называется Магг-ЫИге^, который был разработан в 1980 году. Он подразумевает под собой обнаружение кривых на всех участках, где наблюдается резкое изменение яркостей групп пикселей. Данный метод является простым и работает при помощи свертки исходного изо-

бражения с LoG-функцией или как быстрая аппроксимация с DoG. При работе метода нули в обратном результате обозначают контуры изображения. Для работы метода необходимо придерживаться следующих шагов алгоритма :

Размытие изображение методом Гаусса;

Применение оператора Лапласа к размытому изображению (часто первые два шага объединены в один);

Производится цикл вычислений и в полученном результате смотрят на смену знака. Если знак изменится с отрицательного на положительный и значение изменится более чем на некоторый заданный порог, то необходимо определить эту точку, как границу;

Для получения лучших результатов шаг с использованием оператора Лапласа можно выполнить через гистерезис, то есть так, как это реализовано в алгоритме Канни.

Результат работы данного алгоритма на тестовом изображении будет следующим (рис. 5).

Исходя из проведенных исследований, можно сделать вывод о том, что для распознавания механизмов и других объектов, состоящих из криволинейных контуров, в робототехнике эффективнее всего может применяться метод Канни, который позволяет добиться наибольшей резкости границ и высокой детализации. Для выделения линейных контуров объектов, например, в тех случаях, если используются системы технического зрения на конвейерных линиях, наилучшим образом подходит метод Marr-Hildreth, который выделяет даже мелкие линейные контуры на изображениях. Таким образом, в робототехнике могут использоваться все описанные алгоритмы выделений, но каждый из них наиболее эффективен на определенном классе задач, а также нацелен на получение результата определенного качества.

ЛИТЕРАТУРА

1. Аммерал Л. Принципы программирования в машинной графике / Л. Аммерал. М.: Сол Систем, 1992. 665 с.

2. Бутаков Е.А. Обработка изображений на ЭВМ: моногр. / Е.А. Бутаков, В.И. Островский, И.Л. Фадеев. М.: Радио и связь, 1987. 205 с.

3. Прэтт У. Цифровая обработка изображений / У. Прэтт. М.: Мир, 1982. Т. 2. 716 с.

4. Ту Дж. Принципы распознавания образов / Дж. Ту, Р. Гонсалес. М.: Мир, 1978. 764 с.

5. Файн В.С. Опознавание изображений / В.С. Файн. М.: Наука, 2003. 322 с

6. Яншин В. Обработка изображений на языке Си для IBM PC: Алгоритмы и программы / В. Яншин, Г. Калинин. М.: Мир, 1994. 358 с.

В нелинейных системах обнаружения перепадов для контрастирования перед пороговым ограничением используются нелинейные комбинации значений яркости элементов изображения. В большинстве методов ограничиваются обработкой окном размером или .

Робертс для контрастирования и выделения перепадов предложил следующую простую нелинейную операцию двумерного дискретного дифференцирования:

.(17.4.10)

Другая операция пространственного дифференцирования, требующая меньшего объема вычислений, определяется формулой

Можно легко показать, что

Отмечая тот из четырех элементов изображения, расположенных около обнаруженной точки, который имеет наибольшее значение яркости, можно получить информацию о приблизительной ориентации перепада. Рис. 17.4.8 иллюстрирует работу операторов Робертса.

Рис. 17.4.8. Примеры выделения перепадов с помощью детекторов Робертса.

Собел предложил использовать для контрастирования нелинейный оператор с окном из элементов. На рис. 17.4.9 показаны использованные им обозначения элементов окна. Для контрастирования перепадов вычисляется величина

, (17.4.13а)

Величины - яркости элементов окна, показанного на рис. 17.4.9. Результаты обнаружения перепадов с помощью оператора Собела приведены на рис. 17.4.10.

Другой нелинейный оператор с таким же окном из элементов для контрастирования перепадов предложен Киршем .

Рис. 17.4.9. Обозначение элементов для операторов выделения перепадов c окном размером .

Этот оператор определяется следующим выражением:

, (17.4.14а)

, (17.4.14б)

Индексы у слагаемых подсчитываются по модулю 8. По существу оператор Кирша дает максимальное значение курсового градиента в некоторой точке изображения без учета значения . Примеры обнаружения перепадов с помощью оператора Кирша приведены на рис. 17.4.11.

Уоллис предложил нелинейный метод обнаружения перепадов, основанный на гомоморфной обработке изображения. Согласно этому методу, точка находится на перепаде, если величина логарифма от яркости в этой точке превосходит среднее значение логарифмов яркостей четырех ближайших соседних элементов на некоторое фиксированное значение. Элемент контрастированного изображения определяется как

или, что эквивалентно,

. (17.4.15б)

Сравнение с верхним и нижним пороговыми значениями эквивалентно сравнению дроби в скобках выражения (17.4.156) с видоизмененным порогом. Поэтому не требуется точно вычислять значения логарифмов. Основное преимущество логарифмического детектора перепадов кроме простоты вычислений состоит в том, что он не чувствителен к мультипликативным изменениям уровня яркости. Рис. 17.4.12 иллюстрирует работу логарифмического детектора перепадов.

Рис. 17.4.10. Примеры выделения перепадов с помощью оператора Собела.

Рис. 17.4.11. Примеры выделения перепадов с помощью оператора Кирша.

Логарифмический метод контрастирования, определяемый выражением (17.4.15), можно рассматривать как линейное контрастирование с помощью оператора Лапласа (17.4.5а) изображения, уровни элементов которого равны логарифмам яркостей. Другие методы контрастирования также можно легко представить в виде последовательности нелинейных поэлементных операций с дальнейшим линейным контрастированием перепадов и пороговым ограничением.

Рис. 17.4.12. Примеры выделения перепадов с помощью логарифмического оператора Лапласа.

Нелинейный метод повышения контраста и выделения перепадов, основанный на вычислении произведения набора некоторых величин, разработал Розенфельд . В этом методе используется оператор построчного одномерного усреднения. Текущее среднее

где и - целое, вычисляется для каждого элемента изображения. Эта операция выполняется для вплоть до некоторого желаемого верхнего предела. Затем для каждого элемента изображения вычисляется произведение

Понятно, что сомножители, соответствующие усреднению более высокого порядка, указывают довольно широкие пределы локализации перепада и производят некоторое подавление шумов, тогда как сомножители усреднения более низкого порядка локализуют перепад точнее, но при этом маски значительно чувствительнее к шуму. Вместе с тем можно предположить, что произведение средних разного порядка должно обеспечивать надежное обнаружение и локализацию истинных перепадов. Обоснование этого предположения, приводимое Розенфельдом, заключается в следующем.

Рис. 17.4.13. Примеры обычного порогового ограничения и ограничения с подавлением доминирующими соседями для случая оператора Собела: а - обычное пороговое ограничение; б - увеличенный участок изображения а, содержащий ствол пушки; г - этот же участок при коэффициенте подавления, равном 1,5; г - этот же участок при коэффициенте подавления, равном 1,2.

Величина проявляет тенденцию обнаруживать и точно локализовать основные перепады и при этом подавлять шум. Это можно объяснить тем, что произведение велико лишь тогда, когда велики все сомножители, а по мере удаления от точки перепада сначала уменьшаются сомножители с малыми индексами, а затем и с большими.

Кроме того, Розенфельд предложил нелинейную процедуру порогового ограничения для выделения больших отчетливых перепадов, находящихся в окружении более мелких. Эта процедура, которую в дальнейшем будем называть «подавлением доминирующими соседями», выполняется сканированием поля контрастированных перепадов окном малых размеров. Значение в центре окна подавляется (приравнивается нулю) всякий раз, когда оно не оказывается наибольшим из всех отсчетов в этом окне. Затем выполняется обычное пороговое ограничение. Другой вариант такой обработки состоит в том, что подавление разрешается лишь в случае, если в окне имеются элементы, значения которых намного превышают значения . Алгоритм подавления доминирующими соседями с последующим пороговым ограничением оказывается довольно эффективным при обнаружении перепадов, если его объединить с методом контрастирования, обеспечивающим некоторое сглаживание шума. На рис. 17.4.13 приведены примеры, иллюстрирующие работу алгоритма подавления доминирующими соседями с последующим пороговым ограничением.

Одной из главных целей компьютерного зрения при обработке изображений является интерпретация содержимого на изображении. Для этого необходимо качественно отделить фон от объектов. Сегментация разделяет изображение на составляющие части или объекты. Она отделяет объект от фона, чтобы можно было легко обрабатывать изображения и идентифицировать его содержимое. В данном случае выделение контуров на изображении является фундаментальным средством для качественной сегментации изображения. В данной статье предпринята попытка изучить производительность часто используемых алгоритмов выделения контуров для дальнейшей сегментации изображения, а также их сравнение при помощи программного средства MATLAB.

Введение

Сегментация изображений — огромный шаг для анализа изображений. Она разделяет изображение на составляющие части или объекты. Уровень детализации разделяемых областей зависит от решаемой задачи. К примеру, когда интересуемые объекты перестают сохранять целостность, разбиваются на более мелкие, составные части, процесс сегментации стоит прекратить. Алгоритмы сегментации изображений чаще всего базируются на разрыве и подобии значений на изображении. Подход разрывов яркости базируется на основе резких изменений значений интенсивности, подобие же — на разделение изображения на области, подобные согласно ряду заранее определенных критериев. Таким образом, выбор алгоритма сегментации изображения напрямую зависит от проблемы, которую необходимо решить. Обнаружение границ является частью сегментации изображений. Следовательно, эффективность решения многих задач обработки изображений и компьютерного зрения зависит от качества выделенных границ. Выделение их на изображении можно причислить к алгоритмам сегментации, которые базируются на разрывах яркости.

Процесс обнаружения точных разрывов яркости на изображении называется процессом выделение границ. Разрывы — это резкие изменения в группе пикселей, которые являются границами объектов. Классический алгоритм обнаружения границ задействует свертку изображения с помощью оператора, который основывается на чувствительности к большим перепадам яркости на изображении, а при проходе однородных участков возвращает нуль. Сейчас доступно огромное количество алгоритмов выделения контуров, но ни один из них не является универсальным. Каждый из существующих алгоритмов решает свой класс задач (т.е. качественно выделяет границы определенного типа). Для определения подходящего алгоритма выделения контуров необходимо учитывать такие параметры, как ориентация и структура контура, а также наличие и тип шума на изображении. Геометрия оператора устанавливает характерное направление, в котором он наиболее чувствителен к границам. Существующие операторы предназначены для поиска вертикальных, горизонтальных или диагональных границ. Выделение границ объектов — сложная задача в случае сильно зашумленного изображения, так как оператор чувствителен к перепадам яркости, и, следовательно, шум также будет считать некоторым объектом на изображении. Есть алгоритмы, позволяющие в значительной мере избавиться от шума, но в свою очередь, они в значительной мере повреждают границы изображения, искажая их. А так как большинство обрабатываемых изображений содержат в себе шум, шумоподавляющие алгоритмы пользуются большой популярностью, но это сказывается на качестве выделенных контуров.

Также при обнаружении контуров объектов существуют такие проблемы, как нахождение ложных контуров, расположение контуров, пропуск истинных контуров, помехи в виде шума, высокие затраты времени на вычисление и др. Следовательно, цель заключается в том, чтобы исследовать и сравнить множество обработанных изображений и проанализировать качество работы алгоритмов в различных условиях.

В данной статье предпринята попытка сделать обзор наиболее популярных алгоритмов выделения контуров для сегментации, а также реализация их в программной среде MATLAB. Второй раздел вводит фундаментальные определения, которые используются в литературе. Третий — предоставляет теоретический и математический и объясняет различные компьютерные подходы к выделению контуров. Раздел четыре предоставляет сравнительный анализ различных алгоритмов, сопровождая его изображениями. Пятый раздел содержит обзор полученных результатов и заключение.

Сегментация изображений

Сегментация изображения — это процесс разделения цифрового изображения на множество областей или наборов пикселей. Фактически, это разделение на различные объекты, которые имеют одинаковую текстуру или цвет. Результатом сегментации является набор областей, покрывающих вместе все изображение, и набор контуров, извлеченных из изображения. Все пиксели из одной области подобны по некоторым характеристикам, таким как цвет, текстура или интенсивность. Смежные области отличаются друг от друга этими же характеристиками. Различные подходы нахождения границ между областями базируются на неоднородностях уровней интенсивности яркости. Таки образом выбор метода сегментации изображения зависит от проблемы, которую необходимо решить.

Методы, основанные на областях, базируются на непрерывности. Данные алгоритмы делят все изображение на подобласти в зависимости от некоторых правил, к примеру, все пиксели данной группы должны иметь определенное значение серого цвета. Эти алгоритмы полагаются на общие шаблоны интенсивности значений в кластерах соседних пикселей.

Пороговая сегментация является простейшим видом сегментации. На ее основе области могут быть классифицированы по базовому диапазону значений, которые зависят от интенсивности пикселей изображения. Пороговая обработка преобразовывает входное изображение в бинарное.

Методы сегментации, основанные на обнаружении областей, находят непосредственно резкие изменения значений интенсивности. Такие методы называются граничными методами. Обнаружение границ — фундаментальная проблема при анализе изображений. Техники выделения границ обычно используются для нахождения неоднородностей на полутоновом изображении. Обнаружение разрывов на полутоном изображении — наиболее важный подход при выделении границ.

Алгоритмы выделение границ

Границы объектов на изображении в значительной степени уменьшают количество данных, которые необходимо обработать, и в то же время сохраняет важную информацию об объектах на изображении, их форму, размер, количество. Главной особенностью техники обнаружения границ является возможность извлечь точную линию с хорошей ориентацией. В литературе описано множество алгоритмов, которые позволяют обнаруживать границы объектов, но нигде нет описания того, как оценивать результаты обработки. Результаты оцениваются сугубо индивидуально и зависят от области их применения.

Обнаружение границ — фундаментальный инструмент для сегментации изображения. Такие алгоритмы преобразуют входное изображение в изображение с контурами объектов, преимущественно в серых тонах. В обработке изображений, особенно в системах компьютерного зрения, с помощью выделения контура рассматривают важные изменения уровня яркости на изображении, физические и геометрические параметры объекта на сцене. Это фундаментальный процесс, который обрисовывает в общих чертах объекты, получая тем самым некоторые знания об изображении. Обнаружение границ является самым популярным подходом для обнаружения значительных неоднородностей.

Граница является местным изменением яркости на изображении. Они, как правило, проходят по краю между двумя областями. С помощью границ можно получить базовые знания об изображении. Функции их получения используются передовыми алгоритмами компьютерного зрения и таких областях, как медицинская обработка изображений, биометрия и тому подобные. Обнаружение границ — активная область исследований, так как он облегчает высокоуровневый анализ изображений. На полутоновых изображениях существует три вида разрывов: точка, линия и граница. Для обнаружения всех трех видов неоднородностей могут быть использованы пространственные маски.

В технической литературе приведено и описано большое количество алгоритмов выделения контуров и границ. В данной работе рассмотрены наиболее популярные методы. К ним относятся: оператор Робертса, Собеля, Превитта, Кирша, Робинсона, алгоритм Канни и LoG-алгоритм.

Оператор Робертса

Оператор выделения границ Робертса введен Лоуренсом Робертсом в 1964 году. Он выполняет простые и быстрые вычисления двумерного пространственного измерения на изображении. Этот метод подчеркивает области высокой пространственной частоты, которые зачастую соответствуют краям. На вход оператора подается полутоновое изображение. Значение пикселей выходного изображения в каждой точке предполагает некую величину пространственного градиента входного изображения в этой же точке.

Оператор Собеля

Оператор Собеля введен Собелем в 1970 году. Данный метод обнаружения границ использует приближение к производной. Это позволяет обнаруживать край в тех местах, где градиент самый высокий. Данный способ обнаруживает количество градиентов на изображении, тем самым выделяя области с высокой пространственной частотой, которые соответствуют границам. В целом это привело к нахождению предполагаемой абсолютной величине градиента в каждой точке входного изображения. Данный оператор состоит из двух матриц, размером 3×3. Вторая матрица отличается от первой только тем, что повернута на 90 градусов. Это очень похоже на оператор Робертса.

Обнаружение границ данным методом вычислительно гораздо проще, чем методом Собеля, но приводит к большей зашумленности результирующего изображения.

Оператор Превитта

Обнаружение границ данным оператором предложено Превиттом в 1970 году. Правильным направлением в данном алгоритме была оценка величины и ориентация границы. Даже при том, что выделение границ является весьма трудоемкой задачей, такой подход дает весьма неплохие результаты. Данный алгоритм базируется на использовании масок размером 3 на 3, которые учитывают 8 возможных направлений, но прямые направления дают наилучшие результаты. Все маски свертки рассчитаны.

Оператор Кирша

Обнаружение границ этим методом было введено Киршем в 1971 году. Алгоритм основан на использовании всего одной маски, которую вращают по восьми главным направлениям: север, северо-запад, запад, юго-запад, юг, юго-восток, восток и северо-восток. Маски имеют следующий вид:

Величина границы определена как максимальное значение, найденное с помощью маски. Определенное маской направление выдает максимальную величину. Например, маска k 0 соответствует вертикальной границе, а маска k 5 — диагональной. Можно также заметить, что последние четыре маски фактически такие же, как и первые, они являются зеркальным отражением относительно центральной оси матрицы.

Оператор Робинсона

Метод Робинсона, введенное в 1977, подобен методу Кирша, но является более простым в реализации в силу использования коэффициентов 0, 1 и 2. Маски данного оператора симметричны относительно центральной оси, заполненной нулями. Достаточно получить результат от обработки первых четырех масок, остальные же можно получить, инвертируя первые.

Максимальное значение, полученное после применения всех четырех масок к пикселю и его окружению считается величиной градиента, а угол градиента можно аппроксимировать как угол линий нулей в маске, которые дают максимальный отклик.

Выделение контура методом Marr-Hildreth

Marr-Hildreth (1980) метод — метод обнаружения границ в цифровых изображениях, который обнаруживает непрерывные кривые везде, где заметны быстрые и резкие изменения яркости группы пикселей. Это довольно простой метод, работает он с помощью свертки изображения с LoG-функцией или как быстрая аппроксимация с DoG. Нули в обработанном результате соответствуют контурам. Алгоритм граничного детектора состоит из следующих шагов:

размытие изображение методом Гаусса;
применение оператора Лапласса к размытому изображению (часто первые два шага объединены в один);
производим цикл вычислений и в полученном результате смотрим на смену знака. Если знак изменился с отрицательного на положительный и значение изменения значения более, чем некоторый заданный порог, то определить эту точку, как границу;
Для получения лучших результатов шаг с использованием оператора Лапласса можно выполнить через гистерезис так, как это реализовано в алгоритме Канни.

Выделение контура методом LoG

Алгоритм выделения контуров Лаплассиан Гауссиана был предложен в 1982 году. Данный алгоритм является второй производной, определенной как:

Он осуществляется в два шага. На первом шаге он сглаживает изображение, а затем вычисляет функцию Лапласса, что приводит к образованию двойных контуров. Определение контуров сводится к нахождению нулей на пересечении двойных границ. Компьютерная реализация функции Лапласса обычно осуществляется через следующую маску:

Лаплассиан обычно использует нахождение пикселя на темной или светлой стороне границы.

Детектор границ Канни

Детектор границ Канни является одной из самых популярных алгоритмов обнаружения контуров. Впервые он был предложен Джоном Канни в магистерской диссертации в 1983 году, и до сих пор является лучше многих алгоритмов, разработанных позднее. Важным шагом в данном алгоритме является устранение шума на контурах, который в значительной мере может повлиять на результат, при этом необходимо максимально сохранить границы. Для этого необходим тщательный подбор порогового значения при обработке данным методом.

Алгоритм:

размытие исходного изображения f(r, c) с помощью функции Гаусса f^(r, c). f^(r, c)=f(r,c)*G(r,c,6);
выполнить поиск градиента. Границы намечаются там, где градиент принимает максимальное значение;
подавление не-максимумов. Только локальные максимумы отмечаются как границы;
итоговые границы определяются путем подавления всех краев, не связанных с определенными границами.

В отличии от операторов Робертса и Собеля, алгоритм Канни не очень восприимчив к шуму на изображении.

Экспериментальные результаты

В данном разделе представлены результаты работы описанных ранее алгоритмов обнаружения границ объектов на изображении.

Все описанные алгоритмы были реализованы в программной среде MATLAB R2009a и протестированы на фотографии университета. Цель эксперимента заключается в получении обработанного изображения с идеально выделенными контурами. Оригинальное изображение и результаты его обработки представлены на рисунке 1.

Рисунок 1 — Оригинальное изображение и результат работы различных алгоритмов выдеоения контуров

При анализе полученных результатов были выявлены следующие закономерности: операторы Робертса, Собеля и Превитта дают очень различные результаты. Marr-Hildreth, LoG и Канни практически одинаково обнаружили контуры объекта, Кирш и Робинсон дали такой же результат. Но наблюдая полученные результаты можно сделать вывод, что алгоритм Канни справляется на порядок лучше других.

Выводы

Обработка изображений — быстро развивающаяся область в дисциплине компьютерного зрения. Ее рост основывается на высоких достижениях в цифровой обработке изображений, развитию компьютерных процессоров и устройств хранения информации.

В данной статье была предпринята попытка изучить на практике методы выделения контуров объектов, основанных на разрывах яркости полутонового изображения. Исследование относительной производительности каждого из приведенных в данной статье методов осуществлялся с помощью программного средства MATLAB. Анализ результатов обработки изображения показал, что такие методы, как Marr-Hildreth, LoG и Канни дают практически одинаковые результаты. Но все же при обработке данного тестового изображения наилучшие результаты можно наблюдать после работы алгоритма Канни, хотя при других условиях лучшим может оказаться другой метод.

Даже учитывая тот факт, что вопрос обнаружения границ на изображении достаточно хорошо осветлен в современной технической литературе, он все же до сих пор остается достаточно трудоемкой задачей, так как качественное выделение границ всегда зависит от множества влияющих на результат факторов.

Список использованной литературы

1. Canny J.F. (1983) Finding edges and lines in images, Master"s thesis, MIT. AI Lab. TR-720.
2. Canny J.F. (1986) A computational approach to edge detection , IEEE Transaction on Pattern Analysis and Machine Intelligence, 8. — P. 679-714.
3. Courtney P, Thacker N.A. (2001) Performance Characterization in Computer Vision: The Role of Statistics in Testing and Design , Chapter in: Imaging and Vision Systems: Theory, Assessment and Applications , Jacques Blanc-Talon and Dan Popescu (Eds.), NOVA Science Books.
4. Hanzi Wang (2004) Robust Statistics for Computer Vision: Model Fitting, Image Segmentation and Visual Motion Analysis, Ph.D thesis, Monash University, Australia.
5. Huber P.J. (1981) Robust Statistics, Wiley New York.
6. Kirsch R. (1971) Computer determination of the constituent structure of biological images , Computers and Biomedical Research, 4. — P. 315–328.
7. Lakshmi S, Sankaranarayanan V. (2010) A Study of edge detection techniques for segmentation computing approaches , Computer Aided Soft Computing Techniques for Imaging and Biomedical Applications. — P. 35-41.
8. Lee K., Meer P. (1998) Robust Adaptive Segmentation of Range Images , IEEE Trans. Pattern Analysis and Machine Intelligence, 20(2). — P. 200-205.
9. Marr D, Hildreth E. (1980) Theory of edge detection , Proc. Royal Society of London, B, 207. — P. 187–217.
10. Marr D. (1982) Vision, Freeman Publishers.
11. Marr P., Doron Mintz. (1991) Robust Regression for Computer Vision: A Review , International Journal of Computer Vision, 6(1). — P. 59-70.
12. Orlando J. Tobias, Rui Seara (2002) Image Segmentation by Histogram Thresholding Using Fuzzy Sets , IEEE Transactions on Image Processing, Vol.11, No.12. — P. 1457-1465.
13. Punam Thakare (2011) A Study of Image Segmentation and Edge Detection Techniques , International Journal on Computer Science and Engineering, Vol 3, No.2. — P. 899-904.
14. Rafael C., Gonzalez, Richard E. Woods, Steven L. Eddins (2004) Digital Image Processing Using MATLAB, Pearson Education Ptd. Ltd, Singapore.
15. Ramadevi Y. (2010) Segmentation and object recognition using edge detection techniques , International Journal of Computer Science and Information Technology, Vol 2, No.6. — P. 153-161.
16. Roberts L. (1965) Machine Perception of 3-D Solids , Optical and Electro-optical Information Processing, MIT Press.
17. Robinson G. (1977) Edge detection by compass gradient masks , Computer graphics and image processing, 6. — P. 492-501.
18. Rousseeuw P. J., Leroy A. (1987) Robust Regression and outlier detection, John Wiley & Sons, New York.
19. Senthilkumaran N., Rajesh R. (2009) Edge Detection Techniques for Image Segmentation — A Survey of Soft Computing Approaches , International Journal of Recent Trends in Engineering, Vol. 1, No. 2. — P. 250-254.
20. Sowmya B., Sheelarani B. (2009) Colour Image Segmentation Using Soft Computing Techniques , International Journal of Soft Computing Applications, Issue 4. — P. 69-80.
21. Umesh Sehgal (2011) Edge detection techniques in digital image processing using Fuzzy Logic , International Journal of Research in IT and Management, Vol.1, Issue 3. — P. 61-66.
22. Yu, X, Bui, T.D. & et al. (1994) Robust Estimation for Range Image Segmentation and Reconstruction , IEEE trans. Pattern Analysis and Machine Intelligence, 16 (5). — P. 530-538.

Example

Рисунки к патенту РФ 2510897

ФОРМУЛА ИЗОБРЕТЕНИЯ

Введение

Сегментация изображений

Алгоритмы выделение границ

Оператор Робертса

Оператор Собеля

Оператор Превитта

Оператор Кирша

Оператор Робинсона

Выделение контура методом Marr-Hildreth

Выделение контура методом LoG

Детектор границ Канни

Экспериментальные результаты

Выводы

Список использованной литературы

Популярное