Математическая морфология

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Форма (синяя) и её морфологическое расширение (зеленое) и сужение (желтое) ромбическим структурным элементом.

Математическая морфология (ММ) — (Морфология от греч. μορφή «форма» и λογία «наука») — теория и техника анализа и обработки геометрических структур, основанная на теории множеств, топологии и случайных функциях. В основном применяется в обработке цифровых изображений, но также может быть применима на графах, полигональной сетке, стереометрии и многих других пространственных структурах.

Бинарная морфология[править | править исходный текст]

В бинарной морфологии двоичное изображение, представленное в виде упорядоченного набора (упорядоченного множества) черно-белых точек (пикселей), или 0 и 1. Под областью изображения обычно понимается некоторое подмножество точек изображения. Каждая операция двоичной морфологии является некоторым преобразованием этого множества. В качестве исходных данных принимаются двоичное изображение B и некоторый структурный элемент S. Результатом операции также является двоичное изображение.

Структурный элемент[править | править исходный текст]

Структурный элемент представляет собой некоторое двоичное изображение (геометрическую форму). Он может быть произвольного размера и произвольной структуры. Чаше всего используются симметричные элементы, как прямоугольник фиксированного размере (BOX(l, w)), или круг некоторого диаметра (DISK (d)). В каждом элементе выделяется особая точка, называемая начальной (origin). Она может быть расположена в любом месте элемента, хотя в симметричных это обычно центральный пиксель.

Наиболее распространенные структурные элементы: BOX[H,W] -прямоугольник заданного размера, DISK[R] — диск заданного размера, RING[R] — кольцо заданного размера.

Основные операции[править | править исходный текст]

В начале результирующая поверхность заполняется 0, образуя полностью белое изображение. Затем осуществляется зондирование (probing) или сканирование исходного изображения пиксель за пикселем структурным элементом. Для зондирования каждого пикселя на изображение «накладывается» структурный элемент так, чтобы совместились зондируемая и начальные точки. Затем проверяется некоторое условие на соответствие пикселей структурного элемента и точек изображения «под ним». Если условие выполняется, то на результирующем изображении в соответствующем месте ставится 1 (в некоторых случаях будет добавляться не один единичный пиксель, а все единички из структурного элемента).

По рассмотренной выше схеме выполняются базовые операции. Такими операциями являются расширение и сужение. Производные операции — это некоторая комбинация базовых, выполняемых последовательно. Основными из них являются открытие и закрытие.

Базовые операции[править | править исходный текст]

Перенос[править | править исходный текст]
Пример переноса при t=(2,1).

Операция переноса Xt множества пикселов X на вектор t задаётся в виде Xt={x+t|x∈X}. Следовательно, перенос множества единичных пикселов на бинарном изображении сдвигает все пикселы множества на заданное расстояние. Вектор переноса t может задаваться в виде упорядоченной пары (∆r,∆c), где ∆r — компонент вектора переноса в направлении строк, а ∆c — компонент вектора переноса в направлении столбцов изображения.


Наращивание[править | править исходный текст]
Наращивание изображения структурным элементом квадратом.

Наращивание бинарного изображения A структурным элементом B обозначается A  \oplus B и задается выражением:

A  \oplus B = \bigcup_{b\in B} A_b.

В данном выражении оператор объединения можно считать оператором, применяемым в окрестности пикселов. Структурный элемент B применяется ко всем пикселам бинарного изображения. Каждый раз, когда начало координат структурного элемента совмещается с единичным бинарным пикселом, ко всему структурному элементу применяется перенос и последующее логическое сложение (логическое ИЛИ) с соответствующими пикселами бинарного изображения. Результаты логического сложения записываются в выходное бинарное изображение, которое изначально инициализируется нулевыми значениями.

Наращивание темно синего квадрата дисковым структурным элементом, результирующего на ярко-голубой квадрат с закругленными концами.


Эрозия[править | править исходный текст]
Эрозия изображения структурным элементом квадратом.

Эрозия бинарного изображения А структурным элементом В обозначается A \ominus B и задается выражением:

A \ominus B = \{z\in A | B_{z} \subseteq A\}.

При выполнении операции эрозии структурный элемент тоже проходит по всем пикселам изображения. Если в некоторой позиции каждый единичный пиксел структурного элемента совпадет с единичным пикселом бинарного изображения, то выполняется логическое сложение центрального пиксела структурного элемента с соответствующим пикселом выходного изображения. В результате применения операции эрозии все объекты, меньшие чем структурный элемент, стираются, объекты, соединённые тонкими линиями становятся разъединёнными и размеры всех объектов уменьшаются.

Эрозия темно синего квадрата дисковым структурным элементом, результирующего на ярко-голубой квадрат.

Производные операции[править | править исходный текст]

Замыкание[править | править исходный текст]
Замыкание темно синей формы (объединение двух квадратов) дисковым структурным элементом, результирующего на темно синюю форму и светло-голубые площади.

Замыкание бинарного изображения А структурным элементом В обозначается A \bullet B и задается выражением:

A \bullet B  = (A \oplus B) \ominus B .

Операция замыкания «закрывает» небольшие внутренние «дырки» в изображении, и убирает углубления по краям области. Если к изображению применить сначала операцию наращивания, то мы сможем избавиться от малых дыр и щелей, но при этом произойдёт увеличение контура объекта. Избежать этого увеличения позволяет операция эрозия, выполненная сразу после наращивания с тем же структурным элементом.

Размыкание[править | править исходный текст]
Размыкание темно-синего квадрата дисковым структурным элементом, результирующего на светло синий квадрат с закругленными углами.

Размыканием бинарного изображения А структурным элементом В обозначается A \circ B и задается выражением:

A \circ B  = (A \ominus B) \oplus B .

Операция эрозии полезна для удаления малых объектов и различных шумов, но у этой операции есть недостаток – все остающиеся объекты уменьшаются в размере. Этого эффекта можно избежать, если после операции эрозии применить операцию наращивания с тем же структурным элементом. Размыкание отсеивает все объекты, меньшие чем структурный элемент, но при этом помогает избежать сильного уменьшения размера объектов. Также размыкание идеально подходит для удаления линий, толщина которых меньше, чем диаметр структурного элемента. Также важно помнить, что после этой операции контуры объектов становятся более гладкими.

Условное наращивание[править | править исходный текст]

Выделение границ[править | править исходный текст]

См. также[править | править исходный текст]

Ссылки[править | править исходный текст]

Литература[править | править исходный текст]

  • Л.Шапиро, Дж.Стокман. Компьютерное зрение. изд. — М.: БИНОМ. Лаборатория знаний, 2006. — 752 с.
  • Д.Форсайт, Ж.Понс. Компьютерное зрение. Современный подход. изд. — М.: Вильямс, 2004. — 928 с.