Operacje punktowe i kontekstowe. Przestrzenna filtracja ... · (c) rysunek po transformacji. gdzie...
Transcript of Operacje punktowe i kontekstowe. Przestrzenna filtracja ... · (c) rysunek po transformacji. gdzie...
Operacje punktowe i kontekstowe.
Przestrzenna filtracja obrazów.
Rodzaje przekształceń na obrazach
Metody przekształcania obrazów, zarówno monochromatycznych jak i barwnych można podzielić na kilka grup:
przekształcenia punktowe (bezkontekstowe) – przekształcenia są funkcją wartości pikseli i nie zależą od lokalizacji i sąsiedztwa (otoczenia, kontekstu) przekształcanego piksela. Przekształcenia punktowe zachowują cechy przestrzenne i geometryczne w obrazie, a zmianie mogą ulec jedynie wartości (jasność) poszczególnych pikseli w obrazie. Najczęstszymi operacjami są operacje liniowe, potęgowe oraz logarytmiczne. Przekształcenia punktowe należą do najprostszych metod poprawy jakości obrazu (image enhancement),
przekształcenia kontekstowe,
przekształcenia morfologiczne,
przekształcenia geometryczne.
Mnożenie obrazu przez liczbę
Skalowanie obrazu (mnożenie obrazu przez liczbę).
Operacja dla dużych wartości parametru może powodować silne nasycenie wartości pikseli (przekraczanie dopuszczalnej wartości) i w konsekwencji utratę informacji. Konieczna jest normalizacja obrazu wynikowego. Operacja powoduje modyfikację kontrastu.
Pytanie: jak operacja skalowania modyfikuje histogram obrazu?
Rys. Dwa przykład mnożenia obrazu przez liczbę (tu: =4, oraz =20, odpowiednio). Operacja pozwala wydobyć z obrazu elementy
wcześniej niewidoczne, jednocześnie nasycając jasne partie obrazu.
a b c d
Przesunięcie (image offset)
Przesunięcie obrazu (image offset) jest prostą liniową operacją punktową opisaną równaniem
gdzie f jest obrazem wejściowym, f’ obrazem wyjściowym, L[0,255] jest parametrem przesunięcia.
Dla L>0 obraz wyjściowy jest rozjaśnioną wersją obrazu wejściowego. Konieczne jest uwzględnienie przypadków, gdy wartości pikseli obrazu wyjściowego przekraczają wartości dopuszczalne. Sytuacja taka prowadzi do częściowej lub całkowitej (w skrajnym przypadku L>255) utraty informacji. Utrata jest nieodwracalna.
Relacje przestrzenne pomiędzy pikselami oraz kontrast obrazu pozostają niezmienione. Zmianie (przesunięciu) ulega średnia oraz histogram obrazu:
a
Rys. Negatywny przykład przesunięcia obrazu. (a) – obraz oryginalny, (b)
obraz przekształcony, dla L=140. Widoczna utrata informacji.
Operacja MOŻE poprawić jakość wizualną obrazu.
Wykorzystanie operacji…
b
Negatyw obrazu (skalowanie + offset)
Przykłady
Obraz oryginalny Obraz 50
Obraz 100 Obraz 100
Obraz x2 Obraz x3
a b
c d
ef
Rys.1. Przykład prostych operacji arytmetycznych
wykonanych na danych obrazowych: a) obraz
oryginalny; b) zwiększenie wartości każdego
piksela obrazu o stałą wartość równą 50; c)
zwiększenie wartości pikseli obrazu o wartość 100;
d) zmniejszenie wartości pikseli o wartość 100; e),
f) wynik mnożenia wartości każdego piksela przez
czynnik, odpowiednio, 2 i 3.
Przekształcenia logarytmiczne obrazu
a
b
Rys.1. Przykład zastosowania funkcji logarytmicznej (a) do korekcji obrazu. Na rysunku (b) przedstawiony jest obraz przez transformacją,
(c) rysunek po transformacji.
gdzie f(x,y) – piksel obrazu wejściowego, g(x,y) – piksel
obrazu wyjściowego, c – czynnik normujący.
Przekształcenie wykorzystywane do selektywnego
podwyższenia kontrastu (różnicowania) w obszarze małych
wartości pikseli, przy jednoczesnym zmniejszeniu dynamiki
w obszarów jasnych.
Operacja logarytmowania powoduje globalne rozjaśnienie
obrazu.
Przekształcenia logarytmiczne obrazu opisane są
równaniem:
50 100 150 200 250
50
100
150
200
250
a
Operacje potęgowania
gdzie f(x,y) – obraz wejściowy, g(x,y) – obraz wyjściowy, c –
czynnik normujący, - parametr przekształcenia.
Efekt przekształceń potęgowych uzależniony jest od wartości
parametru .
Dla >1uzyskuje się efekt zwiększenia kontrastu w obszarze
dużych wartości pikseli (jasne partie obrazu). Dla 0<<1efektem
jest zwiększenie kontrastu w obszarze małych wartości pikseli
(ciemne partie obrazu) przy jednoczesnym zmniejszeniu
kontrastu jasnych partii obrazu.
Przekształcenie potęgowe obrazu opisane jest równaniem
Rys.1. Krzywe potęgowe dla różnych wartości
parametru . [Gonzalez, Woods].
Rys.2. Pierwszy wiersz: pola o jasności [0,60]. Drugi wiersz: pola o jasności [0,190].
Operacje potęgowania - ilustracja
Rys.1. Przykład wykorzystania funkcji potęgowej do korekcji jakości obrazu. (a) – obraz oryginalny; (b), (c), (d) obrazy po wykonaniu
transformacji potęgowej dla współczynnika równego odpowiednio: 3, 4 oraz 5. Minimum z wartości pikseli obrazu (a) jest równe 176.
a b
c d
Operacje potęgowania - ilustracja
Rys.1. Przykład niewłaściwego wykorzystania funkcji potęgowej do korekcji obrazu cyfrowego. (a) – obraz oryginalny wymagający korekcji;
obrazy (b), (c) i (d) przedstawiają efekt transformacji potęgowej dla równego odpowiednio: 0.5, 0.25, 0.1
a b
c d
Przekształcenia kawałkami liniowe
50 100 150 200 250
0.025
0.05
0.075
0.1
0.125
0.15
0.175Histogramy obrazow
Rys.1. Przykład rozciągania histogramu obrazu o słabym kontraście: a) wykres funkcji transformującej obraz; b) obraz oryginalny, c) obraz po
przekształceniu; d) histogram obrazu oryginalnego (krzywa czerwona) oraz przekształconego (krzywa niebieska). Wartość minimalna i maksymalna pikseli w
obrazie oryginalnym wynosi odpowiednio: 94 i 119. Przekształcenie tego typu jest nieodwracalne (dlaczego?).
50 100 150 200 250
50
100
150
200
250
Funkcja przeksztalcenia
Obraz oryginalny Obraz przeksztalcony
a b dc
Obraz przeksztalcony
50 100 150 200 250
50
100
150
200
250
Krzywa przeksztalcenia
50 100 150 200 250
50
100
150
200
250
Rys.2. Przykłady przekształceń obrazów funkcjami kawałkami liniowymi: a) – wycięcie przedziału wartości jasności; b) – negowanie obrazu.
Przekształcenie (a) jest nieodwracalne. Negacja obrazu jest operacją odwracalną.
ab
Przekształcenia kawałkami liniowe są najbardziej elastyczne z przekształceń dotychczas omówionych.
Pozwalają na dowolne modelowanie funkcji przekształcenia w zależności od obrazu wejściowego i pożądanego
efektu.
Rozciąganie histogramu
Operacja rozciągania histogramu (full-scale histogram stretching, FSHS) wykonywana jest dla obrazów o słabej dynamice, nieefektywnie wykorzystujących dostępną przestrzeń wartości pikseli (obrazy o histogramach zlokalizowanych w wąskim przedziale).
Rozciąganie histogramu jest operacją punktową wykonywaną na obrazie oryginalnym, piksel po pikselu. Niech oryginalny przedział zmienności wartości pikseli dany jest przez [A,B], natomiast [0,L-1] niech jest dostępnym przedziałem zmienności. Wówczas operacja rozciągania histogramu, FSHS, dana jest przez równanie:
gdzie f(x,y) jest wartością piksela o współrzędnych (x,y) obrazu oryginalnego.
a b
Rys. Przykład operacji rozciągania histogramu. (a), (b)
odpowiednio obraz oryginalny oraz jego histogram, (c),
(d) – obraz po rozciągnięciu histogramu oraz
odpowiadający mu histogram. Wartości pikseli w obrazie
oryginalnym przyjmują wartości z przedziału [131,177], w
obrazie wynikowym pokrywają cały dostępny zakres
[0,255].
Rozciąganie histogramu
Zwiększa dynamikę obrazu (szerszy przedział wartości pikseli jakie pojawiają się w obrazie wyjściowym). Powoduje zwiększenie kontrastu w obrazie.
Pozwala na efektywniejsze wykorzystanie dostępnego przedziału wartości pikseli (np. dla obrazów 8 bitowych, jest to przedział [0..255].
c d
Rozciąganie histogramu z progiem
Rys. Przykład operacji rozciągania histogramu z progiem. (a) – obraz oryginalny, (b) – histogram obrazu oryginalnego, (c) – fragment
histogramu obrazu oryginalnego obcięty dla liczby wystąpień pikseli mniejszej od 100, (d) - obraz po rozciągnięciu histogramu z progiem
t=80 (próg pomija wartości mniej niż 0,65% całkowitej liczby pikseli 120 000).
W przypadku stosowania podstawowej wersji algorytmu rozciągania histogramu widoczną poprawę kontrastu uzyskuje się jedynie w przypadkach, gdy wartości histogramu są zerowe w szerokich zakresach [0,A) oraz (B,255]. W pozostałych przypadkach metoda może nie wnieść zauważalnych różnić lub nie wnosi ich w ogóle.
W takich przypadkach właściwe jest zastosowanie rozciągania histogramu przy pominięciu poziomów jasności, dla których liczba odpowiadających pikseli jest mniejsza od zadanego progu. Rozciągana jest wówczas środkowa część oryginalnego histogramu.
a
50 100 150 200 250
20
40
60
80
100
50 100 150 200 250
2000
4000
6000
8000
10000
12000
b
c
d
Wygładzanie histogramu
Wygładzanie histogramu jest operacją pożądana z punktu widzenia teorii informacji, ponieważ obraz o płaskim histogramie, w którym prawdopodobieństwa poszczególnych wartości (jasności) pikseli są identyczne, posiada maksymalną entropię, tzn. niesie najwięcej informacji. Jeśli dowolna z możliwych wartości pikseli jest bardziej prawdopodobna niż inne wówczas entropia maleje, a tym samym zmniejszeniu ulega ilość informacji w obrazie.
Wygładzanie histogramu sprowadza się do takiego przekształcenia wartości pikseli, by w równych przedziałach wartości pikseli (oś odciętych histogramu) liczba pikseli przyjmujących te wartości była w przybliżeniu identyczna.
Przyjmując, że dozwolone wartości pikseli leżą w przedziale [0,1] wygładzanie histogramu dane jest równaniem:
gdzie f’ jest obrazem wynikowym, natomiast F(.) jest dystrybuantą znormalizowanego histogramu
a b
Rys. Wyrównanie histogramu. (a) – obraz oryginalny; (b) – obraz po przekształceniu.
Wygładzanie histogramu - ilustracja
Wygładzanie histogramu jest operacją globalną i może prowadzić do pogorszenia wizualnej jakości obrazu poprzez niepożądaną utratę szczegółów obrazu.
Rys. Pogorszenie jakości obrazu po transformacji wygładzania histogramu.
a b
Kontekstowa filtracja obrazu. Filtry liniowe
f(x-1,y+1)
w(-1,-1) w(-1,0) w-1,1)
w(0,-1) w(0,0) w(0,1)
w(1,-1) w(1,0) w(1,1)
f(x-1,y-1) f(x-1,y)
f(x,y-1) f(x,y) f(x,y+1)
f(x+1,y-1) f(x+1,y) f(x+1,y+1)
g(x,y)
Maska przekształcenia
Obraz oryginalny Obraz wyjściowy
Filtracja obrazu jest operacją kontekstową w której wartość piksela obrazu wynikowego wyznaczana jest jako kombinacja
wartości pikseli z sąsiedztwa.
Filtracja wykonywana jest w celu: usuwania zakłóceń i szumu w obrazie, wzmacniania niektórych elementów obrazu (np.
krawędzi), poprawy jakości wizualnej obrazu, rekonstrukcji obrazu.
Filtracja liniowa realizowana jest jako operacja dwuwymiarowego splotu dyskretnego:
gdzie f(x,y) jest obrazem wejściowym, g(x,y) – obrazem wyjściowym, współczynniki w określają rodzaj i postać
przekształcenia i stanowią razem maskę (jądro) przekształcenia.
Rys.1. Schemat liniowej filtracji obrazu.
Należy zwrócić uwagę na
specjalną obsługę pikseli leżących
bezpośrednio na brzegu obrazu
(istnieje kilka sposób obsługi
takiej sytuacji).
Maska w przekształcenia
decyduje o sposobie działania
filtru.
Filtry wygładzające
Zadaniem filtrów wygładzających jest przestrzenne uśrednieniewartości obrazu, prowadzące do redukcji szumów, zakłóceń oodpowiedniej charakterystyce oraz niewielkich fluktuacji wartościpikseli w obszarach porównywalnych z rozmiarem jądraprzekształcenia. Niepożądanym efektem ubocznym filtracji tegotypu jest osłabienie (rozmycie) konturów obiektów w obrazie izmniejszenie ostrości obrazu.
Działanie filtrów uśredniających jest równoważne z tłumieniemskładowych obrazu o dużych częstotliwościach, przy jednoczesnympozostawieniu w obrazie składowych o małych częstotliwościach.Filtry te działają więc jak typowe filtry dolnoprzepustowe.
Filtry wygładzające realizowane są jako przekształcenia zmaskami określonego kształtu i rozmiaru. Najczęściejwykorzystywaną maską jest maska kwadratowa. Najprostszymprzykładem filtru tego typu jest filtr uśredniający reprezentowanyprzez maskę 3x3:
Wynik filtracji zależy od wartości współczynników (wag) filtruoraz jego rozmiaru i kształtu. W ogólności zwiększanie rozmiarumaski filtru powoduje silniejsze rozmycie (zmniejszenie ostrości)obrazu, ze względu na uśrednianie w większym obszarze.Jednocześnie zwiększa się złożoność obliczeniowaprzekształcenia.
Efekt wygładzenia można zmniejszyć przez zwiększenie wagipunktu centralnego, na którym centrowana jest maskaprzekształcenia.
Rys. 1. Wynik filtracji dolnoprzepustowej obrazu oryginalnego przedstawionego na rysunku (a). (b), (c) i (d) przedstawiają obrazy po filtracji z maską,
opowiednio 3x3, 7x7 oraz 17x17. Wszystkie współczynniki filtrów są równe 1. Rysunki (e) i (f) przedstawiają wiersz 230 obrazu oryginalnego oraz obrazu
przedstawionego na rysunku (d).
a b
c d
50 100 150 200 250 300
50
100
150
200
250
50 100 150 200 250 300
50
100
150
200
250ef
1 1 1
1 1 1
1 1 1
1
9
Przestrzenne uśrednianie obrazu – przykład 1
50 100 150 200 250
50
100
150
200
250
300Obraz po filtracji 5x5
50 100 150 200 250
50
100
150
200
250
300Obraz oryginalny
50 100 150 200 250
50
100
150
200
250
300Obraz progowany 48. % max
50 100 150 200 250
50
100
150
200
250
300Obraz progowany 48. % max
a b
50 100 150 200 250
50
100
150
200
250
300Obraz po filtracji 11x11
c
50 100 150 200 250
50
100
150
200
250
300Obraz po filtracji 23x23
d e f
Rys.1. Przykład zastosowania przestrzennej filtracji uśredniającej: a) – obraz oryginalny; b) – e) przykład filtracji filtrem o wielkości odpowiednio 5x5,
11x11 oraz 23x23 piksele; e) – f) efekt dodatkowego progowania obrazów, odpowiednio, c) oraz d) z progiem ustalonym na 48% maksymalnego poziomu
jasności każdego z obrazów.
Rysunek (g) przedstawia wynik maskowania (logiczne AND) obrazu oryginalnego przez obraz (f).
Stosowanie filtrów
uśredniających o różnych
rozmiarach masek daje
efekt eliminacji obiektów
obrazu o rozmiarach
odpowiadających
rozmiarowi filtru. Proces
ten może być
wykorzystany do
eliminacji nieistotnych
szczegółów obrazu.
Niepożądanym efektem w
innych zastosowaniach
jest rozmycie konturów
obiektów.
50 100 150 200 250
50
100
150
200
250
300 g
Filtry gaussowskie
Szczególną klasą filtrów dolnoprzepustowych są filtrygaussowskie, których współczynniki stanowią aproksymacjędwuwymiarowej funkcji Gaussa:
1 4 1
4 32 4
1 4 1
1 3 4 3 1
3 12 19 12 3
4 19 32 19 4
3 12 19 12 3
1 3 4 3 1
0 0 1 2 2 3 2 2 1 0 0
0 1 3 5 8 9 8 5 3 1 0
1 3 7 13 18 21 18 13 7 3 1
2 5 13 24 34 39 34 24 13 5 2
2 8 18 34 50 56 50 34 18 8 2
3 9 21 39 56 64 56 39 21 9 3
2 8 18 34 50 56 50 34 18 8 2
2 5 13 24 34 39 34 24 13 5 2
1 3 7 13 18 21 18 13 7 3 1
0 1 3 5 8 9 8 5 3 1 0
0 0 1 2 2 3 2 2 1 0 0
Filtry gaussowskie są filtrami symetrycznymi w którychnajwiększą wagę otrzymuje współczynnik odpowiadającyelementowi centralnemu, a współczynniki mają tym mniejsząwartość im większa jest ich odległość od elementu centralnego.
Rozmiar maski filtru gaussowskiego powinien być dobranyzależnie od wartości parametru (wariancji) funkcji Gaussa.Zwykle przyjmuje się maskę o rozmiarze 6 x 6 .
Przykłady masek dla filtrów gaussowskich podane są obok.
Rys.1. Przykłady jąder (masek) przekształceń
gaussowskich dla różnych wartości odchylenia
standardowego .
a
b
c
Filtr gaussowski – przykład
a b c
Rys.1. Porównanie działania filtru Gaussa oraz prostego filtru uśredniającego dla identycznych rozmiarów masek, w tym przypadku równych
11x11 pikseli.
(a) – obraz oryginalny; (b) – wynik filtracji Gaussa; (c) – wynik filtracji prostym filtrem uśredniającym. Widoczna jest silniejsza degradacja
obrazu (c) w stosunku do obrazu (b).
Usuwanie zakłóceń
Usuwanie zakłóceń za pomocą filtrów liniowych, np..filtru Gaussa, nie oznacza fizycznego wyeliminowaniazakłócenia. Znacznie lepsze efekty osiągają w takimprzypadku filtry nieliniowe, m. in. różne warianty filtrówmedianowych.
Filtry wygładzające dokonują osłabienia i rozproszeniazakłócenia na piksele sąsiednie oraz wprowadzają doobrazu nowe wartości jasności (patrz Rys. 2)
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 255 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 5 20 5 0 0 0 0
0 0 0 0 20 157 20 0 0 0 0
0 0 0 0 5 20 5 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 28 28 28 0 0 0 0
0 0 0 0 28 28 28 0 0 0 0
0 0 0 0 28 28 28 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
2a 2b 2c
Rys.2. Schemat procesu usuwania zakłóceń dla filtru gaussowskiego (2b) oraz prostego uśredniającego (2c). Oryginalny obraz
poddawany filtracji jest przedstawiony na rysunku (2a). Zastosowany filtr gaussowski ma maskę: {{1,4,1},{4,32,4},{1,4,1}}
Rys.1. Rysunek przedstawia przekrój przez wiersz 250 odpowiednio:
obrazu oryginalnego (krzywa czerwona), zakłóconego szumem o
rozkładzie normalnym ze średnią 0 i wariancją 20.0 (krzywa czarna) oraz
obrazu odszumionego filtrem Gaussa z maską 5x5 (krzywa niebieska).
Obrazy przedstawione są na następnym slajdzie.
50 100 150 200 250 300 350
50
100
150
200
250
300 1
Usuwanie zakłóceń. Przykład
cba
de
Rys.1. Przykład zastosowania filtru Gaussa do
filtracji obrazu zakłóconego szumem Gaussa.
a- obraz oryginalny (bez szumu).
(b) - obraz oryginalny po dodaniu szumu o
rozkładzie gaussowskim o zerowej średniej i
odchyleniu standardowym równym 10.0;
(c) – obraz (b) po filtracji filtrem Gaussa z maską
5x5;
Obrazy (d) i (e) to odpowiednio obraz zakłócony
szumem Gaussa o średniej zerowej i odchyleniu
równym 20.0 oraz obraz po filtracji z maską 5x5.
Usuwanie zakłóceń. Przykład zakłóceń impulsowych
a b
Rys.1. Obraz (a) – obraz zakłócony 2% szumem typu salt and pepper; (b) – wynik usuwania zakłócenia przez filtrację gaussowską z
jądrem przekształcenia 5x5.
Przykład wskazuje, że użycie tego typu filtracji do zakłóceń impulsowych (sól i pieprz) jest nieuzasadnione. Właściwym rozwiązaniem
może być w tym przypadku filtracja medianowa.
Filtry górnoprzepustowe
W przeciwieństwie do filtrów dolnoprzepustowych, zadaniem filtrów górnoprzepustowych jest wyostrzanie obrazu.
Podstawowym narzędziem wyostrzania obrazu są operatory wyostrzające – operatory pierwszej i drugiej pochodnej.
Operatory pochodnych wykorzystywane są również jako narzędzia wykrywania krawędzi w obrazie.
Operatory pierwszej i drugiej pochodnej (1D)
Większość procedur wyostrzania obrazu oraz detekcji krawędzi wykorzystujeoperatory pierwszej oraz drugiej pochodnej obrazu, przy czym w takimprzypadku obraz jest dyskretną funkcją dwuwymiarową.
Dla uproszczenia zapiszmy operatory w przypadku jednowymiarowym.Operatory, odpowiednio, pierwszej i drugiej pochodnej mają postać:
a
b
c
Rys. 1. Ilustracja własności pierwszej i drugiej pochodnej sygnału dyskretnego. (a) – sygnał wejściowy. Można
przyjąć, że jest to fragment wiersza pewnego obrazu; (b), (c) odpowiednio pierwsza i druga pochodna sygnału.
5 10 15 20 25 30
1
2
3
4
5
6
5 10 15 20 25 30
-1
1
2
3
4
5 10 15 20 25 30
-4
-2
2
4
Własności pierwszej i drugiej pochodnej:
obie generują zero w obszarach o ustalonej wartości,
dla punktów krawędzi pierwsza pochodna przyjmuje wartości niezerowe(dodatnie lub ujemne w zależności od rodzaju przejścia) w całym obszarzekrawędzi z pominięciem ostatniego punktu. Efektem są stosunkowo rozległeobszary o niezerowych wartościach (grube krawędzie),
punkty krawędzi w obrazie mogą być rozpoznane na podstawie śledzeniawartości pierwszej pochodnej: piksele dla których wartość pierwszej pochodnejprzekracza ustalony próg są interpretowane jako piksele krawędzi,
druga pochodna generuje dwie wartości: ujemną oraz dodatnią dla krawędzio dowolnej grubości. Jest to cecha niepożądana, odpowiedzialna za zjawiskopodwójnego konturu w obrazach po filtracji operatorem drugiej pochodnej,
korzystając z drugiej pochodnej krawędź może być rozpoznana na podstawieśledzenia przejść przez zero (patrz rysunek (c))
Wrażliwość pochodnych na zakłócenia
Rys. 1. Ilustracja wrażliwości pierwszej oraz drugiej pochodnej na zakłócenie szumem
Gaussa. (a) – obraz oryginalny, jego pierwsza oraz druga pochodna; (b) oraz (c)
przedstawia obrazy zakłócone szumem Gaussa o zerowej średniej oraz odchyleniu
standardowym równym odpowiednio 1.0 oraz 10.0. Przykład wskazuje ogólną zasadę
zgodnie z którą druga pochodna jest dużo bardziej wrażliwa na zakłócenia obecne w
obrazie.
a
b
c
Problemem związanym ze stosowaniem pierwszej i drugiejpochodnej jako narzędzia detekcji obszarów o dużej zmiennościwartości pikseli - w szczególności jako narzędzi detekcji krawędzi- jest ich wrażliwość na zakłócenia i artefakty obecne w obrazie.
W przypadku idealnym, niejednorodności wartości pikselipowinny występować jedynie w obszarach odpowiadającychrzeczywistym, fizycznym krawędziom obiektów przedstawionychw obrazie.
Ze względu m. in. na występowanie zakłóceń (szumów),niejednorodności oświetlenia, czy faktury tła obrazu wierna(bezbłędna) detekcja krawędzi w obrazie jest bardzo trudna doosiągnięcia (niemożliwa?). Możliwe jest błędne wykrycie krawędziw obszarze braku krawędzi (błędna odpowiedź pozytywna) lubpominięcie istniejącej krawędzi (błędna odpowiedź negatywna).
Sam proces detekcji najczęściej jest rozszerzany o dodatkoweetapy redukcji zakłóceń, progowania oraz – rzadziej - uzupełnianiaprzerwanych (dziurawych) krawędzi.
W praktyce, nawet zakłócenia, które nie powodują wyraźnegopogorszenia wizualnej jakości obrazu prowadzą do zniekształceniasygnału generowanego przez pierwszą i drugą pochodną. Takasytuacja uniemożliwia poprawną identyfikację obszarówzawierających krawędzie.
Uśrednianie obrazu (filtracja dolnoprzepustowa)
Rys. 1. (a) – obraz oryginalny; (b) – obraz zaszumiony
szumem Gaussa o średniej 0 oraz wariancji 10.0; (c)
przekrój przez wybrany wiersz obrazu zaszumionego
(widoczne zaszumienie); (d) i (e) - odpowiednio pierwsza
i druga pochodna dla wybranego wiersza obrazu
zaszumionego.
(f) – obraz po zastosowaniu filtru Gaussa z maską
przedstawioną na rysunku (j); (g) – przekrój przez wiersz
obrazu uśrednionego; (h) i (i) – odpowiednio pierwsza i
druga pochodna dla wiersza obrazu wygładzonego.
W tym przypadku pozytywny efekt filtracji
dolnoprzepustowej jest bezdyskusyjny. Zakłócenia o innej
charakterystyce powinny być usuwane przez filtrację
innego rodzaju.
a b
c
20 40 60 80 100
50
100
150
200
250
20 40 60 80 100
-20
-10
10
20
30
20 40 60 80 100
-40
-20
20
0 0 0 0 0 0 0 0 0 0 0
0 0 0 1 1 1 1 1 0 0 0
0 0 1 2 4 4 4 2 1 0 0
0 1 2 5 9 11 9 5 2 1 0
0 1 4 9 17 21 17 9 4 1 0
0 1 4 11 21 25 21 11 4 1 0
0 1 4 9 17 21 17 9 4 1 0
0 1 2 5 9 11 9 5 2 1 0
0 0 1 2 4 4 4 2 1 0 0
0 0 0 1 1 1 1 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0
10 20 30 40 50 60 70
50
100
150
200
250
10 20 30 40 50 60
5
10
15
20
10 20 30 40 50 60
-4
-2
2
4
d
e
g
h
i
j
Istotnym etapem detekcji krawędzi jestwstępna filtracja obrazu filtremwygładzającym (dolnoprzepustowym) w celuredukcji wpływu zakłóceń na efekt detekcji.Przykład wpływu filtru dolnoprzepustowegona rezultat detekcji krawędzi pokazany jestna rysunku.
f
Laplasjan – narzędzie wyostrzania obrazów
Laplasjan (druga pochodna) dla dyskretnej funkcji dwuwymiarowej ma postać:
i jest najczęściej realizowany jako przekształcenie z maskami 3x3 postaci:
Laplasjan z maską pierwszej postaci jest izotropowy jedynie dla krawędzi poziomych i pionowych. Włączenie równieżkierunków diagonalnych wymaga stosowania maski drugiej postaci. W takim przypadku laplasjan jest operatorembezkierunkowym. Cecha taka jest niewątpliwą zaletą, ponieważ zastosowanie jednej maski odpowiada detekcji krawędzi odowolnym kierunku. Jest to rozwiązanie o mniejszej złożoności obliczeniowej i czasowej w stosunku do rozwiązańwykorzystujących pierwszą pochodną (metody gradientowe).
Analiza laplasjanu niesie informację o znaku krawędzi, tzn. czy krawędź reprezentuje przejście od wartości mniejszejdo większej czy też przeciwnie.
Możliwe jest stosowanie masek ze zmienionymi znakami współczynników w stosunku do podanych wyżej.
Suma wag masek Laplace’a jest równa zero, dzięki czemu w obszarach stałej wartości pikseli przekształcenie generujeodpowiedź zerową.
W ogólności zastosowanie laplasjanu powoduje pojawianie się w obrazie wynikowym wartości ujemnych.
Laplasjan. Przykład
255 0 0 0 0 0 0 0 0 0 0
255 255 0 0 0 0 0 0 0 0 0
255 255 255 0 0 0 0 0 0 0 0
255 255 255 255 0 0 0 0 0 0 0
255 255 255 255 255 0 0 0 0 0 0
255 255 255 255 255 255 0 0 0 0 0
255 255 255 255 255 255 255 0 0 0 0
255 255 255 255 255 255 255 255 0 0 0
255 255 255 255 255 255 255 255 255 0 0
255 255 255 255 255 255 255 255 255 255 0
255 255 255 255 255 255 255 255 255 255 255
255 0 0 0 0 0 0 0 0 0 0
255 765 765 255 0 0 0 0 0 0 0
255 255 765 765 255 0 0 0 0 0 0
255 0 255 765 765 255 0 0 0 0 0
255 0 0 255 765 765 255 0 0 0 0
255 0 0 0 255 765 765 255 0 0 0
255 0 0 0 0 255 765 765 255 0 0
255 0 0 0 0 0 255 765 765 255 0
255 0 0 0 0 0 0 255 765 765 0
255 0 0 0 0 0 0 0 255 765 0
255 255 255 255 255 255 255 255 255 255 255
Rys. 1. Przykład filtracji obrazu z maską laplasjanu z elementem centralnym równym -8.
(a), (b) – macierz obrazu oraz obraz; (c), (d) – macierz obrazu przetworzonego oraz obraz przetworzony.
Na rysunkach (c) i (d) widoczny jest efekt podwójnego konturu.
a c
b d
Wykorzystanie laplasjanu - przykład
a
b
c
Rys. 1. (a) – obraz oryginalny; (b) – wynik przetwarzania z maską Laplace’a z
elementem centralnym -4; (c) – wynik po przeskalowaniu obrazu (b) do
przedziału [0,255].
Rysunek (b) przedstawia obraz w którym wartości obrazu po zastosowaniu
przekształcenia Laplace’a zostały obcięte do przedziału [0,255]. Wartość
minimalna i maksymalna jakie pojawiają się w obrazie wynikowym to
odpowiednio -299 oraz 303.
Wykorzystanie laplasjanu - przykład
a
b
c
Rys. 1. (a) – obraz oryginalny; (b) – wynik przetwarzania z maską Laplace’a z
elementem centralnym -8; (c) – wynik przeskalowania obrazu (b) do przedziału
[0,255].
W tym przypadku poprawnie odwzorowana została znacznie większa liczba
krawędzi (uwzględnione kierunki diagonalne).
Laplasjan - wyostrzanie obrazu
Laplasjan jest ważnym narzędziem wyostrzania obrazów.Dysponując obrazem wejściowym f(x,y) jest wyostrzoną postaćmożna otrzymać przez odjęcie (lub dodanie) do obrazuwejściowego obrazu będącego wynikiem przetwarzania zmaską Laplace’a:
5 10 15 20 25 30
1
2
3
4
5
6
5 10 15 20 25 30
-4
-2
2
4
5 10 15 20 25 30
-2
2
4
6
8
Rys. 1. Wyostrzanie sygnału jednowymiarowego poprzez sumowanie
(odejmowanie) sygnału z przesuniętym laplasjanem. (a) – sygnał wejściowy,
(b) – druga pochodna sygnału, (c) – wynik odjęcia drugiej pochodnej od
sygnału. Widoczne jest wzmocnienie kontrastu na granicach krawędzi.
Proces ten jest podobny do fizjologicznego tłumienia obocznego
zachodzącego w ludzkim oku i odpowiedzialnego m. in. za powstawanie
tzw. masm Macha.
gdzie znak, + lub -, zależy od postaci masek użytych doprzetwarzania. W przypadku masek przedstawionych napoprzednich rysunkach stosuje się odejmowanie (znak -). Wprzypadku zmiany znaku wag w maskach należy zastosowaćdodawanie (znak +).
Operacja dodania do obrazu wejściowego wynikuwyznaczenia drugiej pochodnej (laplasjanu) powodujezwiększenie kontrastu na krawędziach.
a
b
c
Efekt wyostrzenia krawędzi można dodatkowo wzmocnićpoprzez wprowadzenie czynnika skalującego k, zwiększającegowagę obrazu będącego wynikiem wyznaczenia drugiejpochodnej:
Proces taki jest nazywany podbijaniem częstości wysokich:highboost filtering.
Uwaga: obraz f’(x,y) nie powinien być dodatkowo skalowanydo dopuszczalnego przedziału wartości! Dlaczego?
Laplasjan – wyostrzanie obrazu. Przykład
a
b
c
d
Rys. 1. Wyostrzanie obrazu przy wykorzystaniu operatora Laplace’a. (a) – obraz oryginalny; (b), (c) i (d) przedstawiają obrazy wyostrzone (highboost filtering) dla
współczynnika k równego odpowiednio: 0.5, 1.0 oraz 1.5.
Laplasjan – wyostrzanie obrazu. Przykład
a
b c
Rys. 1. Przykład niewłaściwego przetwarzania obrazu wyostrzonego. (a) – obraz oryginalny z zaznaczonym wierszem 150; (b) – przekrój przez wiersz 150 obrazu
oryginalnego; (c) – przekrój przez wiersz 150 w obrazie wyostrzonym z parametrem k=1.5. Widoczne jest przekroczenie przedziału wartości [0,255]; (d) – przekrój
przez wiersz 150 po dodatkowym przeskalowaniu przedziału wartości przyjmowanych przez piksele do przedziału [0,255].
Efektem tego jest globalne zmniejszenie kontrastu przedstawione na rysunku (e).
100 200 300 400
50
100
150
200
100 200 300 400
-400
-200
200
400
600
100 200 300 400
50
100
150
200
250
d
e
Maskowanie nieostrości (unsharp masking)
Przykładem bardziej ogólnej metody wyostrzania jest metoda maskowania nieostrości. Metoda ta wykorzystujepodobne zjawiska jak poprzednio opisana, ale jest bardziej elastyczna.
Procedura maskowania nieostrości przebiega w następujący sposób:
1. przeprowadź filtrację dolnoprzepustową obrazu oryginalnego (prosty filtr uśredniający lub filtr Gaussa),
2. odejmij obraz wygładzony od obrazu oryginalnego. Wynik odejmowania jest nazywany maską,
3. dodaj maskę do obrazu oryginalnego
Większa elastyczność metody maskowania nieostrości polega na możliwości sterowania nie tylko głębokościąwyostrzenia ale również szerokością.
5 10 15 20
50
100
150
200
250
10 15 20
-10
-5
5
10
10 15 20
100
120
140
160
180
200
5 10 15 20
50
100
150
200
250
10 15 20
-40
-20
20
40
10 15 20
100
150
200
250
a b c
de f
Rys. 1. Przykład maskowania nieostrości w przypadku wykorzystania dwóch różnych filtrów wygładzających.
(a), (b) i (c) – zastosowanie filtru Gaussa 3x3 piksele; (d), (e) i (f) – zastosowanie filtru Gaussa 15x15 pikseli.
Maskowanie nieostrości - przykład
ba c
Rys. 1. (a) – obraz oryginalny; (b) i (c) wynik wyostrzania dwoma metodami opisanymi na poprzedniej stronie.