Operacje punktowe i kontekstowe. Przestrzenna filtracja ... · (c) rysunek po transformacji. gdzie...

Operacje punktowe i kontekstowe.

Przestrzenna filtracja obrazów.

Rodzaje przekształceń na obrazach

Metody przekształcania obrazów, zarówno monochromatycznych jak i barwnych można podzielić na kilka grup:

przekształcenia punktowe (bezkontekstowe) – przekształcenia są funkcją wartości pikseli i nie zależą od lokalizacji i sąsiedztwa (otoczenia, kontekstu) przekształcanego piksela. Przekształcenia punktowe zachowują cechy przestrzenne i geometryczne w obrazie, a zmianie mogą ulec jedynie wartości (jasność) poszczególnych pikseli w obrazie. Najczęstszymi operacjami są operacje liniowe, potęgowe oraz logarytmiczne. Przekształcenia punktowe należą do najprostszych metod poprawy jakości obrazu (image enhancement),

przekształcenia kontekstowe,

przekształcenia morfologiczne,

przekształcenia geometryczne.

Mnożenie obrazu przez liczbę

Skalowanie obrazu (mnożenie obrazu przez liczbę).

Operacja dla dużych wartości parametru może powodować silne nasycenie wartości pikseli (przekraczanie dopuszczalnej wartości) i w konsekwencji utratę informacji. Konieczna jest normalizacja obrazu wynikowego. Operacja powoduje modyfikację kontrastu.

Pytanie: jak operacja skalowania modyfikuje histogram obrazu?

Rys. Dwa przykład mnożenia obrazu przez liczbę (tu: =4, oraz =20, odpowiednio). Operacja pozwala wydobyć z obrazu elementy

wcześniej niewidoczne, jednocześnie nasycając jasne partie obrazu.

a b c d

Przesunięcie (image offset)

Przesunięcie obrazu (image offset) jest prostą liniową operacją punktową opisaną równaniem

gdzie f jest obrazem wejściowym, f’ obrazem wyjściowym, L[0,255] jest parametrem przesunięcia.

Dla L>0 obraz wyjściowy jest rozjaśnioną wersją obrazu wejściowego. Konieczne jest uwzględnienie przypadków, gdy wartości pikseli obrazu wyjściowego przekraczają wartości dopuszczalne. Sytuacja taka prowadzi do częściowej lub całkowitej (w skrajnym przypadku L>255) utraty informacji. Utrata jest nieodwracalna.

Relacje przestrzenne pomiędzy pikselami oraz kontrast obrazu pozostają niezmienione. Zmianie (przesunięciu) ulega średnia oraz histogram obrazu:

a

Rys. Negatywny przykład przesunięcia obrazu. (a) – obraz oryginalny, (b)

obraz przekształcony, dla L=140. Widoczna utrata informacji.

Operacja MOŻE poprawić jakość wizualną obrazu.

Wykorzystanie operacji…

b

Negatyw obrazu (skalowanie + offset)

Przykłady

Obraz oryginalny Obraz 50

Obraz 100 Obraz 100

Obraz x2 Obraz x3

a b

c d

ef

Rys.1. Przykład prostych operacji arytmetycznych

wykonanych na danych obrazowych: a) obraz

oryginalny; b) zwiększenie wartości każdego

piksela obrazu o stałą wartość równą 50; c)

zwiększenie wartości pikseli obrazu o wartość 100;

d) zmniejszenie wartości pikseli o wartość 100; e),

f) wynik mnożenia wartości każdego piksela przez

czynnik, odpowiednio, 2 i 3.

Przekształcenia logarytmiczne obrazu

a

b

Rys.1. Przykład zastosowania funkcji logarytmicznej (a) do korekcji obrazu. Na rysunku (b) przedstawiony jest obraz przez transformacją,

(c) rysunek po transformacji.

gdzie f(x,y) – piksel obrazu wejściowego, g(x,y) – piksel

obrazu wyjściowego, c – czynnik normujący.

Przekształcenie wykorzystywane do selektywnego

podwyższenia kontrastu (różnicowania) w obszarze małych

wartości pikseli, przy jednoczesnym zmniejszeniu dynamiki

w obszarów jasnych.

Operacja logarytmowania powoduje globalne rozjaśnienie

obrazu.

Przekształcenia logarytmiczne obrazu opisane są

równaniem:

50 100 150 200 250

50

100

150

200

250

a

Operacje potęgowania

gdzie f(x,y) – obraz wejściowy, g(x,y) – obraz wyjściowy, c –

czynnik normujący, - parametr przekształcenia.

Efekt przekształceń potęgowych uzależniony jest od wartości

parametru .

Dla >1uzyskuje się efekt zwiększenia kontrastu w obszarze

dużych wartości pikseli (jasne partie obrazu). Dla 0<<1efektem

jest zwiększenie kontrastu w obszarze małych wartości pikseli

(ciemne partie obrazu) przy jednoczesnym zmniejszeniu

kontrastu jasnych partii obrazu.

Przekształcenie potęgowe obrazu opisane jest równaniem

Rys.1. Krzywe potęgowe dla różnych wartości

parametru . [Gonzalez, Woods].

Rys.2. Pierwszy wiersz: pola o jasności [0,60]. Drugi wiersz: pola o jasności [0,190].

Operacje potęgowania - ilustracja

Rys.1. Przykład wykorzystania funkcji potęgowej do korekcji jakości obrazu. (a) – obraz oryginalny; (b), (c), (d) obrazy po wykonaniu

transformacji potęgowej dla współczynnika równego odpowiednio: 3, 4 oraz 5. Minimum z wartości pikseli obrazu (a) jest równe 176.

a b

c d

Operacje potęgowania - ilustracja

Rys.1. Przykład niewłaściwego wykorzystania funkcji potęgowej do korekcji obrazu cyfrowego. (a) – obraz oryginalny wymagający korekcji;

obrazy (b), (c) i (d) przedstawiają efekt transformacji potęgowej dla równego odpowiednio: 0.5, 0.25, 0.1

a b

c d

Przekształcenia kawałkami liniowe

50 100 150 200 250

0.025

0.05

0.075

0.1

0.125

0.15

0.175Histogramy obrazow

Rys.1. Przykład rozciągania histogramu obrazu o słabym kontraście: a) wykres funkcji transformującej obraz; b) obraz oryginalny, c) obraz po

przekształceniu; d) histogram obrazu oryginalnego (krzywa czerwona) oraz przekształconego (krzywa niebieska). Wartość minimalna i maksymalna pikseli w

obrazie oryginalnym wynosi odpowiednio: 94 i 119. Przekształcenie tego typu jest nieodwracalne (dlaczego?).

50 100 150 200 250

50

100

150

200

250

Funkcja przeksztalcenia

Obraz oryginalny Obraz przeksztalcony

a b dc

Obraz przeksztalcony

50 100 150 200 250

50

100

150

200

250

Krzywa przeksztalcenia

50 100 150 200 250

50

100

150

200

250

Rys.2. Przykłady przekształceń obrazów funkcjami kawałkami liniowymi: a) – wycięcie przedziału wartości jasności; b) – negowanie obrazu.

Przekształcenie (a) jest nieodwracalne. Negacja obrazu jest operacją odwracalną.

ab

Przekształcenia kawałkami liniowe są najbardziej elastyczne z przekształceń dotychczas omówionych.

Pozwalają na dowolne modelowanie funkcji przekształcenia w zależności od obrazu wejściowego i pożądanego

efektu.

Rozciąganie histogramu

Operacja rozciągania histogramu (full-scale histogram stretching, FSHS) wykonywana jest dla obrazów o słabej dynamice, nieefektywnie wykorzystujących dostępną przestrzeń wartości pikseli (obrazy o histogramach zlokalizowanych w wąskim przedziale).

Rozciąganie histogramu jest operacją punktową wykonywaną na obrazie oryginalnym, piksel po pikselu. Niech oryginalny przedział zmienności wartości pikseli dany jest przez [A,B], natomiast [0,L-1] niech jest dostępnym przedziałem zmienności. Wówczas operacja rozciągania histogramu, FSHS, dana jest przez równanie:

gdzie f(x,y) jest wartością piksela o współrzędnych (x,y) obrazu oryginalnego.

a b

Rys. Przykład operacji rozciągania histogramu. (a), (b)

odpowiednio obraz oryginalny oraz jego histogram, (c),

(d) – obraz po rozciągnięciu histogramu oraz

odpowiadający mu histogram. Wartości pikseli w obrazie

oryginalnym przyjmują wartości z przedziału [131,177], w

obrazie wynikowym pokrywają cały dostępny zakres

[0,255].

Rozciąganie histogramu

Zwiększa dynamikę obrazu (szerszy przedział wartości pikseli jakie pojawiają się w obrazie wyjściowym). Powoduje zwiększenie kontrastu w obrazie.

Pozwala na efektywniejsze wykorzystanie dostępnego przedziału wartości pikseli (np. dla obrazów 8 bitowych, jest to przedział [0..255].

c d

Rozciąganie histogramu z progiem

Rys. Przykład operacji rozciągania histogramu z progiem. (a) – obraz oryginalny, (b) – histogram obrazu oryginalnego, (c) – fragment

histogramu obrazu oryginalnego obcięty dla liczby wystąpień pikseli mniejszej od 100, (d) - obraz po rozciągnięciu histogramu z progiem

t=80 (próg pomija wartości mniej niż 0,65% całkowitej liczby pikseli 120 000).

W przypadku stosowania podstawowej wersji algorytmu rozciągania histogramu widoczną poprawę kontrastu uzyskuje się jedynie w przypadkach, gdy wartości histogramu są zerowe w szerokich zakresach [0,A) oraz (B,255]. W pozostałych przypadkach metoda może nie wnieść zauważalnych różnić lub nie wnosi ich w ogóle.

W takich przypadkach właściwe jest zastosowanie rozciągania histogramu przy pominięciu poziomów jasności, dla których liczba odpowiadających pikseli jest mniejsza od zadanego progu. Rozciągana jest wówczas środkowa część oryginalnego histogramu.

a

50 100 150 200 250

20

40

60

80

100

50 100 150 200 250

2000

4000

6000

8000

10000

12000

b

c

d

Wygładzanie histogramu

Wygładzanie histogramu jest operacją pożądana z punktu widzenia teorii informacji, ponieważ obraz o płaskim histogramie, w którym prawdopodobieństwa poszczególnych wartości (jasności) pikseli są identyczne, posiada maksymalną entropię, tzn. niesie najwięcej informacji. Jeśli dowolna z możliwych wartości pikseli jest bardziej prawdopodobna niż inne wówczas entropia maleje, a tym samym zmniejszeniu ulega ilość informacji w obrazie.

Wygładzanie histogramu sprowadza się do takiego przekształcenia wartości pikseli, by w równych przedziałach wartości pikseli (oś odciętych histogramu) liczba pikseli przyjmujących te wartości była w przybliżeniu identyczna.

Przyjmując, że dozwolone wartości pikseli leżą w przedziale [0,1] wygładzanie histogramu dane jest równaniem:

gdzie f’ jest obrazem wynikowym, natomiast F(.) jest dystrybuantą znormalizowanego histogramu

a b

Rys. Wyrównanie histogramu. (a) – obraz oryginalny; (b) – obraz po przekształceniu.

Wygładzanie histogramu - ilustracja

Wygładzanie histogramu jest operacją globalną i może prowadzić do pogorszenia wizualnej jakości obrazu poprzez niepożądaną utratę szczegółów obrazu.

Rys. Pogorszenie jakości obrazu po transformacji wygładzania histogramu.

a b

Kontekstowa filtracja obrazu. Filtry liniowe

f(x-1,y+1)

w(-1,-1) w(-1,0) w-1,1)

w(0,-1) w(0,0) w(0,1)

w(1,-1) w(1,0) w(1,1)

f(x-1,y-1) f(x-1,y)

f(x,y-1) f(x,y) f(x,y+1)

f(x+1,y-1) f(x+1,y) f(x+1,y+1)

g(x,y)

Maska przekształcenia

Obraz oryginalny Obraz wyjściowy

Filtracja obrazu jest operacją kontekstową w której wartość piksela obrazu wynikowego wyznaczana jest jako kombinacja

wartości pikseli z sąsiedztwa.

Filtracja wykonywana jest w celu: usuwania zakłóceń i szumu w obrazie, wzmacniania niektórych elementów obrazu (np.

krawędzi), poprawy jakości wizualnej obrazu, rekonstrukcji obrazu.

Filtracja liniowa realizowana jest jako operacja dwuwymiarowego splotu dyskretnego:

gdzie f(x,y) jest obrazem wejściowym, g(x,y) – obrazem wyjściowym, współczynniki w określają rodzaj i postać

przekształcenia i stanowią razem maskę (jądro) przekształcenia.

Rys.1. Schemat liniowej filtracji obrazu.

Należy zwrócić uwagę na

specjalną obsługę pikseli leżących

bezpośrednio na brzegu obrazu

(istnieje kilka sposób obsługi

takiej sytuacji).

Maska w przekształcenia

decyduje o sposobie działania

filtru.

Filtry wygładzające

Zadaniem filtrów wygładzających jest przestrzenne uśrednieniewartości obrazu, prowadzące do redukcji szumów, zakłóceń oodpowiedniej charakterystyce oraz niewielkich fluktuacji wartościpikseli w obszarach porównywalnych z rozmiarem jądraprzekształcenia. Niepożądanym efektem ubocznym filtracji tegotypu jest osłabienie (rozmycie) konturów obiektów w obrazie izmniejszenie ostrości obrazu.

Działanie filtrów uśredniających jest równoważne z tłumieniemskładowych obrazu o dużych częstotliwościach, przy jednoczesnympozostawieniu w obrazie składowych o małych częstotliwościach.Filtry te działają więc jak typowe filtry dolnoprzepustowe.

Filtry wygładzające realizowane są jako przekształcenia zmaskami określonego kształtu i rozmiaru. Najczęściejwykorzystywaną maską jest maska kwadratowa. Najprostszymprzykładem filtru tego typu jest filtr uśredniający reprezentowanyprzez maskę 3x3:

Wynik filtracji zależy od wartości współczynników (wag) filtruoraz jego rozmiaru i kształtu. W ogólności zwiększanie rozmiarumaski filtru powoduje silniejsze rozmycie (zmniejszenie ostrości)obrazu, ze względu na uśrednianie w większym obszarze.Jednocześnie zwiększa się złożoność obliczeniowaprzekształcenia.

Efekt wygładzenia można zmniejszyć przez zwiększenie wagipunktu centralnego, na którym centrowana jest maskaprzekształcenia.

Rys. 1. Wynik filtracji dolnoprzepustowej obrazu oryginalnego przedstawionego na rysunku (a). (b), (c) i (d) przedstawiają obrazy po filtracji z maską,

opowiednio 3x3, 7x7 oraz 17x17. Wszystkie współczynniki filtrów są równe 1. Rysunki (e) i (f) przedstawiają wiersz 230 obrazu oryginalnego oraz obrazu

przedstawionego na rysunku (d).

a b

c d

50 100 150 200 250 300

50

100

150

200

250

50 100 150 200 250 300

50

100

150

200

250ef

1 1 1

1 1 1

1 1 1

1

9

Przestrzenne uśrednianie obrazu – przykład 1

50 100 150 200 250

50

100

150

200

250

300Obraz po filtracji 5x5

50 100 150 200 250

50

100

150

200

250

300Obraz oryginalny

50 100 150 200 250

50

100

150

200

250

300Obraz progowany 48. % max

50 100 150 200 250

50

100

150

200

250

300Obraz progowany 48. % max

a b

50 100 150 200 250

50

100

150

200

250


c

50 100 150 200 250

50

100

150

200

250


d e f

Rys.1. Przykład zastosowania przestrzennej filtracji uśredniającej: a) – obraz oryginalny; b) – e) przykład filtracji filtrem o wielkości odpowiednio 5x5,

11x11 oraz 23x23 piksele; e) – f) efekt dodatkowego progowania obrazów, odpowiednio, c) oraz d) z progiem ustalonym na 48% maksymalnego poziomu

jasności każdego z obrazów.

Rysunek (g) przedstawia wynik maskowania (logiczne AND) obrazu oryginalnego przez obraz (f).

Stosowanie filtrów

uśredniających o różnych

rozmiarach masek daje

efekt eliminacji obiektów

obrazu o rozmiarach

odpowiadających

rozmiarowi filtru. Proces

ten może być

wykorzystany do

eliminacji nieistotnych

szczegółów obrazu.

Niepożądanym efektem w

innych zastosowaniach

jest rozmycie konturów

obiektów.

50 100 150 200 250

50

100

150

200

250

300 g

Filtry gaussowskie

Szczególną klasą filtrów dolnoprzepustowych są filtrygaussowskie, których współczynniki stanowią aproksymacjędwuwymiarowej funkcji Gaussa:

1 4 1

4 32 4

1 4 1

1 3 4 3 1

3 12 19 12 3

4 19 32 19 4

3 12 19 12 3

1 3 4 3 1

0 0 1 2 2 3 2 2 1 0 0

0 1 3 5 8 9 8 5 3 1 0

1 3 7 13 18 21 18 13 7 3 1

2 5 13 24 34 39 34 24 13 5 2

2 8 18 34 50 56 50 34 18 8 2

3 9 21 39 56 64 56 39 21 9 3

2 8 18 34 50 56 50 34 18 8 2

2 5 13 24 34 39 34 24 13 5 2

1 3 7 13 18 21 18 13 7 3 1

0 1 3 5 8 9 8 5 3 1 0

0 0 1 2 2 3 2 2 1 0 0

Filtry gaussowskie są filtrami symetrycznymi w którychnajwiększą wagę otrzymuje współczynnik odpowiadającyelementowi centralnemu, a współczynniki mają tym mniejsząwartość im większa jest ich odległość od elementu centralnego.

Rozmiar maski filtru gaussowskiego powinien być dobranyzależnie od wartości parametru (wariancji) funkcji Gaussa.Zwykle przyjmuje się maskę o rozmiarze 6 x 6 .

Przykłady masek dla filtrów gaussowskich podane są obok.

Rys.1. Przykłady jąder (masek) przekształceń

gaussowskich dla różnych wartości odchylenia

standardowego .

a

b

c

Filtr gaussowski – przykład

a b c

Rys.1. Porównanie działania filtru Gaussa oraz prostego filtru uśredniającego dla identycznych rozmiarów masek, w tym przypadku równych

11x11 pikseli.

(a) – obraz oryginalny; (b) – wynik filtracji Gaussa; (c) – wynik filtracji prostym filtrem uśredniającym. Widoczna jest silniejsza degradacja

obrazu (c) w stosunku do obrazu (b).

Usuwanie zakłóceń

Usuwanie zakłóceń za pomocą filtrów liniowych, np..filtru Gaussa, nie oznacza fizycznego wyeliminowaniazakłócenia. Znacznie lepsze efekty osiągają w takimprzypadku filtry nieliniowe, m. in. różne warianty filtrówmedianowych.

Filtry wygładzające dokonują osłabienia i rozproszeniazakłócenia na piksele sąsiednie oraz wprowadzają doobrazu nowe wartości jasności (patrz Rys. 2)

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 255 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 5 20 5 0 0 0 0

0 0 0 0 20 157 20 0 0 0 0

0 0 0 0 5 20 5 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 28 28 28 0 0 0 0

0 0 0 0 28 28 28 0 0 0 0

0 0 0 0 28 28 28 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

2a 2b 2c

Rys.2. Schemat procesu usuwania zakłóceń dla filtru gaussowskiego (2b) oraz prostego uśredniającego (2c). Oryginalny obraz

poddawany filtracji jest przedstawiony na rysunku (2a). Zastosowany filtr gaussowski ma maskę: {{1,4,1},{4,32,4},{1,4,1}}

Rys.1. Rysunek przedstawia przekrój przez wiersz 250 odpowiednio:

obrazu oryginalnego (krzywa czerwona), zakłóconego szumem o

rozkładzie normalnym ze średnią 0 i wariancją 20.0 (krzywa czarna) oraz

obrazu odszumionego filtrem Gaussa z maską 5x5 (krzywa niebieska).

Obrazy przedstawione są na następnym slajdzie.

50 100 150 200 250 300 350

50

100

150

200

250

300 1

Usuwanie zakłóceń. Przykład

cba

de

Rys.1. Przykład zastosowania filtru Gaussa do

filtracji obrazu zakłóconego szumem Gaussa.

a- obraz oryginalny (bez szumu).

(b) - obraz oryginalny po dodaniu szumu o

rozkładzie gaussowskim o zerowej średniej i

odchyleniu standardowym równym 10.0;

(c) – obraz (b) po filtracji filtrem Gaussa z maską

5x5;

Obrazy (d) i (e) to odpowiednio obraz zakłócony

szumem Gaussa o średniej zerowej i odchyleniu

równym 20.0 oraz obraz po filtracji z maską 5x5.

Usuwanie zakłóceń. Przykład zakłóceń impulsowych

a b

Rys.1. Obraz (a) – obraz zakłócony 2% szumem typu salt and pepper; (b) – wynik usuwania zakłócenia przez filtrację gaussowską z

jądrem przekształcenia 5x5.

Przykład wskazuje, że użycie tego typu filtracji do zakłóceń impulsowych (sól i pieprz) jest nieuzasadnione. Właściwym rozwiązaniem

może być w tym przypadku filtracja medianowa.

Filtry górnoprzepustowe

W przeciwieństwie do filtrów dolnoprzepustowych, zadaniem filtrów górnoprzepustowych jest wyostrzanie obrazu.

Podstawowym narzędziem wyostrzania obrazu są operatory wyostrzające – operatory pierwszej i drugiej pochodnej.

Operatory pochodnych wykorzystywane są również jako narzędzia wykrywania krawędzi w obrazie.

Operatory pierwszej i drugiej pochodnej (1D)

Większość procedur wyostrzania obrazu oraz detekcji krawędzi wykorzystujeoperatory pierwszej oraz drugiej pochodnej obrazu, przy czym w takimprzypadku obraz jest dyskretną funkcją dwuwymiarową.

Dla uproszczenia zapiszmy operatory w przypadku jednowymiarowym.Operatory, odpowiednio, pierwszej i drugiej pochodnej mają postać:

a

b

c

Rys. 1. Ilustracja własności pierwszej i drugiej pochodnej sygnału dyskretnego. (a) – sygnał wejściowy. Można

przyjąć, że jest to fragment wiersza pewnego obrazu; (b), (c) odpowiednio pierwsza i druga pochodna sygnału.

5 10 15 20 25 30

1

2

3

4

5

6

5 10 15 20 25 30

-1

1

2

3

4

5 10 15 20 25 30

-4

-2

2

4

Własności pierwszej i drugiej pochodnej:

obie generują zero w obszarach o ustalonej wartości,

dla punktów krawędzi pierwsza pochodna przyjmuje wartości niezerowe(dodatnie lub ujemne w zależności od rodzaju przejścia) w całym obszarzekrawędzi z pominięciem ostatniego punktu. Efektem są stosunkowo rozległeobszary o niezerowych wartościach (grube krawędzie),

punkty krawędzi w obrazie mogą być rozpoznane na podstawie śledzeniawartości pierwszej pochodnej: piksele dla których wartość pierwszej pochodnejprzekracza ustalony próg są interpretowane jako piksele krawędzi,

druga pochodna generuje dwie wartości: ujemną oraz dodatnią dla krawędzio dowolnej grubości. Jest to cecha niepożądana, odpowiedzialna za zjawiskopodwójnego konturu w obrazach po filtracji operatorem drugiej pochodnej,

korzystając z drugiej pochodnej krawędź może być rozpoznana na podstawieśledzenia przejść przez zero (patrz rysunek (c))

Wrażliwość pochodnych na zakłócenia

Rys. 1. Ilustracja wrażliwości pierwszej oraz drugiej pochodnej na zakłócenie szumem

Gaussa. (a) – obraz oryginalny, jego pierwsza oraz druga pochodna; (b) oraz (c)

przedstawia obrazy zakłócone szumem Gaussa o zerowej średniej oraz odchyleniu

standardowym równym odpowiednio 1.0 oraz 10.0. Przykład wskazuje ogólną zasadę

zgodnie z którą druga pochodna jest dużo bardziej wrażliwa na zakłócenia obecne w

obrazie.

a

b

c

Problemem związanym ze stosowaniem pierwszej i drugiejpochodnej jako narzędzia detekcji obszarów o dużej zmiennościwartości pikseli - w szczególności jako narzędzi detekcji krawędzi- jest ich wrażliwość na zakłócenia i artefakty obecne w obrazie.

W przypadku idealnym, niejednorodności wartości pikselipowinny występować jedynie w obszarach odpowiadającychrzeczywistym, fizycznym krawędziom obiektów przedstawionychw obrazie.

Ze względu m. in. na występowanie zakłóceń (szumów),niejednorodności oświetlenia, czy faktury tła obrazu wierna(bezbłędna) detekcja krawędzi w obrazie jest bardzo trudna doosiągnięcia (niemożliwa?). Możliwe jest błędne wykrycie krawędziw obszarze braku krawędzi (błędna odpowiedź pozytywna) lubpominięcie istniejącej krawędzi (błędna odpowiedź negatywna).

Sam proces detekcji najczęściej jest rozszerzany o dodatkoweetapy redukcji zakłóceń, progowania oraz – rzadziej - uzupełnianiaprzerwanych (dziurawych) krawędzi.

W praktyce, nawet zakłócenia, które nie powodują wyraźnegopogorszenia wizualnej jakości obrazu prowadzą do zniekształceniasygnału generowanego przez pierwszą i drugą pochodną. Takasytuacja uniemożliwia poprawną identyfikację obszarówzawierających krawędzie.

Uśrednianie obrazu (filtracja dolnoprzepustowa)

Rys. 1. (a) – obraz oryginalny; (b) – obraz zaszumiony

szumem Gaussa o średniej 0 oraz wariancji 10.0; (c)

przekrój przez wybrany wiersz obrazu zaszumionego

(widoczne zaszumienie); (d) i (e) - odpowiednio pierwsza

i druga pochodna dla wybranego wiersza obrazu

zaszumionego.

(f) – obraz po zastosowaniu filtru Gaussa z maską

przedstawioną na rysunku (j); (g) – przekrój przez wiersz

obrazu uśrednionego; (h) i (i) – odpowiednio pierwsza i

druga pochodna dla wiersza obrazu wygładzonego.

W tym przypadku pozytywny efekt filtracji

dolnoprzepustowej jest bezdyskusyjny. Zakłócenia o innej

charakterystyce powinny być usuwane przez filtrację

innego rodzaju.

a b

c

20 40 60 80 100

50

100

150

200

250

20 40 60 80 100

-20

-10

10

20

30

20 40 60 80 100

-40

-20

20

0 0 0 0 0 0 0 0 0 0 0

0 0 0 1 1 1 1 1 0 0 0

0 0 1 2 4 4 4 2 1 0 0

0 1 2 5 9 11 9 5 2 1 0

0 1 4 9 17 21 17 9 4 1 0

0 1 4 11 21 25 21 11 4 1 0

0 1 4 9 17 21 17 9 4 1 0

0 1 2 5 9 11 9 5 2 1 0

0 0 1 2 4 4 4 2 1 0 0

0 0 0 1 1 1 1 1 0 0 0

0 0 0 0 0 0 0 0 0 0 0

10 20 30 40 50 60 70

50

100

150

200

250

10 20 30 40 50 60

5

10

15

20

10 20 30 40 50 60

-4

-2

2

4

d

e

g

h

i

j

Istotnym etapem detekcji krawędzi jestwstępna filtracja obrazu filtremwygładzającym (dolnoprzepustowym) w celuredukcji wpływu zakłóceń na efekt detekcji.Przykład wpływu filtru dolnoprzepustowegona rezultat detekcji krawędzi pokazany jestna rysunku.

f

Laplasjan – narzędzie wyostrzania obrazów

Laplasjan (druga pochodna) dla dyskretnej funkcji dwuwymiarowej ma postać:

i jest najczęściej realizowany jako przekształcenie z maskami 3x3 postaci:

Laplasjan z maską pierwszej postaci jest izotropowy jedynie dla krawędzi poziomych i pionowych. Włączenie równieżkierunków diagonalnych wymaga stosowania maski drugiej postaci. W takim przypadku laplasjan jest operatorembezkierunkowym. Cecha taka jest niewątpliwą zaletą, ponieważ zastosowanie jednej maski odpowiada detekcji krawędzi odowolnym kierunku. Jest to rozwiązanie o mniejszej złożoności obliczeniowej i czasowej w stosunku do rozwiązańwykorzystujących pierwszą pochodną (metody gradientowe).

Analiza laplasjanu niesie informację o znaku krawędzi, tzn. czy krawędź reprezentuje przejście od wartości mniejszejdo większej czy też przeciwnie.

Możliwe jest stosowanie masek ze zmienionymi znakami współczynników w stosunku do podanych wyżej.

Suma wag masek Laplace’a jest równa zero, dzięki czemu w obszarach stałej wartości pikseli przekształcenie generujeodpowiedź zerową.

W ogólności zastosowanie laplasjanu powoduje pojawianie się w obrazie wynikowym wartości ujemnych.

Laplasjan. Przykład

255 0 0 0 0 0 0 0 0 0 0

255 255 0 0 0 0 0 0 0 0 0

255 255 255 0 0 0 0 0 0 0 0

255 255 255 255 0 0 0 0 0 0 0

255 255 255 255 255 0 0 0 0 0 0

255 255 255 255 255 255 0 0 0 0 0

255 255 255 255 255 255 255 0 0 0 0

255 255 255 255 255 255 255 255 0 0 0

255 255 255 255 255 255 255 255 255 0 0

255 255 255 255 255 255 255 255 255 255 0

255 255 255 255 255 255 255 255 255 255 255

255 0 0 0 0 0 0 0 0 0 0

255 765 765 255 0 0 0 0 0 0 0

255 255 765 765 255 0 0 0 0 0 0

255 0 255 765 765 255 0 0 0 0 0

255 0 0 255 765 765 255 0 0 0 0

255 0 0 0 255 765 765 255 0 0 0

255 0 0 0 0 255 765 765 255 0 0

255 0 0 0 0 0 255 765 765 255 0

255 0 0 0 0 0 0 255 765 765 0

255 0 0 0 0 0 0 0 255 765 0

255 255 255 255 255 255 255 255 255 255 255

Rys. 1. Przykład filtracji obrazu z maską laplasjanu z elementem centralnym równym -8.

(a), (b) – macierz obrazu oraz obraz; (c), (d) – macierz obrazu przetworzonego oraz obraz przetworzony.

Na rysunkach (c) i (d) widoczny jest efekt podwójnego konturu.

a c

b d

Wykorzystanie laplasjanu - przykład

a

b

c

Rys. 1. (a) – obraz oryginalny; (b) – wynik przetwarzania z maską Laplace’a z

elementem centralnym -4; (c) – wynik po przeskalowaniu obrazu (b) do

przedziału [0,255].

Rysunek (b) przedstawia obraz w którym wartości obrazu po zastosowaniu

przekształcenia Laplace’a zostały obcięte do przedziału [0,255]. Wartość

minimalna i maksymalna jakie pojawiają się w obrazie wynikowym to

odpowiednio -299 oraz 303.

Wykorzystanie laplasjanu - przykład

a

b

c

Rys. 1. (a) – obraz oryginalny; (b) – wynik przetwarzania z maską Laplace’a z

elementem centralnym -8; (c) – wynik przeskalowania obrazu (b) do przedziału

[0,255].

W tym przypadku poprawnie odwzorowana została znacznie większa liczba

krawędzi (uwzględnione kierunki diagonalne).

Laplasjan - wyostrzanie obrazu

Laplasjan jest ważnym narzędziem wyostrzania obrazów.Dysponując obrazem wejściowym f(x,y) jest wyostrzoną postaćmożna otrzymać przez odjęcie (lub dodanie) do obrazuwejściowego obrazu będącego wynikiem przetwarzania zmaską Laplace’a:

5 10 15 20 25 30

1

2

3

4

5

6

5 10 15 20 25 30

-4

-2

2

4

5 10 15 20 25 30

-2

2

4

6

8

Rys. 1. Wyostrzanie sygnału jednowymiarowego poprzez sumowanie

(odejmowanie) sygnału z przesuniętym laplasjanem. (a) – sygnał wejściowy,

(b) – druga pochodna sygnału, (c) – wynik odjęcia drugiej pochodnej od

sygnału. Widoczne jest wzmocnienie kontrastu na granicach krawędzi.

Proces ten jest podobny do fizjologicznego tłumienia obocznego

zachodzącego w ludzkim oku i odpowiedzialnego m. in. za powstawanie

tzw. masm Macha.

gdzie znak, + lub -, zależy od postaci masek użytych doprzetwarzania. W przypadku masek przedstawionych napoprzednich rysunkach stosuje się odejmowanie (znak -). Wprzypadku zmiany znaku wag w maskach należy zastosowaćdodawanie (znak +).

Operacja dodania do obrazu wejściowego wynikuwyznaczenia drugiej pochodnej (laplasjanu) powodujezwiększenie kontrastu na krawędziach.

a

b

c

Efekt wyostrzenia krawędzi można dodatkowo wzmocnićpoprzez wprowadzenie czynnika skalującego k, zwiększającegowagę obrazu będącego wynikiem wyznaczenia drugiejpochodnej:

Proces taki jest nazywany podbijaniem częstości wysokich:highboost filtering.

Uwaga: obraz f’(x,y) nie powinien być dodatkowo skalowanydo dopuszczalnego przedziału wartości! Dlaczego?

Laplasjan – wyostrzanie obrazu. Przykład

a

b

c

d

Rys. 1. Wyostrzanie obrazu przy wykorzystaniu operatora Laplace’a. (a) – obraz oryginalny; (b), (c) i (d) przedstawiają obrazy wyostrzone (highboost filtering) dla

współczynnika k równego odpowiednio: 0.5, 1.0 oraz 1.5.

Laplasjan – wyostrzanie obrazu. Przykład

a

b c

Rys. 1. Przykład niewłaściwego przetwarzania obrazu wyostrzonego. (a) – obraz oryginalny z zaznaczonym wierszem 150; (b) – przekrój przez wiersz 150 obrazu

oryginalnego; (c) – przekrój przez wiersz 150 w obrazie wyostrzonym z parametrem k=1.5. Widoczne jest przekroczenie przedziału wartości [0,255]; (d) – przekrój

przez wiersz 150 po dodatkowym przeskalowaniu przedziału wartości przyjmowanych przez piksele do przedziału [0,255].

Efektem tego jest globalne zmniejszenie kontrastu przedstawione na rysunku (e).

100 200 300 400

50

100

150

200

100 200 300 400

-400

-200

200

400

600

100 200 300 400

50

100

150

200

250

d

e

Maskowanie nieostrości (unsharp masking)

Przykładem bardziej ogólnej metody wyostrzania jest metoda maskowania nieostrości. Metoda ta wykorzystujepodobne zjawiska jak poprzednio opisana, ale jest bardziej elastyczna.

Procedura maskowania nieostrości przebiega w następujący sposób:

1. przeprowadź filtrację dolnoprzepustową obrazu oryginalnego (prosty filtr uśredniający lub filtr Gaussa),

2. odejmij obraz wygładzony od obrazu oryginalnego. Wynik odejmowania jest nazywany maską,

3. dodaj maskę do obrazu oryginalnego

Większa elastyczność metody maskowania nieostrości polega na możliwości sterowania nie tylko głębokościąwyostrzenia ale również szerokością.

5 10 15 20

50

100

150

200

250

10 15 20

-10

-5

5

10

10 15 20

100

120

140

160

180

200

5 10 15 20

50

100

150

200

250

10 15 20

-40

-20

20

40

10 15 20

100

150

200

250

a b c

de f

Rys. 1. Przykład maskowania nieostrości w przypadku wykorzystania dwóch różnych filtrów wygładzających.

(a), (b) i (c) – zastosowanie filtru Gaussa 3x3 piksele; (d), (e) i (f) – zastosowanie filtru Gaussa 15x15 pikseli.

Maskowanie nieostrości - przykład

ba c

Rys. 1. (a) – obraz oryginalny; (b) i (c) wynik wyostrzania dwoma metodami opisanymi na poprzedniej stronie.

Operacje punktowe i kontekstowe. Przestrzenna filtracja ... · (c) rysunek po transformacji. gdzie...

Documents

Transcript of Operacje punktowe i kontekstowe. Przestrzenna filtracja ... · (c) rysunek po transformacji. gdzie...