Porównanie i ocena metod klasyfikacji sygnałów...

3

Click here to load reader

Transcript of Porównanie i ocena metod klasyfikacji sygnałów...

Page 1: Porównanie i ocena metod klasyfikacji sygnałów EEGyadda.icm.edu.pl/yadda/element/bwmeta1.element... · sztucznej inteligencji, przetwarzanie sygnałów, nauki kognitywne. ... Streszczenie

PAK vol. 58, nr 4/2012 369 Grzegorz RUTKOWSKI, Krzysztof PATAN UNIWERSYTET ZIELONOGÓRSKI, INSTYTUT STEROWANIA I SYSTEMÓW INFORMATYCZNYCH ul. Podgórna 50, 65-246 Zielona Góra

Porównanie i ocena metod klasyfikacji sygnałów EEG Mgr inż. Grzegorz RUTKOWSKI Absolwent Uniwersytetu Zielonogórskiego. Stopień inż. otrzymał na Wydziale Elektrotechniki, Informaty-ki i Telekomunikacji w 2005r., a stopień mgr na Wydziale Mechanicznym Uniwersytetu Zielonogór-skiego w roku 2008. Obecnie pracuje jako nauczyciel. Do jego zainteresowań naukowych należą: metody sztucznej inteligencji, przetwarzanie sygnałów, nauki kognitywne. e-mail: [email protected]

Streszczenie

Analiza i interpretacja sygnałów elektroencefalograficznych znalazła szerokie spektrum zastosowań w diagnostyce klinicznej. Pomimo licznych doświadczeń specjalistów, ciągle napotyka się wiele trudności. Powstające problemy związane są m.in. z aspektami technicznymi co spowodowane jest charakterem niestacjonarności w przypadku sygnałów takich jak sygnały EEG. Rozwiązania sprzętowe i programowe w tej dziedzinie są poddawane ciągłej poprawie ze względu na rozwój technologiczny. Bar-dzo obiecującym narzędziem w analizie i interpretacji sygnałów EEG są sztuczne sieci neuronowe. W pracy przedstawiono eksperymenty oparte o analizę i klasyfikację danych biomedycznych za pomocą różnych tech-nik, w tym metod klasycznych takich jak naiwny klasyfikator Bayesa, k najbliższych sąsiadów z zastosowaniem metod sztucznej inteligencji takich jak klasyfikatory SVM czy perceptron wielowarstwowy. Słowa kluczowe: EEG, sztuczne sieci neuronowe, rozpoznawanie obra-zów, klasyfikacja.

Analysis and classification of EEG data. An evaluation of methods

Abstract

Analysis and interpretation methods of electroencephalogram signals have found a broad spectrum of applications in clinical diagnosis. Despite the experience of professionals, biomedical data analysis encounters many difficulties. Measurement problems are associated with both the technical ground that determines the character of non-stationarity of EEG signals and the individual nature of a neurological dysfunction. The existing hardware and software have been continuously improved due to the rapid progress of technological development. Very promising tool in the analysis and interpretation of the EEG signals are artificial neural networks. An electroencephalogram (EEG) is a noninvasive technique for measurement of processes occurring in the human brain. This technique allows direct measurement of electrical potentials of neuronal activity. EEG is thus recording of electrical activity of nerve cells on the surface of the cerebral cortex. Seizures are very important element in clinical diagnosis due to the ongoing search for causal link in generating sudden discharges of electricity. The interpretation of such signals may allow for appropriate treatment and selection of relevant therapy for individual cases. There have been many works in the area of electroencephalography which used artificial neural networks involving among the others in the process of recognizing specific graphoelements, which in turn indicate a definite neurological dysfunction. Neural networks are also able to extract the relevant information contained in the EEG signals and support the process of solving problems, such as the identification of characteristic EEG [1, 5, 6] patterns or determine patterns based on spectral EEG topography [3]. Neural networks are also used to identify artifacts, where inputs to the classifier are implemented in the form of selected parameters of a specific wave length [10]. The paper presents experiments based on the analysis and classification of biomedical data using various techniques, including classical methods such as naive Bayes classifiers, and nearest neighbor using artificial intelligence methods including SVM classifiers and multilayer perceptron. Keywords: EEG, artificial neural networks, pattern recognition, classification.

Dr hab. inż. Krzysztof PATAN Absolwent Wyższej Szkoły Inżynierskiej w Zielonej Górze. Stopień dr inż. otrzymał na Wydziale Mecha-troniki Politechniki Warszawskiej w 2000r., a stopień dr hab. inż. na Wydziale Elektrotechniki, Informatyki i Telekomunikacji Uniwersytetu Zielonogórskiego. Autor i współautor ponad 100 publikacji z zakresu sztucznych sieci neuronowych i ich zastosowań. Do jego zaintereso-wań naukowych należą: metody sztucznej inteligencji, systemy detekcji i lokalizacji uszkodzeń, modelowanie procesów dynamicznych oraz techniki optymalizacji. e-mail: [email protected]

1. Wstępne przetwarzanie sygnału EEG

Jednym z często rejestrowanych zapisów EEG są zaburzenia o podłożu padaczkowym, które mają charakter nagłego wyłado-wania, co powoduje gwałtowny wzrost amplitudy sygnału. Cha-rakterystyka tych wyładowań zdefiniowana jest jako okresowe spontaniczne wyładowania elektryczne na powierzchni kory mó-zgowej, które zakłócają system nerwowy. Ten typ wyładowań może występować lokalnie w mózgu lub być rejestrowany w wielu obszarach jednocześnie, w zależności od stopnia danej dysfunkcji. Takie wyładowania elektryczne mogą pojawić się m.in. w wyniku zmian morfologii w strukturze mózgu, zmian hormonalnych, nagłych zmian w intensywności postrzegania nasileń różnego rodzaju bodźców zewnętrznych lub wystąpienia niepożądanych warunków fizjologicznych. Wnikliwa analiza zapisów EEG może mieć wpływ na podejmowanie właściwych decyzji diagnostycznych o podłożu neurologicznym.

W przedstawionych eksperymentach wykorzystano dane EEG pobrane ze strony ftp://sigftp.cs.tut.fi/pub/eeg-data, które zostały udostępnione do celów badawczych. Dane te zostały zapisane zgodnie ze standardem dla układu bananowego z odprowadzeniem elektrod: F8-C4, F7-C3, T6-O2, T5-O1. Dostępne były cztery kanały pomiarowe. Dobór montażu uwarunkowany został wystą-pieniem napadu epileptycznego, a proces pomiaru został przepro-wadzony z zachowaniem standardów dla pomiarów EEG. Filtr dolnoprzepustowy został ustawiony na 70Hz. Rysunek 1 przed-stawia przykład zapisu EEG zarejestrowanego w układzie bana-nowym.

Rys. 1. Przykład zapisu sygnału EEG Fig. 1. Example of recorded EEG signal

W przedstawionym zapisie zauważalne są zmiany w zachowaniu

sygnału wskazujące na napad epileptyczny począwszy od próbki 1200. W celu przeprowadzenia klasyfikacji dla danego zaburzenia poszczególne sekwencje EEG zostały wstępnie przetworzone.

Page 2: Porównanie i ocena metod klasyfikacji sygnałów EEGyadda.icm.edu.pl/yadda/element/bwmeta1.element... · sztucznej inteligencji, przetwarzanie sygnałów, nauki kognitywne. ... Streszczenie

370 PAK vol. 58, nr 4/2012

W pierwszym etapie sygnały zarejestrowane w każdym kanale zostały podzielone na podciągi o długości równej 200 próbek. Każ-demu z podciągów przydzielono odpowiednio etykiety ze zbioru {zdrowy, chory}. Takie, zestawy wstępnie przygotowanych próbek EEG zostały poddane dalszemu przetwarzaniu.

2. Transformata falkowa

Analiza sygnału niestacjonarnego lub posiadającego charaktery-styki przejściowe, takiego jak sekwencja EEG, wymaga zastosowa-nia innych przekształceń niż klasyczna transformata Fouriera. Ta-kim przekształceniem jest transformata falkowa, która dekompo-nuje sygnał na składowe, które są przesuniętymi i przeskalowa-nymi wersjami falki podstawowej. Falka definiowana jest jako przebieg oscylacyjny o skończonym czasie trwania (posiada no-śnik zwarty), o wartości średniej równej zero. Analiza falkowa określana jest mianem analizy czasowo-skalowej, gdzie skala odpowiada częstotliwości, przy czym największej skali odpowia-dają najniższe częstotliwości. Główną charakterystyką tego prze-kształcenia jest możliwość precyzyjnego definiowania lokalnych charakterystyk sygnałów. W przypadku dyskretnego sygnału EEG można zastosować dyskretną transformatę falkową (ang. Discrete Wavelet Transform, DWT) [7, 8], która operuje na skalach dia-dycznych, które są potęgą dwójki. Diadyczne są także przesunię-cia falek w czasie. Z tego względu DWT można traktować jako dyskretyzację ciągłego przekształcenia falkowego. Wygodnie jest przedstawiać DWT w postaci analizy wielorozdzielczej, gdzie na każdym poziomie reprezentacji sygnał dekomponowany jest na składową zgrubną i składową szczegółową. Na każdym kolejnym poziomie składowa zgrubna z poziomu poprzedniego zostaje ponownie dekomponowana na składowe zgrubną i szczegółową. W ten sposób, przy użyciu odpowiedniej rozdzielczości (liczby poziomów) sygnał można przedstawić z dowolną dokładnością za pomocą ciągu szczegółów. Taka dekompozycja sygnału odbywa się poprzez zastosowanie tzw. filtrów lustrzanych, gdzie filtr dolnoprzepustowy umożliwia uzyskanie składowej zgrubnej, zaś górnoprzepustowy składowej szczegółowej. W eksperymentach użyto falki Daubechies 3 (db3), która została dobrana w sposób eksperymentalny, dając dobre wyniki klasyfikacji.

Kierując się proponowaną metodologią sygnał S można odtwo-rzyć za pomocą współczynników D1, D2, D3 i A3. W analizie wielorozdzielczej rozkład sygnału służy do wyodrębniania cech sygnałów EEG. Wyniki tego rodzaju podejścia w przypadku ekstrakcji cech są przedstawiane w dalszej części artykułu. 3. Klasyfikacja

Określenie podobieństwa dwóch sygnałów EEG można zreali-zować na zasadzie porównania ich cech charakterystycznych. Zadanie wyodrębniania cech charakterystycznych nazywa się ekstrakcją cech. W niniejszej pracy do ekstrakcji cech wykorzy-stano dyskretną transformatę falkową. Wybór postaci falki oraz liczbę poziomów reprezentacji dokonano eksperymentalnie meto-dą prób i błędów. Ostatecznie jako falkę podstawową zastosowano falkę db3 (Daubechies 3), a analizę wielorozdzielczą zrealizowano za pomocą 3 poziomów. Taki wybór umożliwił uzyskanie dobrych wyników klasyfikacji. Ze względu na fakt, iż na każdym poziomie reprezentacji uzyskuje się dość dużą liczbę współczynników (DWT jest przekształceniem ortogonalnym, gdzie liczba wszyst-kich współczynników jest równa ilości próbek sygnału), na każ-dym etapie wskaźniki reprezentacji wielorozdzielczej obliczono w postaci wartości średniej i odchylenia standardowego [9]. Przy-kładowo, biorąc pod uwagę reprezentację sygnału za pomocą 3 poziomów, uzyskuje się 32 atrybuty (4 kanały × 4 zestawy współ-czynników 2 wskaźniki). W takim przypadku klasyfikator po-siadał 32 wejścia (liczba atrybutów) i jedno wyjście (etykieta przyjmująca wartości zdrowy/chory). Schemat blokowy propono-wanego systemu dla rozpoznawania wzorców przedstawiono na rys. 2. W celu przeprowadzenia klasyfikacji, porównano różne

metody, które zostały krótko przedstawiane w następnych rozdzia-łach.

Rys. 2. Schemat blokowy systemu rozpoznawania Fig. 2. Block scheme of recognition system

3.1. Naiwny klasyfikator Bayesa

Naiwny klasyfikator Bayesa jest prostym probabilistycznym klasyfikatorem działającym w oparciu o twierdzenie Bayesa [2]. Ten klasyfikator może być skutecznie przeszkolony za pomocą uczenia nadzorowanego. W zastosowaniach praktycznych parame-try klasyfikatora są szacowane za pomocą metody największej wiarygodności. Zaletą klasyfikatora Bayesa jest to, że nie wymaga dużej ilości danych treningowych do oszacowania parametrów wymaganych dla klasyfikacji. 3.2. k – najbliższych sąsiadów

Metoda klasyfikacji oparta jest na ustaleniu estymacji gęstości f(x) w punkcie x przestrzeni na podstawie n-elementowego zbioru uczą-cego z danej klasy określonej liczby k, która wyznacza ilość obiektów zbioru uczącego dla najbliższych obiektowi reprezento-wanemu określonym wektorem x w danej przestrzeni cech [2]. Algorytm ten jest najprostszą metodą wśród wszystkich algoryt-mów uczenia maszynowego. W fazie uczenia algorytm przecho-wuje atrybuty i etykiety klas próbek. W fazie klasyfikacji, k jest stałą zdefiniowaną przez użytkownika, a wektor wejściowy jest klasyfikowany poprzez przypisanie etykiety, które są najczęściej wśród próbek k szkolenia najbliższym punktem zapytania. Naj-częściej stosowaną miarą odle-głości jest metryka euklidesowa. 3.3. Nieliniowy klasyfikator SVM

Metoda wektorów nośnych (Support Vector Machines (SVM)) jest metodą opracowaną do nieliniowych modeli uogólnionego algorytmu opracowanego przez Władimira Vapnika. Metoda ta związana jest z nadzorowaną metodą uczenia, która jest w stanie analizować i rozpoznawać wzorce, szeroko stosowane do klasyfi-kacji i regresji [4]. SVM wykorzystuje koncepcję optymalnej hiperpłaszczyzny rozdzielającej, dzięki czemu uzyskiwana jest dobra separacja dla określonych wyników. Metoda posiada wiele zalet m.in. możliwość uzyskania rozwiązania w postaci lokalnego minimum co wpływa na stabilność otrzymywanych rezultatów. Za pomocą nieliniowej funkcji jądra, możliwe jest uzyskanie nieli-niowej postaci klasyfikatora. Konstruowanie odpowiedniej postaci funkcji jądra może przysparzać trudności, lecz sama metodologia pozwala na uzyskanie dobrych wyników co przedstawione zostało w dalszej części artykułu. 3.4. Perceptron wielowarstwowy

Najbardziej rozpowszechniony typ sieci neuronowej to sieci wie-lowarstwowe jednokierunkowe [4]. W sztucznych sieciach neuro-nowych zostały zastosowane perceptrony wielowarstwowe i okazało się, iż są dobrym narzędziem matematycznym do rozwią-zywania problemów o charakterze nieliniowym m.in. analizy sygna-łów biomedycznych. Posiadają one bardzo przydatne własności, zgodnie z którymi wynika, iż nieliniowe relacje mogą być odwzo-rowane z dowolną dokładnością za pomocą sieci neuronowych o odpowiednio dobranej strukturze i parametrach wagowych.

Page 3: Porównanie i ocena metod klasyfikacji sygnałów EEGyadda.icm.edu.pl/yadda/element/bwmeta1.element... · sztucznej inteligencji, przetwarzanie sygnałów, nauki kognitywne. ... Streszczenie

PAK vol. 58, nr 4/2012 371

Perceptron wielowarstwowy jest powszechnie i często używany w procesach klasyfikacji. Dla analizowanego przypadku w propo-nowanym eksperymencie klasyfikator określa relację między atry-butami i etykietami dla możliwych klas. Odwzorowanie to jest ustalane podczas procesu uczenia dla na zbiorze uczącym. 4. Wyniki

Jak przedstawiono w rozdziale 1, sekwencje sygnałowe EEG zostały podzielone na podciągi o długości 200 próbek. Każdemu z podciągów przypisano odpowiednie etykiety ze zbioru {zdrowy, chory}. Uzyskano zestaw 163 wzorców , zawierający 120 wzor-ców reprezentujących stan normalny (zdrowy) oraz 43 wzorce reprezentujące napad epileptyczny jako (chory). 4.1. Wyodrębnianie cech

W celu przeprowadzenia klasyfikacji, każda sekwencja powin-na być reprezentowana przez zestaw cech charakterystycznych nazywanych atrybutami. Atrybuty powinny być dobierane w taki sposób, aby w pełni reprezentować dany podciąg. Atrybuty po-zwalają na dyskryminację sekwencji każdego z podciągów oraz dokonywanie oceny stopnia podobieństwa między nimi. Biorąc pod uwagę, że sygnał EEG ma charakter niestacjonarny do wyod-rębnienia cech zastosowano dyskretną transformatę falkową. W eksperymencie, każda sekwencja była reprezentowana do 3-go poziomu analizy wielorozdzielczej z użyciem falki Daubechies 3 (db3). Jak wspomniano w rozdziale 3, atrybuty sygnału zostały wyznaczone jako wartość średnia i odchylenie standardowe współczynników falkowych niezbędnych do odtworzenia sygnału, odrębnie dla każdego poziomu reprezentacji. W rezultacie, dla każdego podciągu, określono 32 atrybuty (4 kanały × 4 zestawy współczynników 2 wskaźniki). 4.2. Liniowa analiza dyskryminacyjna

Metoda liniowej analizy dyskryminacyjnej (ang. Linear Discriminant Analysis, LDA) [2], ma za zadanie znaleźć liniową kombinację cech, jednocześnie wyodrębniając wynik, które z klas są od siebie oddzielne. Uzyskane połączenie może być używane jako klasyfikator liniowy lub może optymalizować wymiar prze-strzeni atrybutów przed klasyfikacją. Przetestowano dwie metody: wielowymiarowe skalowanie (MDS) i odwzorowanie Sammona. W przypadku MDS procent błędnych klasyfikacji był 7,36%, a dla odwzorowania Sammona 14,11%. 4.3. Klasyfikacja

W procesie klasyfikacji przetestowano 5 metod: naiwny klasyfi-kator Bayesa, k najbliższych sąsiadów z różną liczbą sąsiadów, nieliniowy klasyfikator SVM z różnymi funkcjami jądra jak również perceptron wielowarstwowy (MLP) dla różnych ilości neuronów w warstwie ukrytej oraz metodę LDA. Proces klasyfikacji każdego klasyfikatora został eksperymentalnie powtórzony 1000 razy, dzięki czemu wyodrębniono najlepszy procent błędnych klasyfikacji Qmin, najgorszy procent błędnych klasyfikacji Qmax jak i również określo-no jakość średnią Qav. W procesie tym cały zestaw próbek był po-dzielony na zestawy podciągów zawierających 40% próbek, resztę wzorców użyto jako testujące. Wyniki klasyfikacji przedstawiono w tabeli 1, gdzie najlepsze rezultaty są zaznaczone wytłuszczoną czcionką. Najlepsze rezultaty uzyskano dla klasyfikatora Bayesa i k-najbliższych sąsiadów dla 5 sąsiadów. W przypadku metod bardziej skomplikowanych, takich jak klasyfikator SVM i MLP uzyskano trochę gorsze rezultaty. W przypadku SVM najlepsze wyniki uzy-skano w funkcji jądra w postaci wielomianu. W przypadku MLP najlepszy wynik osiągnięto dla 3 lub 5 neuronów w warstwie ukry-tej i są one zupełnie wystarczające, aby osiągnąć stosunkowo niski procent błędnych klasyfikacji.

Tab. 1. Wyniki klasyfikacji Tab. 1. Classification results

Procent błędnych klasyfikacji [%]

Qmin Qmax Qav

LDA 5,15 40,21 17,22

kNN

NN 5 sąsiadów

3,09 2,05

26,8 18,56

13,48 10,83

NB 2,05 23,71 8,89

liniowy 5,15 30,93 14.46

SVM kwadratowy 6,19 35,05 17.49

wielomian 4,12 32,99 14.76

3 neurony 4,12 32,99 15,97

MLP 5 neuronów 4,12 42,27 15,47

9 neuronów 5,15 45,36 15,14

5. Wnioski

W pracy przedstawiono analizę i klasyfikację danych biome-dycznych EEG za pomocą różnych technik, w tym klasycznych metod jak naiwny klasyfikator Bayesa, k-najbliższych sąsiadów oraz metod sztucznej inteligencji w tym nieliniowy klasyfikator (SVM) i perceptron wielowarstwowy. Pomimo faktu, że klasyczne metody osiągnęły lepsze rezultaty w stosunku do sieci neurono-wych należy zwrócić uwagę na fakt, iż baza danych wykorzysty-wana w prezentowanych doświadczeniach była bardzo małych rozmiarów (tylko 163 przykłady). Ponadto, dane te zostały zapisa-ne za pomocą czterech kanałów pomiarowych ze względu na specyfikę analizowanej dysfunkcji, podczas gdy w większości przypadków dane z pomiarów EEG zapisywane są za pomocą, szesnastu kanałów. Przyszłe badania będą skupiały się na klasyfi-kacji sygnałów EEG rejestrowanych w Oddziale Neurologii i Udarów w Szpitalu Wojewódzkim w Zielonej Górze, które zostaną udostępnione do dalszych badań. 6. Literatura [1] Bankman I.N., Sigilliti V.G., Wise R.A., Smith P.L.: Feature-based

detection of the k-complex wave in the human electro-encephalogram using neural networks. IEEE Transactions on Biomedical Engineering 39(12), 1305–1310 (1992).

[2] Duda R.O., Hart P.E., Stork D.H.: Pattern Classification, 2nd Edition. Wiley Inter Science (2000).

[3] Emiliani G.M.M., Frietman E.E.E.: Automatic classification of eegs with neural networks. Microelectronic Systems Integration 1(1), 41–62 (1994).

[4] Haykin S.: Neural Networks. A Comprehensive Foundation, 2nd Edition. Prentice-Hall, New Jersey (1999).

[5] Huuponen E., Varri A., Himanen S.L., Hasan J., Lehtokangas M., Saarinen J.: Autoassociative MLP in sleep spindle detection. Journal ofMedical Systems 24(3),183–193 (2000).

[6] James C.J., Jones R.D., Bones P.J., Carroll G.J.: Detection of epileptiform discharges in the EEG by a hybrid system comprising mimetic, self-organized artificial neural network, and fuzzy logic stages. Clinical Neurophysiology 12, 2049– 2063 (1999).

[7] Mallat S.: A theory for multiresolution signal decomposition: The wavelet representation. IEEE Trans. Pattern Anal. Mach Intell. 11(7), 674–693 (1989).

[8] Mustafa G., Chen F., Huang Z.: Ternary wavelets and their applications to signal compression. International Journal of Applied Mathematics and Computer Science 14(2), 233–240 (2004).

[9] Rutkowski G.: Artificial neural networks in the classification of EEG signals. In: Proceedings of XIII International Workshop OWD 2011, Krynica, Poland, 22–25 October 2011 (2011).

[10] Übeyli E.D.: Combined neural network model employing wavelet coefficients for EEG signals classification. Digital Signal Processing 19, 297–308 (2009).

_____________________________________________________ otrzymano / received: 16.01.2012 przyjęto do druku / accepted: 02.03.2012 artykuł recenzowany / revised paper