Dariusz Kieszkowski, Marcin Wudarczyk

Porównanie skuteczności metod klasycznych oraz

nieklasycznych w szacowaniu zdolności kredytowej i kondycji

finansowej przedsiebiorstw

Dariusz Kieszkowski, Marcin Wudarczyk

Plan prezentacji

● Wstęp● Dane wejściowe

– Pozyskane dane– Zestawy wskaźników

● Badania– Porównanie analizy dyskryminacyjnej i sieci

neuronowych– Porównanie różnych typów sieci

● Wnioski– Wyniki badań– Próba oceny wyników pod względem kosztów

błędów predykcji dla instytucji bankowych● Zakończenie

Wstęp

● Predykcja bankructw w kontekście:– zdolności kredytowej– kondycji finansowej

● Cele badań– Porównanie metod klasycznych (analiza

dyskryminacyjna, genetyczny dobór współczynników liniowej kombinacji) z sieciami neuronowymi

– Porównanie osiąganych wyników przez różne sieci neuronowe

Dane wejściowe

● Spółki akcyjne Warszawskiej GPW– 23 bankrutów oraz 45 niebankrutów

● Dane pochodzące z Komitetu Badań Naukowych– 23 bankrutów oraz 23 niebankrutów

● Dane amerykańskiek Komisji Papierów Wartościowych (SEC)– 58 bankrutów oraz 59 niebankrutów

Dane wejściowe Wskaźniki

● Wskaźniki Altmana – 1968– X1 -(bieżące aktywa - bieżące zobowiązania)/suma aktywów– X2 - zysk zatrzymany/suma aktywów– X3 - Zysk przed opodatkowaniem i spłatą odsetek / suma aktywów– X4 - wartość rynkowa kapitału własnego/wartość księgowa zobowiązań– X5 - przychody ze sprzedaży / suma aktywów

● Wskaźniki ogólnie stosowane (14)– płynność– rentowność (zyskowność)– zadłużenie– aktywność (obrotowość)– efektywność rynkowa

● Podstawowe pozycje raportów finansowych

Dane wejścioweWskaźniki

• Porównanie kilku systemów wczesnego ostrzegania– Altman (68r i 77r)– Springate– Baetge– Gajdki, Stoda– Hołda

Kraj l. wsk. I rdz II rdz razem

Altman USA 5 3% 6% 9%

Springate Kanada 4 12-17%

Baetge Niemcy 3 bd

Gajdka, Stod Polska 5 bd

Hołda Polska 5 7,50%

BadaniaAnaliza dyskryminacyjna KBN

LDA+ I rdz II rdz LDA I rdz II rdz

Altman 14,13 11,30 2,82 15,22 15,22 0,00

Springate 39,78 23,26 16,52 33,92 18,92 15,00

Baetge 5,22 2,82 2,39 32,17 32,17 0,00

Gajdka 26,96 13,26 13,70 26,74 12,39 14,35

Hołda 15,22 9,35 5,87 10,87 4,35 6,52

BadaniaAnaliza dyskryminacyjna SEC

LDA+ I rdz II rdz LDA I rdz II rdz

Altman 45,00 23,79 21,21 44,92 24,23 20,691

Springate 40,43 24,57 15,86 42,42 22,24 20,174

Baetge 50,09 13,36 36,73 52,59 46,81 5,776

Gajdka 42,84 17,414 25,43 46,29 23,88 22,414

Hołda 41,47 26,21 15,26 43,29 12,76 30,526

BadaniaGenetyczny dobór współczynników

● Osiągnięto błąd 0,00% na danych KBN (wskaźniki Altmana)

● Optymalizacja – błąd MSE czy CFE?● Brak możliwości weryfikacji wyniku

BadaniaSieci neuronowe KBN

MLP Kohonen

razem I rdz II rdz razem I rdz II rdz

Altman 4,35 4,35 0,00 8,70 2,17 6,52

Springate 17,17 13,69 3,47 25,65 16,09 9,57

Baetge 3,04 3,04 0,00 2,39 0,00 2,39

Gajdka 13,91 13,26 0,65 12,83 4,35 8,48

Hołda 8,91 8,91 0,00 12,83 4,35 8,48

Fuzzy LDA


Altman 8,70 4,35 4,35 14,13 11,30 2,82

Springate 12,39 10,44 2,17 33,92 18,92 15,00

Baetge 3,69 2,39 1,30 5,22 2,82 2,39

Gajdka 6,74 5,22 1,52 26,74 12,39 14,35

Hołda 7,38 2,61 4,77 10,87 4,35 6,52

BadaniaSieci neuronowe SEC

MLP Kohonen


Altman 37,42 15,86 21,55 45,43 25,43 20,00

Springate 36,80 19,14 17,66 48,31 22,50 25,81

Baetge 34,40 9,22 25,17 38,19 3,62 34,57

Gajdka 34,65 15,43 19,22 51,89 22,32 29,57

Hołda 32,85 14,31 18,54 47,07 26,72 20,35

Fuzzy LDA


Altman 41,64 21,55 20,09 44,92 24,23 20,691

Springate 55,78 32,76 23,02 40,43 24,57 15,86

Baetge 43,71 12,76 30,95 50,09 13,36 36,73

Gajdka 40,81 15,14 25,67 42,844 17,414 25,43

Hołda 34,01 17,34 16,67 41,47 26,21 15,26

Badaniaporównanie sieci neuronowych

● Metodyka– Badane sieci: MLP, SOM (Kohonen, gaz

neuronowy), RBF– Badany wpływ parametrów uczenia (rodzaj błędu,

wagi początkowe, ilość warstw, neuronów, współczynnik uczenia, momentum, warunki stopu

– Badanie wielokrotnych trenowań (cross validation, 100 powtórzeń)

– Kryterium ostateczne: błąd klasyfikacji


Sieć Dane na rok przed bankructwem

SOM RBF Źródło Wskaźniki Głębia

MLP KOH NGS KOH NGS

GEN

Polska giełda Wszystkie 2 25,38 Wszystkie 2 4,52 11,20 6,55 8,55 4,9

1 0,36 1,00 1,80 0,95 2,50 0,00 Altman 2 1,56 7,00 4,50 2,00 2,50 0,00 1 11,14 16,40 8,85 8,40 10,7 Wskaźniki z części

teoretycznej 2 6,30 14,65 11,10 9,25 8,60

KBN-2 (wskaźnki finansowe)

Dobór genetyczny 2 0,00 5,34 Wszystkie 1 6,61 10,30 9,70 12,55 8,60 0,00 KBN (zdolność

kredytowa) Dobór genetyczny 1 3,00 Wszystkie 2 3,78 27,35 26,70 23,20 19,60 KBN-3

(pozycje raportów) Dobór genetyczny 1 0,45 Altman 1 38,75 28,21

Wszystkie 1 28,87 33,33 34,92 36,22 30,96 17,09 Edgar-2 (wskaźniki)

Dobór genetyczny 1 23,02 Edgar-3 (pozycje

raportów) Wszystkie 1 29,11 27,76 38,77 22,22


Sieć Dane na dwa lata przed bankructwem SOM RBF

Źródło Wskaźniki Głębia MLP

KOH NGS KOH NGS Wszystkie 2 9,39 21,55 17,85 19,45 14,50

1 6,78 11,00 16,20 7,75 7,60 Altman 2 6,54 7,00 4,50 2,00 8,60 1 12,11 22,40 16,95 15,65 15,70 Wskaźniki z części

teoretycznej 2 11,78 23,55 22,05 18,10 17,45


Dobór genetyczny 2 1,43 KBN (zdolność kredytowa) Wszystkie 1 9,66 19,30 13,55 18,00 16,50

Wszystkie 2 15,37 21,75 15,00 24,20 18,75 KBN-3 (pozycje raportów) Dobór genetyczny 2 5,53 Sieć Dane na trzy lata przed bankructwem

SOM RBF Źródło Wskaźniki Głębia

MLP KOH NGS KOH NGS

Wszystkie 2 15,90 31,45 24,05 27,20 19,50 1 13,54 25,00 18,00 23,90 20,30 Altman 2 13,46 20,65 21,20 19,35 18,90 1 18,45 28,75 26,85 29,70 21,85 Wskaźniki z części

teoretycznej 2 20,09 28,00 25,35 27,80 24,40


Dobór genetyczny 2 8,06 KBN (zdolność

kredytowa) Wszystkie 1 16,46 23,30 22,90 22,00 22,80

KBN-3 (pozycje raportów)

Wszystkie 2 20,40 27,35 26,70 23,20 19,60

WnioskiBadania

●Najlepsze wyniki uzyskują sieci używające optymalizacji genetycznej; wyniki mogą być lepsze nawet kilka razy. ●Zgodnie z oczekiwaniami, sieci działające na starszych danych uzyskiwały gorsze wyniki●Oprócz jednego przypadku, sieci MLP górowały nad pozostałymi typami sieci; przyczyną tego mogą być zakrojone na mniejszą skalę próby dobierania optymalnych parametrów dla sieci SOM i RBF●Wśród sieci SOM i RBF, a także wśród metod nauczania nie można wskazać jednoznacznego zwycięzcy, generalnie jednak sieci RBF zachowywały się lepiej niż sieci SOM. Zwykle lepsze efekty przynosiło zastosowanie uczenia gazu neuronowego niż standardowego uczenia Kohonena●Uzycie wszystkich wskaźników ogólnych, jak również wskaźników do oceny zdolności kredytowej prowadziło do jednych z najgorszych wyników. Niespodziewanie dobrze wypadły wskaźniki opracowane przez Altmana, które były opracowane w zupełnie innych warunkach ekonomicznych i dla innego systemu księgowości.●Okazuje się, że bardzo duże znaczenie ma dobór wejść. Dodatkowe, nadmiarowe wejścia bardzo pogarszają uzyskane wyniki, co dobrze widać na przykładzie wskaźników Altmana, które uzyskały dobre wyniki same, ale w połączeniu z innymi wskaźnikami dużo gorsze.●Nie zawsze podawanie danych z dwóch lat poprawia jakość predykcji. Jednak wszystkie zestawy wskaźników optymalizowane genetycznie zawierają wskaźniki także z poprzedniego okresu.

WnioskiOcena kosztów bankowych KBN

MLP Kohonen Fuzzy LDA

Altman 3,05 1,52 3,05 7,91

Springate 9,58 11,26 7,31 13,24

Baetge 2,13 0,00 1,67 1,97

Gajdka 9,28 3,05 3,65 8,67

Hołda 6,24 3,05 1,82 3,05

WnioskiOcena kosztów bankowych SEC

MLP Kohonen Fuzzy LDA

Altman 11,10 17,80 15,09 16,96

Springate 13,40 15,75 22,93 17,20

Baetge 6,46 2,54 8,93 9,35

Gajdka 10,80 15,63 10,60 12,19

Hołda 10,02 18,70 12,14 18,34

Wnioski

● LDA znacznie gorsze niż sieci neuronowe● Systemy wczesnego ostrzegania mają

charakter preselekcji. (błąd I rodzaju)● W MLP

– BackProp i RProp najlepsze– QuickProp słabiej

● Sieci neuronowo-rozmyte– Bardzo dobre wyniki lepsze od MLP

● Sieci Kohonena – generalnie słabsze– dla zastosowań bankowych dla dobrych danych

b. skuteczne

Zakończenie

● Najważniejszym czynnikiem jakość danych

– Ilość próbek w zestawie danych KBN jest skrajnie mała – w sumie 46 przedsiębiorstw; choć uzyskane wyniki są bardzo dobre, nie ma możliwości dogłębnego ich sprawdzenia.

– Przy optymalizacji genetycznej istnieje niebezpieczeństwo, iż wejścia sieci zostały dopasowane do danych

– Dla zestawu danych ze 117 próbkami wyniki nie są zadawalające. Przyczyny: niejednorodność danych, duża rozpiętość badanych firm, dane z różnych lat, definicja bankructwa (chapter 11)

● Duża zależność od danych wejściowych– Dobór w toku analizy teoretycznej lub optymalizacji

genetycznej

Dariusz Kieszkowski, Marcin Wudarczyk

Documents

Transcript of Dariusz Kieszkowski, Marcin Wudarczyk