Wizualizacja Wikipedii

16
Wizualizacja Wikipedii Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika Nanyang Technological University, Singapore Wizualizacja Wiedzy, Warszawa 11/12/2010

description

Wizualizacja Wikipedii. Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika Nanyang Technological University , Singapore Google: Duch W. - PowerPoint PPT Presentation

Transcript of Wizualizacja Wikipedii

Page 1: Wizualizacja Wikipedii

Wizualizacja Wikipedii

Julian SzymańskiWydział Elektroniki Telekomunikacji i

Informatyki Politechniki Gdańskiej

Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika

Nanyang Technological University, SingaporeGoogle: Duch W

Wizualizacja Wiedzy, Warszawa 11/12/2010

Page 2: Wizualizacja Wikipedii

Strona naukowa Jak mózgi, używając masowo równoległych procesów, reprezentują wiedzę i umożliwiają wnioskowanie?

• L. Boltzmann (1899): “Wszystkie idee i pojęcia to tylkowewnętrzne obrazy wyrażające się w mowie przez kombinację dźwięków.” „Zadaniem teorii jest skonstruować obraz zewnętrznego świata, który istnieje tylko w naszej głowie…”.

• L. Wittgenstein (Tractatus 1922): myśli to obrazy tego, w jaki sposób rzeczy istnieją w świecie, propozycje wskazują na te obrazy.

• Kenneth Craik (1943): umysł konstruuje „w małej skali" modele rzeczywistości by antycypować zdarzenia, rozumować i wyjaśniać.

• P. Johnson-Laird (1983): modele mentalne to psychologiczne reprezentacje rzeczywistych , hipotetycznych lub wyobrażonych sytuacji.

• J. Piaget: dzieci tworzą sobie schematy rozumowania zgodne z logiką FOL. Duch W (2002) Geometryczny model umysłu. Kognitywistyka i Media w EdukacjiDuch W (2010) Reprezentacje umysłowe jako aproksymacje stanów mózgu

Page 3: Wizualizacja Wikipedii

Strona praktyczna• Szukanie oparte na słowach kluczowych jest ograniczone ze względu na

wieloznaczność i niejednoznaczność (synsety) pojęć. • Ludzie mają oczekiwania i skojarzenia, ale jeśli nie znają specyficznego

słownictwa trudno znaleźć informację w nowych obszarach wiedzy.• Eksploracja artykułów encyklopedii: zbyt wiele linków w ogólnych artykułach,

brak spojrzenia na całą domenę przefiltrowanego przez zainteresowania użytkownika: co ciekawego ma „neuroscience” do powiedzenia na temat „attention” i „neural synchronization”?

• Statyczne linki nie wystarczą: procesy prymowania (priming) w mózgu tworzą sieci funkcjonalne aktywizując wybrane połączenia grup neuronów, zwracamy uwagę i interpretujemy tylko to co pasuje do oczekiwań w określonym kontekście.

• Semantyczne prymowanie: przygotowuje drogę dla aktywacji sieci neuronów pobudzając rozległe obszary mózgu, przygotowując je do przyjęcia informacji, ujednoznaczniając sens pojęć, prowadząc do jednoznacznej interpretacji informacji (mowy i tekstów).

Page 4: Wizualizacja Wikipedii

Czy słowa opisują pojęcia?329 ras psów w 10 kategoriach:

Sheepdogs & Cattle Dogs; Pinscher & Schnauzer; Spitz & Primitive; Scenthounds; Pointing Dogs; Retrievers, Flushing Dogs & Water Dogs; Companion & Toy Dogs; Sighthounds

Własności z licznych ontologii, częściowo ręcznie poprawiane, służyły do zgadywania za pomocą gry w 20 pytań jaka to rasa => marna dokładność!

Kategorie oparte na podobieństwie wizualnym są całkiem odmienne niż kategorie stosowane przez związki kynologiczne oparte na zachowaniu psów lub kategorie biologiczne.

• Słowa wskazują to, co już wiemy => ale nie wszystkim stanom mózgu odpowiadają symbole.

Komunikacja ogranicza się do tego, co już przynajmniej częściowo wiemyWidzisz to co wiesz i wiesz to co widzisz.

Page 5: Wizualizacja Wikipedii

Imitacja zaprowadzi nas daleko …

Page 6: Wizualizacja Wikipedii

Mapy mózguMapy mózgu: spróbuj przedstawić organizację informacji podobnie jak w mózgu eksperta.• Wiele książek (T. Buzan i inni).• Wiele programów do rysowania.

• TheBrain (www.thebrain.com) interfejs oparty na hierarchicznych mapach linków internetowych.

• Liczne programy do graficznej reprezentacji infromacji.

• Nasza implementacja (Szymanski): Wordnet, Wikipedia i inne: grafy powiązań linków i semantycznych podobieństw dokumentów.

Page 7: Wizualizacja Wikipedii

Atlas semantycznyhttp://dico.isc.cnrs.fr/en/index.html

spirit: 79 słów69 klik, czyli minimalnychjednostek znaczenia.

Synset = zbiórsynonimów

Page 8: Wizualizacja Wikipedii

Sieć semantyczna

Automatycznie tworzenie sieci semantycznych na podstawie analizy tekstów, w których znajdujemy własności pojęć, sprawdzamy za pomocą gry w 20 pytań czy to wystarczy.

Sieci semantyczne pokazują wiedzę ogólną, ale my widzieć tylko podsieci interesujące z punktu widzenia aktualnie wyszukiwanej informacji.

Wikipedia: zamiast sieci pojęć mamy sieć artykułów.

Page 9: Wizualizacja Wikipedii

Nasze podejście

http://gossamer.eti.pg.gda.pl/index.html

Analiza struktury Wikipedii

Wybór programu do wizualizacji

Przygotowanie danych do wizualizacji

Wygenerowanie wizualizacji

Page 10: Wizualizacja Wikipedii

Wizualizacja WikiProblem: szukanie zbioru artykułów na specyficzne tematy. Artykuły ogólne, np. o neuroscience, mają zbyt wiele linków prowadzących do dokumentów nieistotnych dla konkretnego pytania.

• Wizualizacja powiązań pomiędzy artykułami w oparciu o istniejące linki.• Wizualizacja podobieństwa semantycznego.• Zmiana konta widzenia przez podawanie słów kluczowych lub

dokumentów referencyjnych – filtrowanie wizualizowanej informacji pod określonym kontem.

Tylko część zaimplementowana, serwer: http://gossamer.eti.pg.gda.pl/index.html

Wizualizacja Wordnetu, Wikipedii. Simple Ontology Editor, projekt realizuje Bartosz Kuczkowski, używając Gossamera. Jego zadanie: wspierać poprzez interaktywny graficzny interfejs prace zespołowe nad edycją ontologiiuser.

Page 11: Wizualizacja Wikipedii

Narzędzia

http://gossamer.eti.pg.gda.pl/index.htmlPrzykłady: 3 filmiki

Page 12: Wizualizacja Wikipedii

Wizualizacja struktury powiązań

Wizualizacja struktury powiązań pomiędzy artykułami z użyciem interaktywnego grafu

Page 13: Wizualizacja Wikipedii

Drzewo kategorii Wiki

Drzewo kategorii Wiki wykorzystywane do wyszukiwania zbliżonych tematycznie artykułów.

Page 14: Wizualizacja Wikipedii

Graficzne przedstawienie artykułu

Graficzne przedstawienie reprezentacji artykułu wykorzystujące informacje kategorialne.

Page 15: Wizualizacja Wikipedii

KonkluzjeTylko mózgi potrafią interpretować i tworzyć informację w języku naturalnym, statystyczne i gramatyczne algorytmy analizy nie wystarczą, potrzebne są inspiracje kognitywne.Sieci neuronowe to dziedzina wykorzystująca modele neuronów lub proste analogie do działania neuronów biologicznych. Neurokognitywne podejście do języka pozwala na tworzenie interesujących algorytmów korzystając z inspiracji na wyższym poziomie organizacji, np. grafów obrazujących funkcjonalne dynamiczne połączenia obszarów kodujących własności semantyczne pojęć, pozwalając na elastyczną organizację i odkrywanie nowej wiedzy.Zastosowania obejmują wizualizację encyklopedii, np. Wikipedii: http://semanticspaces.eti.pg.gda.pl:8888/wikiparser

Jak wyższe czynności poznawcze powstajaw wyniku aktywności mózgu? Kreatywność = przestrzeń neuronalna (wiedza, torowanie) + fluktuacje aktywności (wyobraźnia)+ filtrowanie rezultatów (skojarzenia i emocje).

Informatyka neurokognitywna = abstrakcje tego procesu.

Page 16: Wizualizacja Wikipedii

Dziękuję za użyczenie

ucha

Google: Duch W => P3=Prezentacje, Prace, Projekty