Wizualizacja Wikipedii

Post on 23-Feb-2016

52 views 0 download

description

Wizualizacja Wikipedii. Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika Nanyang Technological University , Singapore Google: Duch W. - PowerPoint PPT Presentation

Transcript of Wizualizacja Wikipedii

Wizualizacja Wikipedii

Julian SzymańskiWydział Elektroniki Telekomunikacji i

Informatyki Politechniki Gdańskiej

Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika

Nanyang Technological University, SingaporeGoogle: Duch W

Wizualizacja Wiedzy, Warszawa 11/12/2010

Strona naukowa Jak mózgi, używając masowo równoległych procesów, reprezentują wiedzę i umożliwiają wnioskowanie?

• L. Boltzmann (1899): “Wszystkie idee i pojęcia to tylkowewnętrzne obrazy wyrażające się w mowie przez kombinację dźwięków.” „Zadaniem teorii jest skonstruować obraz zewnętrznego świata, który istnieje tylko w naszej głowie…”.

• L. Wittgenstein (Tractatus 1922): myśli to obrazy tego, w jaki sposób rzeczy istnieją w świecie, propozycje wskazują na te obrazy.

• Kenneth Craik (1943): umysł konstruuje „w małej skali" modele rzeczywistości by antycypować zdarzenia, rozumować i wyjaśniać.

• P. Johnson-Laird (1983): modele mentalne to psychologiczne reprezentacje rzeczywistych , hipotetycznych lub wyobrażonych sytuacji.

• J. Piaget: dzieci tworzą sobie schematy rozumowania zgodne z logiką FOL. Duch W (2002) Geometryczny model umysłu. Kognitywistyka i Media w EdukacjiDuch W (2010) Reprezentacje umysłowe jako aproksymacje stanów mózgu

Strona praktyczna• Szukanie oparte na słowach kluczowych jest ograniczone ze względu na

wieloznaczność i niejednoznaczność (synsety) pojęć. • Ludzie mają oczekiwania i skojarzenia, ale jeśli nie znają specyficznego

słownictwa trudno znaleźć informację w nowych obszarach wiedzy.• Eksploracja artykułów encyklopedii: zbyt wiele linków w ogólnych artykułach,

brak spojrzenia na całą domenę przefiltrowanego przez zainteresowania użytkownika: co ciekawego ma „neuroscience” do powiedzenia na temat „attention” i „neural synchronization”?

• Statyczne linki nie wystarczą: procesy prymowania (priming) w mózgu tworzą sieci funkcjonalne aktywizując wybrane połączenia grup neuronów, zwracamy uwagę i interpretujemy tylko to co pasuje do oczekiwań w określonym kontekście.

• Semantyczne prymowanie: przygotowuje drogę dla aktywacji sieci neuronów pobudzając rozległe obszary mózgu, przygotowując je do przyjęcia informacji, ujednoznaczniając sens pojęć, prowadząc do jednoznacznej interpretacji informacji (mowy i tekstów).

Czy słowa opisują pojęcia?329 ras psów w 10 kategoriach:

Sheepdogs & Cattle Dogs; Pinscher & Schnauzer; Spitz & Primitive; Scenthounds; Pointing Dogs; Retrievers, Flushing Dogs & Water Dogs; Companion & Toy Dogs; Sighthounds

Własności z licznych ontologii, częściowo ręcznie poprawiane, służyły do zgadywania za pomocą gry w 20 pytań jaka to rasa => marna dokładność!

Kategorie oparte na podobieństwie wizualnym są całkiem odmienne niż kategorie stosowane przez związki kynologiczne oparte na zachowaniu psów lub kategorie biologiczne.

• Słowa wskazują to, co już wiemy => ale nie wszystkim stanom mózgu odpowiadają symbole.

Komunikacja ogranicza się do tego, co już przynajmniej częściowo wiemyWidzisz to co wiesz i wiesz to co widzisz.

Imitacja zaprowadzi nas daleko …

Mapy mózguMapy mózgu: spróbuj przedstawić organizację informacji podobnie jak w mózgu eksperta.• Wiele książek (T. Buzan i inni).• Wiele programów do rysowania.

• TheBrain (www.thebrain.com) interfejs oparty na hierarchicznych mapach linków internetowych.

• Liczne programy do graficznej reprezentacji infromacji.

• Nasza implementacja (Szymanski): Wordnet, Wikipedia i inne: grafy powiązań linków i semantycznych podobieństw dokumentów.

Atlas semantycznyhttp://dico.isc.cnrs.fr/en/index.html

spirit: 79 słów69 klik, czyli minimalnychjednostek znaczenia.

Synset = zbiórsynonimów

Sieć semantyczna

Automatycznie tworzenie sieci semantycznych na podstawie analizy tekstów, w których znajdujemy własności pojęć, sprawdzamy za pomocą gry w 20 pytań czy to wystarczy.

Sieci semantyczne pokazują wiedzę ogólną, ale my widzieć tylko podsieci interesujące z punktu widzenia aktualnie wyszukiwanej informacji.

Wikipedia: zamiast sieci pojęć mamy sieć artykułów.

Nasze podejście

http://gossamer.eti.pg.gda.pl/index.html

Analiza struktury Wikipedii

Wybór programu do wizualizacji

Przygotowanie danych do wizualizacji

Wygenerowanie wizualizacji

Wizualizacja WikiProblem: szukanie zbioru artykułów na specyficzne tematy. Artykuły ogólne, np. o neuroscience, mają zbyt wiele linków prowadzących do dokumentów nieistotnych dla konkretnego pytania.

• Wizualizacja powiązań pomiędzy artykułami w oparciu o istniejące linki.• Wizualizacja podobieństwa semantycznego.• Zmiana konta widzenia przez podawanie słów kluczowych lub

dokumentów referencyjnych – filtrowanie wizualizowanej informacji pod określonym kontem.

Tylko część zaimplementowana, serwer: http://gossamer.eti.pg.gda.pl/index.html

Wizualizacja Wordnetu, Wikipedii. Simple Ontology Editor, projekt realizuje Bartosz Kuczkowski, używając Gossamera. Jego zadanie: wspierać poprzez interaktywny graficzny interfejs prace zespołowe nad edycją ontologiiuser.

Narzędzia

http://gossamer.eti.pg.gda.pl/index.htmlPrzykłady: 3 filmiki

Wizualizacja struktury powiązań

Wizualizacja struktury powiązań pomiędzy artykułami z użyciem interaktywnego grafu

Drzewo kategorii Wiki

Drzewo kategorii Wiki wykorzystywane do wyszukiwania zbliżonych tematycznie artykułów.

Graficzne przedstawienie artykułu

Graficzne przedstawienie reprezentacji artykułu wykorzystujące informacje kategorialne.

KonkluzjeTylko mózgi potrafią interpretować i tworzyć informację w języku naturalnym, statystyczne i gramatyczne algorytmy analizy nie wystarczą, potrzebne są inspiracje kognitywne.Sieci neuronowe to dziedzina wykorzystująca modele neuronów lub proste analogie do działania neuronów biologicznych. Neurokognitywne podejście do języka pozwala na tworzenie interesujących algorytmów korzystając z inspiracji na wyższym poziomie organizacji, np. grafów obrazujących funkcjonalne dynamiczne połączenia obszarów kodujących własności semantyczne pojęć, pozwalając na elastyczną organizację i odkrywanie nowej wiedzy.Zastosowania obejmują wizualizację encyklopedii, np. Wikipedii: http://semanticspaces.eti.pg.gda.pl:8888/wikiparser

Jak wyższe czynności poznawcze powstajaw wyniku aktywności mózgu? Kreatywność = przestrzeń neuronalna (wiedza, torowanie) + fluktuacje aktywności (wyobraźnia)+ filtrowanie rezultatów (skojarzenia i emocje).

Informatyka neurokognitywna = abstrakcje tego procesu.

Dziękuję za użyczenie

ucha

Google: Duch W => P3=Prezentacje, Prace, Projekty