Technologie

27
Technologie Technologie mgr inż. Tomasz Węgliński mgr inż. Tomasz Węgliński email: email: [email protected] www: www: http:// www.tweglinski.pl Łódź, 5 listopada 2012 roku Łódź, 5 listopada 2012 roku

description

Łódź, 5 listopada 2012 roku. Technologie. mgr inż. Tomasz Węgliński email: [email protected] www: http://www.tweglinski.pl. WYKŁAD 12. Semantic Web. 2/34. Plan wykładu. Na wykładzie omówimy sobie następujące zagadnienia: Bariery współczesnego Internetu - PowerPoint PPT Presentation

Transcript of Technologie

Page 1: Technologie

TechnologieTechnologiemgr inż. Tomasz Węglińskimgr inż. Tomasz Węgliński

email: email: [email protected]

www: www: http://www.tweglinski.pl

Łódź, 5 listopada 2012 rokuŁódź, 5 listopada 2012 roku

Page 2: Technologie

WYKŁAD 12WYKŁAD 12

Semantic WebSemantic Web

2/34

Page 3: Technologie

3/34

Na wykładzie omówimy sobie następujące zagadnienia:

Bariery współczesnego Internetu

Co to jest Semantic Web i jakie są jego idee?

Przykładowe wizje działania

Semantyczny Internet czy sztuczna inteligencja?

Kluczowe pojęcia i technologie

Warstwowość technologii i struktura działania

Podsumowanie

Literatura

Plan wykładuPlan wykładu

Wykład 12: Semantic Web

Page 4: Technologie

4/34

BarieryBarieryWWWWWW

Powstanie sieci WWW (ang. World Wide Web) na zawsze zmieniło sposób komunikacji międzyludzkiej i biznesowej.

Podstawowe zastosowana Internetu to:

wyszukiwanie informacji zbieranie informacji (często z wielu źródeł) komunikacja z innymi ludźmi (portale społecznościowe, blogi etc.) przeszukiwanie internetowych baz filmów, muzyki, książek… przeglądanie ofert firmowych zakupy w sieci i aukcje internetowe wypełnianie formularzy bankowych, sklepowych, urzędowych…

Treści prezentowane w Internecie są przekazywane w sposób przyjazny dla odbiorcy.

Programiści stron i aplikacji WWW przykładają bardzo dużą wagę do tworzenia jak najbardziej „przyjaznego” interfejsu użytkownika.

Wykład 12: Semantic Web

Page 5: Technologie

5/34

BarieryBarieryWWWWWW

Sukces Internetu został osiągnięty w dużej mierze dzięki tzw. wyszukiwarkom internetowym (Google, Yahoo, Alta Vista etc…).

Użytkownicy korzystający z wyszukiwarek na co dzień borykają się jednak z wieloma z problemami typu:

Dużo wyników, mało interesujących nas treści Mało wyników lub ich brak Wrażliwość na słownictwo (poprawność słów kluczowych) Szeroki rozrzut informacji (kolekcjonowanie informacji z wielu stron) Czas poświęcony na zbieranie informacji jest za długi (!) Trudność z oceną wiarygodności informacji na stronie (wpisy na forum, opinie użytkowników produktu)

„„The amount of Web content The amount of Web content outspaces technological process”outspaces technological process”

-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004

Wykład 12: Semantic Web

Page 6: Technologie

6/34

BarieryBarieryWWWWWW

Dlaczego wyszukiwarki internetowe mają małą skuteczność?

Analiza języka naturalnego jest bardzo trudna

Treści przekazywane w Internecie są „nieprzyjazne maszynowo”

Prosty przykład:

I am a professor of computer science. I am a professor of computer science, you may think. Well…

…a może użyć technik przetwarzania tekstu, sztucznej inteligencji…?

Wykład 12: Semantic Web

Page 7: Technologie

7/34

IdeaIdeaSemantic WebSemantic Web

Idea Semantic Web (tłum.: Semantyczny Internet):

To nie treści (dane) są złe, To nie treści (dane) są złe, tylko sposób ich przetwarzania.tylko sposób ich przetwarzania.

Treści powinny być przekazywane aplikacji w sposób „przetwarzalny maszynowo” (ang. machine-processable)

Podejście to jest ewolucją, nie rewolucją dla współczesnego Internetu

Semantyczny Internet to marzenie i wizja jego twórcy

– Tima Bernersa – Lee

Organizacje rządowe wspierają ideę Semantic Web:

Europen Union’s Sixth Framework Programme DARPA Agent Markup Language (DAML)

Wykład 12: Semantic Web

Page 8: Technologie

8/34

PrzykładowePrzykładowewizje działaniawizje działania

Niemal wszystkie obszary działania oraz zastosowania współczesnego Internetu wymagają usprawnienia.

Potrzeba wprowadzenia w życie idei i wizji Semantic Web jest widoczna na co dzień zarówno w sferze biznesu jak i prywatnej.

Zarządzanie wiedzą (ang. Knowledge Management)- to próba jak najlepszego wykorzystania wiedzy, która jest dostępna w organizacji, tworzenie nowej wiedzy oraz zwiększanie jej zrozumienia.

Aktualne problemy: uciążliwe wyszukiwanie, kolekcjonowanie i gromadzenie informacji czasochłonne dotarcie do już zgromadzonej informacji, aktualizacje prezentowanie informacji (różni odbiorcy, różne potrzeby)

Wizja Semantic Web:Wizja Semantic Web:

Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie pojęciowe (ang. pojęciowe (ang. conceptual spacesconceptual spaces), zgodnie z ich znaczeniem.), zgodnie z ich znaczeniem.

Wykład 12: Semantic Web

Page 9: Technologie

9/34

PrzykładowePrzykładowewizje działaniawizje działania

B2C E-commerce (ang. Business-to-consumer Electronic Commerce)- to nazwa relacji występujących pomiędzy firmą a klientem końcowym, często realizowanych za pomocą Internetu (przegląd ofert, wybór, kupno).

Przykłady: Allegro, Ebay, Amazon, Morele…

Aktualne problemy: czasochłonne przeglądanie ofert nie sposób przejrzeć i wybrać wszystkich dostępnych ofert przed zakupem często nie znamy cen rynkowych często kupujemy „na ślepo” – im drożej tym musi być lepiej…

Przeglądanie ofert wspomagają tzw. przeglądarki cenowe (ang. shopbots).

Posiadają one jednak wady charakterystyczne dla typowych wyszukiwarek internetowych.

Przeglądarki cenowe nie są w stanie przeanalizować wszystkich cennych informacji, np. kosztów przesyłki i czasu dostawy.

Wykład 12: Semantic Web

Page 10: Technologie

10/34

PrzykładowePrzykładowewizje działaniawizje działania

B2C E-commerce (ang. Business-to-consumer Electronic Commerce)

Wizja Semantic Web:Wizja Semantic Web:

Opracujmy inteligentne programy, tzw. Opracujmy inteligentne programy, tzw. agentówagentów (ang. software agents), którzy będą umieć (ang. software agents), którzy będą umieć interpretowaćinterpretować

informacje o produkcie oraz politykę działania firmy.informacje o produkcie oraz politykę działania firmy.

Zalety (zadania) agentów internetowych są oczywiste:

precyzyjny proces zbierania informacji o produkcie i producencie pobieranie, kolekcjonowanie oraz interpretowanie opinii klientów przeprowadzenie automatycznych negocjacji ofert (z innymi agentami) zgodnie z ustaleniami i preferencjami klienta

Wykład 12: Semantic Web

Page 11: Technologie

11/34

PrzykładowePrzykładowewizje działaniawizje działania

B2B E-commerce (ang. Business-to-Business Electronic Commerce)- to nazwa relacji występujących pomiędzy firmami, określana często mianem "klasycznego" e-biznesu.

Aktualne problemy:

transfer danych za pomocą EDI (ang. Electronic Data Interchange) jest skomplikowany i zrozumiały tylko dla ekspertów EDI jest kosztowny i nie jest łatwy w integracji z innymi aplikacjami biznesowymi język HTML używany do prezentacji danych w sieci WWW nie posiada ustalonej struktury ani semantyki (problem wyszukiwania informacji) wykorzystanie dokumentów XML do komunikacji B2B wymaga ustalenia wspólnej, jednolitej struktury danych oraz nazewnictwa

Wykład 12: Semantic Web

Wizja Semantic Web:Wizja Semantic Web:

Niezgodność terminologii oraz struktury danych zostanie Niezgodność terminologii oraz struktury danych zostanie wyeliminowana przez tzw. wyeliminowana przez tzw. modele abstrakcji danych modele abstrakcji danych oraz ich oraz ich

interpretery interpretery (ang. translation services) z wykorzystaniem (ang. translation services) z wykorzystaniem agentówagentów..

Page 12: Technologie

12/34

PrzykładowePrzykładowewizje działaniawizje działania

Agenci personalni (ang. Personal Agents)- to specjalistyczne programy komputerowe, których zadaniem jest ułatwienie codziennej pracy, poprzez automatyczne lub półautomatyczne wykonywanie powierzonych im zadań w Internecie.

Przykład Michael’a:

- Michael miał wypadek samochodowy, po którym chciałby udać się do najlepszego specjalisty w mieście, zlecając jego wybór swojemu personalnemu Agentowi.

- Michael jak każdy człowiek ma swoje osobiste preferencje i wie jakie cechy powinien posiadać jego lekarz.

- Michael jest także bardzo zajętym człowiekiem, nie może umawiać się w dowolnym terminie.

Wykład 12: Semantic Web

Wizja Semantic Web:Wizja Semantic Web:

Z kilku ofert przedstawionych przez Z kilku ofert przedstawionych przez AgentaAgenta, Michael z zadowoleniem , Michael z zadowoleniem wybiera swojego lekarza, blisko domu i w przystępnej cenie. wybiera swojego lekarza, blisko domu i w przystępnej cenie.

Dodatkowo jest już umówiony na pierwszą wizytę!Dodatkowo jest już umówiony na pierwszą wizytę!

Page 13: Technologie

13/34

SW vs. AISW vs. AI Semantyczny Internet == Sztuczna Inteligencja ????

Wykład 12: Semantic Web

Większość technologii używanych do realizacji założeń Semantic WebWiększość technologii używanych do realizacji założeń Semantic Webopiera się na opiera się na dotychczasowychdotychczasowych osiągnięciach osiągnięciach sztucznej inteligencjisztucznej inteligencji..

Sztuczna inteligencja (ang. Artificial Intelligence) to dział informatyki, którego przedmiotem jest badanie reguł rządzących inteligentnymi zachowaniami człowieka, tworzenie modeli formalnych tych zachowań, a w rezultacie programów komputerowych symulujących te zachowania.

Zasadnicza różnica:AI --- podejmowanie decyzji za człowiekaSW --- wspomaganie decyzji podejmowanych przez człowieka

„„The realization of the Semantic Web vision doesThe realization of the Semantic Web vision doesnot rely on human-level intelligence; not rely on human-level intelligence;

the challenges are approached in different way”the challenges are approached in different way”-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004

Page 14: Technologie

14/34

PodstawowePodstawowepojęcia SWpojęcia SW

Wykład 12: Semantic Web

Współcześnie, głównym zadaniem twórców Semantycznego Internetujest integracja, standaryzacja, rozwój narzędzi użytkowych oraz wprowadzenie ich do codziennego użytku.

Do słownika podstawowych terminów związanych z SW należą:

metadane (ang. explicit metadata) ontologie (ang. ontologies) logika (ang. logic) agenci (ang. agents)

Każdy z wyżej wymienionych terminów kryje w sobie zestaw nowoczesnych technologii pozwalających na spełnienie wymagańi założeń idei Semantycznego Internetu.

Page 15: Technologie

15/34

StandardoweStandardowedanedane

Wykład 12: Semantic Web

Metadane (ang. explicit metadata)

Współczesne podejście (HTML):<h1>Agilitas Physiotherapy Centre</h1>Welcome to the home page of the Agilitas Physiotherapy Centre.Do you feel pain? Have you had an injury? Let our staffLisa Davenport, Kelly Townsend (our lovely secretary)and Steve Matthews take care of your body and soul.<h2>Consultation hours</h2>Mon 11am - 7pm<br>Tue 11am - 7pm<br>Wed 3pm - 7pm<br>Thu 11am - 7pm<br>Fri 11am - 3pm<p>But note that we do not offer consultation during the weeks of the<a href=". . .">State Of Origin</a> games.

Ustandaryzowane dane (XML):<company><treatmentOffered> Physiotherapy</treatmentOffered><companyName>Agilitas Physiotherapy Centre</companyName><staff><therapist>Lisa Davenport</therapist><therapist>Steve Matthews</therapist><secretary>Kelly Townsend</secretary></staff></company>

Czytelne dla ludzi,Czytelne dla ludzi,nieczytelne dla maszyn…nieczytelne dla maszyn…

Oficjalny standard danychOficjalny standard danychw przyszłości, wymaga w przyszłości, wymaga

„„adaptacji”adaptacji”……

Page 16: Technologie

16/34

OntologieOntologie

Wykład 12: Semantic Web

Ontologie (ang. ontologies)- w sensie informatycznym to formalna reprezentacja pewnej dziedziny wiedzy, na którą składa się zapis zbiorów pojęć (ang. concept) i relacji między nimi.

- zapis ten tworzy schemat pojęciowy, który stanowi opis danej dziedziny wiedzy.

- schemat pojęciowy jest podstawą do wnioskowania o właściwościach opisywanych ontologią pojęć.

- wywodzą się z dziedziny sztucznej inteligencji (podstawa dla SW)

Dla przykładu ontologie mogą zawierać takie informacje jak:

właściwości – X uczy Y

ograniczenia wartości – Tylko pracownicy wydziału mogą prowadzić kursy

rozłączności – Pracownicy wydziałowi i ochrony nie są ze sobą powiązani

specyfikacje logicznych powiązań między obiektami – Każda Katedra musi posiadać co najmniej 10 pracowników wydziałowych

Page 17: Technologie

17/34

OntologieOntologie

Wykład 12: Semantic Web

Ontologie wprowadzają porządek znaczeniowy w obrębie domeny, Ontologie wprowadzają porządek znaczeniowy w obrębie domeny, pomagając uniknąć konfliktów nazw (podobnej terminologii).pomagając uniknąć konfliktów nazw (podobnej terminologii).

Hierarchia znaczeniowa w obrębie domeny (przykład Uniwersytetu)

Page 18: Technologie

18/34

OntologieOntologie

Wykład 12: Semantic Web

Korzyści z zastosowania ontologii:

łatwiejsza organizacja i nawigacja po stronie (menu, mapy strony…) zwiększenie skuteczności wyszukiwarek, wyszukiwanie powiązań zamiast słów kluczowych wspomaganie procesu wyszukiwania – sugestia bardziej lub mniej złożonych zapytań

Technologie używane do opisu ontologii:

XML – ustandaryzowane dane, brak powiązań XML Schema – ograniczenia specyficzne dla danych RDF – model danych dla obiektów, relacje pomiędzy obiektami RDF Schema – opis (pojęciowy) właściwości i klas obiektów RDF OWL – rozszerzenie RDF, z bogatszym słownikiem i składnią języka

Podstawą wszystkich wymienionych technologii jest język Podstawą wszystkich wymienionych technologii jest język XMLXML..

Page 19: Technologie

19/34

LogikaLogika

Wykład 12: Semantic Web

Logika (ang. logic)- to dział matematyki, którego przedmiotem są formalne teorie matematyczne i ich modele, dowody oraz zasięg matematycznych rozumowań.

- przyczyniła się do rozwoju technologii komputerowych, w tym informatyki teoretycznej

- osiągnięcia logiki formalnej wykorzystywane są w sztucznej inteligencji

Przykład wyprowadzeń logicznych:

Page 20: Technologie

20/34

LogikaLogika

Wykład 12: Semantic Web

Zastosowanie zasad logiki w Sematic Web pozwoli na:

podejmowanie decyzji przez agentów i wykonywanie określonej akcji

możliwość odtworzenia logicznego procesu „myślenia” agenta

Efekt Zwiększone zaufanie klienta do agenta SW

możliwość weryfikacji decyzji jednego agenta przez drugiego

Agent I: Posiadasz dług w wysokości 80 zł

Agent II:

potwierdzam

Page 21: Technologie

21/34

Aplikacje Aplikacje agentoweagentowe

Wykład 12: Semantic Web

Agenci (ang. agents)- to autonomiczne oprogramowanie, aktywnie wspomagające decyzje

użytkownika oraz wykonujące określone przez niego zadania

Podstawowy proces działania agenta:1) Definicja zadania i preferencji użytkownika2) Kolekcjonowanie informacji i zasobów sieciowych3) Komunikacja z innymi agentami4) Porównywanie znalezionych informacji z preferencjami użytkownika5) Podjęcie decyzji, wybór ofert6) Przedstawienie rezultatów działań użytkownikowi

Agenci wykorzystują wszystkie omówione technologie SW:

Metadane – kolekcjonowanie informacji z zasobów sieciowych

Ontologie – wspomaganie działania wyszukiwarek, interpretacja wyników, komunikacja z innymi agentami

Logika – przetwarzanie zebranych informacji, podejmowanie decyzji

Page 22: Technologie

22/34

Aplikacje Aplikacje agentoweagentowe

Wykład 12: Semantic Web

Użytkownik w sieci WWW…

Dziś… W przyszłości…

Page 23: Technologie

23/34

WarstwowośćWarstwowośćtechnologiitechnologii

Wykład 12: Semantic Web

Rozwój technologii Semantic Web podzielony jest na Rozwój technologii Semantic Web podzielony jest na krokikroki..

Każdy krok buduje kolejną Każdy krok buduje kolejną warstwę modeluwarstwę modelu na szczycie poprzedniej. na szczycie poprzedniej.

Strukturę warstwową Semantic Web określa się mianem „warstwowego placka” (ang. layer cake).

Page 24: Technologie

24/34

WarstwowośćWarstwowośćtechnologiitechnologii

Wykład 12: Semantic Web

W budowie kolejnych warstw modelu Semantic Web muszą byćspełnione dwie zasadnicze reguły:

Kompatybilność wsteczna (ang. downward compatibility)

- aplikacje pracujące w wyższej warstwie muszą umieć interpretować i wykorzystywać informacje zapisane w niższych warstwach modelu.

Częściowe rozumienie w przód (ang. upward partial understanding)

- aplikacje pracujące w niższej warstwie muszą posiadać zdolność do co najmniej częściowego wykorzystania informacji z wyższych warstw modelu.

Page 25: Technologie

25/34

WarstwowośćWarstwowośćtechnologiitechnologii

Wykład 12: Semantic Web

Zależności pomiędzy warstwami modelu Semantic Web: XML, XML Schema+ potrafi przechowywać dane w ustandaryzowany sposób, z użyciem pojęć (nazw elementów) zdefiniowanych przez użytkownika.

+ bierze udział w procesie przesyłu danych przez sieć WWW.

RDF, RDF Schema+ podstawowy model danych, zawiera opis zależności między obiektami+ nie jest zależny od XML, lecz posiada jego składnię+ RDF Schema bazuje na RDF i jest uboższą wersją OWL

OWL+ jest rozszerzeniem możliwości RDF+ stanowi podstawę do wyprowadzeń logicznych

Logic+ wykorzystuje i rozszerza możliwości ontologii do budowy logiki aplikacji

Proof+ weryfikuje proces dedukcji oraz działania niższych warstw modelu

Trust+ bazując na mechanizmach zabezpieczeń, certyfikacjach, podpisach elektronicznych, ocenie i zaufaniu użytkowników zatwierdza efekt końcowy.

Page 26: Technologie

33/34

PodsumowaniePodsumowanie

Wykład 12: Semantic Web

„„TThe Web will only achievehe Web will only achieve its full potential when users have its full potential when users have trust in its operations (security) and in thetrust in its operations (security) and in the quality quality

of information providedof information provided””-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004

Semantyczny Internet jest inicjatywą mającą na celu wzbogacenie dotychczasowych technologii i sposobu użytkowania Internetu

Główną ideą SW jest wykorzystanie informacji „przetwarzalnej maszynowo” (ang. machine-processable)

Podstawowe składniki SW to metadane, ontologie, logika i zależności oraz inteligentni agenci

Rozwój technologii SW przebiega warstwowo (ang. layer cake)

Page 27: Technologie

34/34

LiteraturaLiteratura

Wykład 12: Semantic Web

Książki

Grigoris Antoniou, Frank van Harmelen, A Semantic Web Primer, 2nd Edition, The MIT Press, 2008

John Hebeler, Matthew Fisher, Semantic Web Programming, Wiley, 2009

John Davies, Semantic Web Technologies: Trends and Research in Ontology-based Systems, Wiley, 2006

T. Berners-Lee, with M. Fischetti. Weaving the Web. San Francisco: Harper,1999.

Źródła internetowe

Semantic Web Primer: http://www.ics.forth.gr/isl/swprimer/presentation.htm

W3C Semantic Web Activity: http://www.w3.org/2001/sw/

Semantyczny Web: http://semantictechnology.eu/

W3Schools Semantic Web: http://www.w3schools.com/web/web_semantic.asp