Technologie
description
Transcript of Technologie
TechnologieTechnologiemgr inż. Tomasz Węglińskimgr inż. Tomasz Węgliński
email: email: [email protected]
www: www: http://www.tweglinski.pl
Łódź, 5 listopada 2012 rokuŁódź, 5 listopada 2012 roku
WYKŁAD 12WYKŁAD 12
Semantic WebSemantic Web
2/34
3/34
Na wykładzie omówimy sobie następujące zagadnienia:
Bariery współczesnego Internetu
Co to jest Semantic Web i jakie są jego idee?
Przykładowe wizje działania
Semantyczny Internet czy sztuczna inteligencja?
Kluczowe pojęcia i technologie
Warstwowość technologii i struktura działania
Podsumowanie
Literatura
Plan wykładuPlan wykładu
Wykład 12: Semantic Web
4/34
BarieryBarieryWWWWWW
Powstanie sieci WWW (ang. World Wide Web) na zawsze zmieniło sposób komunikacji międzyludzkiej i biznesowej.
Podstawowe zastosowana Internetu to:
wyszukiwanie informacji zbieranie informacji (często z wielu źródeł) komunikacja z innymi ludźmi (portale społecznościowe, blogi etc.) przeszukiwanie internetowych baz filmów, muzyki, książek… przeglądanie ofert firmowych zakupy w sieci i aukcje internetowe wypełnianie formularzy bankowych, sklepowych, urzędowych…
Treści prezentowane w Internecie są przekazywane w sposób przyjazny dla odbiorcy.
Programiści stron i aplikacji WWW przykładają bardzo dużą wagę do tworzenia jak najbardziej „przyjaznego” interfejsu użytkownika.
Wykład 12: Semantic Web
5/34
BarieryBarieryWWWWWW
Sukces Internetu został osiągnięty w dużej mierze dzięki tzw. wyszukiwarkom internetowym (Google, Yahoo, Alta Vista etc…).
Użytkownicy korzystający z wyszukiwarek na co dzień borykają się jednak z wieloma z problemami typu:
Dużo wyników, mało interesujących nas treści Mało wyników lub ich brak Wrażliwość na słownictwo (poprawność słów kluczowych) Szeroki rozrzut informacji (kolekcjonowanie informacji z wielu stron) Czas poświęcony na zbieranie informacji jest za długi (!) Trudność z oceną wiarygodności informacji na stronie (wpisy na forum, opinie użytkowników produktu)
„„The amount of Web content The amount of Web content outspaces technological process”outspaces technological process”
-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
Wykład 12: Semantic Web
6/34
BarieryBarieryWWWWWW
Dlaczego wyszukiwarki internetowe mają małą skuteczność?
Analiza języka naturalnego jest bardzo trudna
Treści przekazywane w Internecie są „nieprzyjazne maszynowo”
Prosty przykład:
I am a professor of computer science. I am a professor of computer science, you may think. Well…
…a może użyć technik przetwarzania tekstu, sztucznej inteligencji…?
Wykład 12: Semantic Web
7/34
IdeaIdeaSemantic WebSemantic Web
Idea Semantic Web (tłum.: Semantyczny Internet):
To nie treści (dane) są złe, To nie treści (dane) są złe, tylko sposób ich przetwarzania.tylko sposób ich przetwarzania.
Treści powinny być przekazywane aplikacji w sposób „przetwarzalny maszynowo” (ang. machine-processable)
Podejście to jest ewolucją, nie rewolucją dla współczesnego Internetu
Semantyczny Internet to marzenie i wizja jego twórcy
– Tima Bernersa – Lee
Organizacje rządowe wspierają ideę Semantic Web:
Europen Union’s Sixth Framework Programme DARPA Agent Markup Language (DAML)
Wykład 12: Semantic Web
8/34
PrzykładowePrzykładowewizje działaniawizje działania
Niemal wszystkie obszary działania oraz zastosowania współczesnego Internetu wymagają usprawnienia.
Potrzeba wprowadzenia w życie idei i wizji Semantic Web jest widoczna na co dzień zarówno w sferze biznesu jak i prywatnej.
Zarządzanie wiedzą (ang. Knowledge Management)- to próba jak najlepszego wykorzystania wiedzy, która jest dostępna w organizacji, tworzenie nowej wiedzy oraz zwiększanie jej zrozumienia.
Aktualne problemy: uciążliwe wyszukiwanie, kolekcjonowanie i gromadzenie informacji czasochłonne dotarcie do już zgromadzonej informacji, aktualizacje prezentowanie informacji (różni odbiorcy, różne potrzeby)
Wizja Semantic Web:Wizja Semantic Web:
Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie pojęciowe (ang. pojęciowe (ang. conceptual spacesconceptual spaces), zgodnie z ich znaczeniem.), zgodnie z ich znaczeniem.
Wykład 12: Semantic Web
9/34
PrzykładowePrzykładowewizje działaniawizje działania
B2C E-commerce (ang. Business-to-consumer Electronic Commerce)- to nazwa relacji występujących pomiędzy firmą a klientem końcowym, często realizowanych za pomocą Internetu (przegląd ofert, wybór, kupno).
Przykłady: Allegro, Ebay, Amazon, Morele…
Aktualne problemy: czasochłonne przeglądanie ofert nie sposób przejrzeć i wybrać wszystkich dostępnych ofert przed zakupem często nie znamy cen rynkowych często kupujemy „na ślepo” – im drożej tym musi być lepiej…
Przeglądanie ofert wspomagają tzw. przeglądarki cenowe (ang. shopbots).
Posiadają one jednak wady charakterystyczne dla typowych wyszukiwarek internetowych.
Przeglądarki cenowe nie są w stanie przeanalizować wszystkich cennych informacji, np. kosztów przesyłki i czasu dostawy.
Wykład 12: Semantic Web
10/34
PrzykładowePrzykładowewizje działaniawizje działania
B2C E-commerce (ang. Business-to-consumer Electronic Commerce)
Wizja Semantic Web:Wizja Semantic Web:
Opracujmy inteligentne programy, tzw. Opracujmy inteligentne programy, tzw. agentówagentów (ang. software agents), którzy będą umieć (ang. software agents), którzy będą umieć interpretowaćinterpretować
informacje o produkcie oraz politykę działania firmy.informacje o produkcie oraz politykę działania firmy.
Zalety (zadania) agentów internetowych są oczywiste:
precyzyjny proces zbierania informacji o produkcie i producencie pobieranie, kolekcjonowanie oraz interpretowanie opinii klientów przeprowadzenie automatycznych negocjacji ofert (z innymi agentami) zgodnie z ustaleniami i preferencjami klienta
Wykład 12: Semantic Web
11/34
PrzykładowePrzykładowewizje działaniawizje działania
B2B E-commerce (ang. Business-to-Business Electronic Commerce)- to nazwa relacji występujących pomiędzy firmami, określana często mianem "klasycznego" e-biznesu.
Aktualne problemy:
transfer danych za pomocą EDI (ang. Electronic Data Interchange) jest skomplikowany i zrozumiały tylko dla ekspertów EDI jest kosztowny i nie jest łatwy w integracji z innymi aplikacjami biznesowymi język HTML używany do prezentacji danych w sieci WWW nie posiada ustalonej struktury ani semantyki (problem wyszukiwania informacji) wykorzystanie dokumentów XML do komunikacji B2B wymaga ustalenia wspólnej, jednolitej struktury danych oraz nazewnictwa
Wykład 12: Semantic Web
Wizja Semantic Web:Wizja Semantic Web:
Niezgodność terminologii oraz struktury danych zostanie Niezgodność terminologii oraz struktury danych zostanie wyeliminowana przez tzw. wyeliminowana przez tzw. modele abstrakcji danych modele abstrakcji danych oraz ich oraz ich
interpretery interpretery (ang. translation services) z wykorzystaniem (ang. translation services) z wykorzystaniem agentówagentów..
12/34
PrzykładowePrzykładowewizje działaniawizje działania
Agenci personalni (ang. Personal Agents)- to specjalistyczne programy komputerowe, których zadaniem jest ułatwienie codziennej pracy, poprzez automatyczne lub półautomatyczne wykonywanie powierzonych im zadań w Internecie.
Przykład Michael’a:
- Michael miał wypadek samochodowy, po którym chciałby udać się do najlepszego specjalisty w mieście, zlecając jego wybór swojemu personalnemu Agentowi.
- Michael jak każdy człowiek ma swoje osobiste preferencje i wie jakie cechy powinien posiadać jego lekarz.
- Michael jest także bardzo zajętym człowiekiem, nie może umawiać się w dowolnym terminie.
Wykład 12: Semantic Web
Wizja Semantic Web:Wizja Semantic Web:
Z kilku ofert przedstawionych przez Z kilku ofert przedstawionych przez AgentaAgenta, Michael z zadowoleniem , Michael z zadowoleniem wybiera swojego lekarza, blisko domu i w przystępnej cenie. wybiera swojego lekarza, blisko domu i w przystępnej cenie.
Dodatkowo jest już umówiony na pierwszą wizytę!Dodatkowo jest już umówiony na pierwszą wizytę!
13/34
SW vs. AISW vs. AI Semantyczny Internet == Sztuczna Inteligencja ????
Wykład 12: Semantic Web
Większość technologii używanych do realizacji założeń Semantic WebWiększość technologii używanych do realizacji założeń Semantic Webopiera się na opiera się na dotychczasowychdotychczasowych osiągnięciach osiągnięciach sztucznej inteligencjisztucznej inteligencji..
Sztuczna inteligencja (ang. Artificial Intelligence) to dział informatyki, którego przedmiotem jest badanie reguł rządzących inteligentnymi zachowaniami człowieka, tworzenie modeli formalnych tych zachowań, a w rezultacie programów komputerowych symulujących te zachowania.
Zasadnicza różnica:AI --- podejmowanie decyzji za człowiekaSW --- wspomaganie decyzji podejmowanych przez człowieka
„„The realization of the Semantic Web vision doesThe realization of the Semantic Web vision doesnot rely on human-level intelligence; not rely on human-level intelligence;
the challenges are approached in different way”the challenges are approached in different way”-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
14/34
PodstawowePodstawowepojęcia SWpojęcia SW
Wykład 12: Semantic Web
Współcześnie, głównym zadaniem twórców Semantycznego Internetujest integracja, standaryzacja, rozwój narzędzi użytkowych oraz wprowadzenie ich do codziennego użytku.
Do słownika podstawowych terminów związanych z SW należą:
metadane (ang. explicit metadata) ontologie (ang. ontologies) logika (ang. logic) agenci (ang. agents)
Każdy z wyżej wymienionych terminów kryje w sobie zestaw nowoczesnych technologii pozwalających na spełnienie wymagańi założeń idei Semantycznego Internetu.
15/34
StandardoweStandardowedanedane
Wykład 12: Semantic Web
Metadane (ang. explicit metadata)
Współczesne podejście (HTML):<h1>Agilitas Physiotherapy Centre</h1>Welcome to the home page of the Agilitas Physiotherapy Centre.Do you feel pain? Have you had an injury? Let our staffLisa Davenport, Kelly Townsend (our lovely secretary)and Steve Matthews take care of your body and soul.<h2>Consultation hours</h2>Mon 11am - 7pm<br>Tue 11am - 7pm<br>Wed 3pm - 7pm<br>Thu 11am - 7pm<br>Fri 11am - 3pm<p>But note that we do not offer consultation during the weeks of the<a href=". . .">State Of Origin</a> games.
Ustandaryzowane dane (XML):<company><treatmentOffered> Physiotherapy</treatmentOffered><companyName>Agilitas Physiotherapy Centre</companyName><staff><therapist>Lisa Davenport</therapist><therapist>Steve Matthews</therapist><secretary>Kelly Townsend</secretary></staff></company>
Czytelne dla ludzi,Czytelne dla ludzi,nieczytelne dla maszyn…nieczytelne dla maszyn…
Oficjalny standard danychOficjalny standard danychw przyszłości, wymaga w przyszłości, wymaga
„„adaptacji”adaptacji”……
16/34
OntologieOntologie
Wykład 12: Semantic Web
Ontologie (ang. ontologies)- w sensie informatycznym to formalna reprezentacja pewnej dziedziny wiedzy, na którą składa się zapis zbiorów pojęć (ang. concept) i relacji między nimi.
- zapis ten tworzy schemat pojęciowy, który stanowi opis danej dziedziny wiedzy.
- schemat pojęciowy jest podstawą do wnioskowania o właściwościach opisywanych ontologią pojęć.
- wywodzą się z dziedziny sztucznej inteligencji (podstawa dla SW)
Dla przykładu ontologie mogą zawierać takie informacje jak:
właściwości – X uczy Y
ograniczenia wartości – Tylko pracownicy wydziału mogą prowadzić kursy
rozłączności – Pracownicy wydziałowi i ochrony nie są ze sobą powiązani
specyfikacje logicznych powiązań między obiektami – Każda Katedra musi posiadać co najmniej 10 pracowników wydziałowych
17/34
OntologieOntologie
Wykład 12: Semantic Web
Ontologie wprowadzają porządek znaczeniowy w obrębie domeny, Ontologie wprowadzają porządek znaczeniowy w obrębie domeny, pomagając uniknąć konfliktów nazw (podobnej terminologii).pomagając uniknąć konfliktów nazw (podobnej terminologii).
Hierarchia znaczeniowa w obrębie domeny (przykład Uniwersytetu)
18/34
OntologieOntologie
Wykład 12: Semantic Web
Korzyści z zastosowania ontologii:
łatwiejsza organizacja i nawigacja po stronie (menu, mapy strony…) zwiększenie skuteczności wyszukiwarek, wyszukiwanie powiązań zamiast słów kluczowych wspomaganie procesu wyszukiwania – sugestia bardziej lub mniej złożonych zapytań
Technologie używane do opisu ontologii:
XML – ustandaryzowane dane, brak powiązań XML Schema – ograniczenia specyficzne dla danych RDF – model danych dla obiektów, relacje pomiędzy obiektami RDF Schema – opis (pojęciowy) właściwości i klas obiektów RDF OWL – rozszerzenie RDF, z bogatszym słownikiem i składnią języka
Podstawą wszystkich wymienionych technologii jest język Podstawą wszystkich wymienionych technologii jest język XMLXML..
19/34
LogikaLogika
Wykład 12: Semantic Web
Logika (ang. logic)- to dział matematyki, którego przedmiotem są formalne teorie matematyczne i ich modele, dowody oraz zasięg matematycznych rozumowań.
- przyczyniła się do rozwoju technologii komputerowych, w tym informatyki teoretycznej
- osiągnięcia logiki formalnej wykorzystywane są w sztucznej inteligencji
Przykład wyprowadzeń logicznych:
20/34
LogikaLogika
Wykład 12: Semantic Web
Zastosowanie zasad logiki w Sematic Web pozwoli na:
podejmowanie decyzji przez agentów i wykonywanie określonej akcji
możliwość odtworzenia logicznego procesu „myślenia” agenta
Efekt Zwiększone zaufanie klienta do agenta SW
możliwość weryfikacji decyzji jednego agenta przez drugiego
Agent I: Posiadasz dług w wysokości 80 zł
Agent II:
potwierdzam
21/34
Aplikacje Aplikacje agentoweagentowe
Wykład 12: Semantic Web
Agenci (ang. agents)- to autonomiczne oprogramowanie, aktywnie wspomagające decyzje
użytkownika oraz wykonujące określone przez niego zadania
Podstawowy proces działania agenta:1) Definicja zadania i preferencji użytkownika2) Kolekcjonowanie informacji i zasobów sieciowych3) Komunikacja z innymi agentami4) Porównywanie znalezionych informacji z preferencjami użytkownika5) Podjęcie decyzji, wybór ofert6) Przedstawienie rezultatów działań użytkownikowi
Agenci wykorzystują wszystkie omówione technologie SW:
Metadane – kolekcjonowanie informacji z zasobów sieciowych
Ontologie – wspomaganie działania wyszukiwarek, interpretacja wyników, komunikacja z innymi agentami
Logika – przetwarzanie zebranych informacji, podejmowanie decyzji
22/34
Aplikacje Aplikacje agentoweagentowe
Wykład 12: Semantic Web
Użytkownik w sieci WWW…
Dziś… W przyszłości…
23/34
WarstwowośćWarstwowośćtechnologiitechnologii
Wykład 12: Semantic Web
Rozwój technologii Semantic Web podzielony jest na Rozwój technologii Semantic Web podzielony jest na krokikroki..
Każdy krok buduje kolejną Każdy krok buduje kolejną warstwę modeluwarstwę modelu na szczycie poprzedniej. na szczycie poprzedniej.
Strukturę warstwową Semantic Web określa się mianem „warstwowego placka” (ang. layer cake).
24/34
WarstwowośćWarstwowośćtechnologiitechnologii
Wykład 12: Semantic Web
W budowie kolejnych warstw modelu Semantic Web muszą byćspełnione dwie zasadnicze reguły:
Kompatybilność wsteczna (ang. downward compatibility)
- aplikacje pracujące w wyższej warstwie muszą umieć interpretować i wykorzystywać informacje zapisane w niższych warstwach modelu.
Częściowe rozumienie w przód (ang. upward partial understanding)
- aplikacje pracujące w niższej warstwie muszą posiadać zdolność do co najmniej częściowego wykorzystania informacji z wyższych warstw modelu.
25/34
WarstwowośćWarstwowośćtechnologiitechnologii
Wykład 12: Semantic Web
Zależności pomiędzy warstwami modelu Semantic Web: XML, XML Schema+ potrafi przechowywać dane w ustandaryzowany sposób, z użyciem pojęć (nazw elementów) zdefiniowanych przez użytkownika.
+ bierze udział w procesie przesyłu danych przez sieć WWW.
RDF, RDF Schema+ podstawowy model danych, zawiera opis zależności między obiektami+ nie jest zależny od XML, lecz posiada jego składnię+ RDF Schema bazuje na RDF i jest uboższą wersją OWL
OWL+ jest rozszerzeniem możliwości RDF+ stanowi podstawę do wyprowadzeń logicznych
Logic+ wykorzystuje i rozszerza możliwości ontologii do budowy logiki aplikacji
Proof+ weryfikuje proces dedukcji oraz działania niższych warstw modelu
Trust+ bazując na mechanizmach zabezpieczeń, certyfikacjach, podpisach elektronicznych, ocenie i zaufaniu użytkowników zatwierdza efekt końcowy.
33/34
PodsumowaniePodsumowanie
Wykład 12: Semantic Web
„„TThe Web will only achievehe Web will only achieve its full potential when users have its full potential when users have trust in its operations (security) and in thetrust in its operations (security) and in the quality quality
of information providedof information provided””-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
Semantyczny Internet jest inicjatywą mającą na celu wzbogacenie dotychczasowych technologii i sposobu użytkowania Internetu
Główną ideą SW jest wykorzystanie informacji „przetwarzalnej maszynowo” (ang. machine-processable)
Podstawowe składniki SW to metadane, ontologie, logika i zależności oraz inteligentni agenci
Rozwój technologii SW przebiega warstwowo (ang. layer cake)
34/34
LiteraturaLiteratura
Wykład 12: Semantic Web
Książki
Grigoris Antoniou, Frank van Harmelen, A Semantic Web Primer, 2nd Edition, The MIT Press, 2008
John Hebeler, Matthew Fisher, Semantic Web Programming, Wiley, 2009
John Davies, Semantic Web Technologies: Trends and Research in Ontology-based Systems, Wiley, 2006
T. Berners-Lee, with M. Fischetti. Weaving the Web. San Francisco: Harper,1999.
Źródła internetowe
Semantic Web Primer: http://www.ics.forth.gr/isl/swprimer/presentation.htm
W3C Semantic Web Activity: http://www.w3.org/2001/sw/
Semantyczny Web: http://semantictechnology.eu/
W3Schools Semantic Web: http://www.w3schools.com/web/web_semantic.asp