Post on 14-Jul-2015
Czy OPAC ulegną destrukcji?
Linked Data w pracy bibliotekarza
Dr hab. Marek Nahotko, Uniwersytet Jagielloński
Spotkanie użytkowników Nukat,
Warszawa 5.12.2014
Cechy środowiska informacyjnego
Biblioteki utraciły dawny monopol na tworzenie
katalogów – zbiorów metadanych;
Każdy może stworzyć własny katalog; kiedyś ze
względu na mały zasięg nie miało to znaczenia,
teraz może on być dostępny na cały świat;
Wiele serwisów korzysta z pracy bibliotekarzy,
budując konkurencyjne narzędzia;
Dane biblioteczne zamknięte są w „silosach”, z
możliwością wejścia tylko przez OPAC i bez
połączeń ze światem zewnętrznym;
Jak funkcjonować w tak skomplikowanej sytuacji?
2
Teoria tekstu Gerarda Genette
3
Obok tekstu autorskiego istnieją także teksty go otaczające (parateksty), zarówno w obrębie książki (peritekst), jak i poza nią (epitekst);
Może to być: tytuł, podtytuł, pseudonim, wstęp, dedykacje, uwagi, epilog, również korespondencja autora, dzienniki, wywiady, ilustracje, preteksty…
Ich zadaniem jest mediacja tekstu do użytkownika, wskazują na kierunki interpretacji tekstu;
Paratekst to również tekst, należący do różnych gatunków;
Bibliotekarz posługuje się tekstem i peritekstem (czasem również epitekstem) dla stworzenia epitekstu (tekstu gatunku opisu bibliograficznego);
Katalog(i) można traktować jako gatunek paratekstu.
Opis bibliograficzny w teorii tekstu
4
Katalogowanie, jako tworzenie reprezentacji tekstu, jest typizowanym działaniem retorycznym, wykonywanym w powtarzalnych sytuacjach (definicja gatunku tekstu);
Katalogujący tworzy odrębnego rodzaju stwierdzenia/wypowiedzi/teksty: reprezentacje dokumentów; staje się więc autorem odpowiedzialnym za treść tych reprezentacji;
W ten sposób biblioteki, katalogi i bibliografie mogą być traktowane jako gatunki komunikacyjne, służące wspomaganiu publikowania i dokumentowania;
Katalogowanie i wyszukiwanie, jako część organizacji informacji, są aktywnościami równie złożonymi jak tworzenie i odbiór tekstów dokumentów; niezbędna wiedza gatunkowa w obu przypadkach jest taka sama.
Teksty i parateksty a technologie Sieci
5
Technologia Teksty Gatunki
tekstów
Gatunki
biblioteczne
Innowacja
Web 1.0 zamknięte tradycyjne OPAC mała
Web 2.0 otwarte nowe (np. blogi) OPAC 2.0,
SOPAC
większa
Web 3.0, SW kodowana
semantyka
automatyzacja? LOD,
Discovery?
destrukcyjna?
Współdziałanie (interoperability)
Oznacza uzgadnianie wiedzy gatunkowej twórców (i odbiorców) tekstu metadanych;
Zdolność dwóch lub więcej systemów lub ich części pracujących na różnym sprzęcie i oprogramowaniu, o różnych strukturach danych i interfejsach, do wymiany danych [głównie tekstów] z minimalną utratą treści i funkcjonalności (NISO);
Współdziałanie metadanych jest częścią znacznie większego problemu współdziałania systemów;
K. Subieta: dziedzina badawcza i praktyczna zajmująca się umożliwieniem współpracy niezależnie zbudowanych (heterogenicznych) systemów, szczególnie w sieciach komputerowych.
6
Poziomy współdziałania systemów Manso-Callejo i in.:
Techniczne: bity i bajty, pliki, przetwarzanie,
protokoły;
Syntaktyczne: wspólne formaty, struktury, języki;
Semantyczne: wspólne słowniki terminów;
Pragmatyczne: metody i procedury;
Dynamiczne: nadzór transferu danych;
Konceptualne: modelowanie systemu i danych;
Organizacyjne: cele biznesowe, polityka dostępu,
procesy, wzorce postępowania.
7
Poziomy uzgadniania wiedzy gatunkowej
(współdziałania metadanych) (Weibel)
Semantyka tekstu opisu:
Uzgodnione znaczenie elementów metadanych.
Struktura (czyli pragmatyka):
Rekordy, powtarzalność danych, konstrukcja nazw,
zasady i przepisy tworzenia wartości elementów (np. dat),
słowniki… czyli parateksty tekstu opisu bibliograficznego,
Czytelna dla człowieka, przetwarzalna dla maszyny.
Syntaktyka:
Reguły gramatyczne dla zapisu semantyki i pragmatyki
oraz ich kodowania, przesyłania i rozkodowywania.
8
Standaryzacja metadanych
9
Sposoby uzyskiwania współdziałania (Chan&Zeng)
10
INNOWACJA!
Nowa innowacyjna technologia
współdziałania – Linked (Open) Data (LOD)
11
Konieczność zmian w dwóch obszarach:
Treści: otwarte dane,
Systemy: linkowanie danych, tworzące Semantyczny
Web
Cele bibliotek związane z LOD:
Udostępnienie własnych danych jako LOD dla innych,
Pobieranie i wykorzystanie LOD z innych zasobów dla
wzbogacenia własnych danych,
Stosowanie LOD w celu stworzenia całkowicie nowej,
niezależnej od dotychczasowych dostawców,
Infrastruktury Webowej jako podstawy katalogowania (cel
BIBFRAME).
Linked Data
Technologia ta dotyczy wszystkich gatunków
paratekstu, tworzonego w bibliotekach;
Słowniki udostępniane w Web w formie czytelnej dla
komputerów;
Dwa rodzaje słowników (składniki):
Semantyka metadanych: słowniki będące wykazami
elementów metadanych (pól i podpól rekordu),
Pragmatyka metadanych: słowniki kontrolowane,
zawierające wartości metadanych.
12
Słowniki: MACS w LOD
13
Technologie Linked Data
14
Dane łączone odnośnikami URI (trójki RDF):
SPARQL – język zapytań, standard służący
wyszukiwaniu danych kodowanych jako trójki RDF:
skomplikowany i trudny w użyciu.
Przykładowe trójki RDF
15
Istota zmian
16
W LOD semantyka metadanych oddzielona jest od
ich syntaktyki, dzięki czemu zmiana struktur nie
powoduje zmiany znaczenia;
Zarówno elementy semantyki jak i pragmatyki
kodowane są przy pomocy tej samej syntaktyki
(XML/RDF) i są czytelne maszynowo;
Dzięki temu struktury danych (MARC, DC…) i inne
słowniki (jiw, khw) stają się ontologiami
umieszczonymi w chmurze danych.
Współdziałanie w LOD
17
Dwa rodzaje współdziałania
18
Rekord metadanych (paratekst) LOD
19
Korzyści
20
Nowe perspektywy dla rozproszonego współkatalogowania: ujednolicenie wiedzy gatunkowej;
Ujednolicenie wiedzy (globalny standard) pozwalające na: Wzrost możliwości wyszukiwawczych,
Optymalizację wykorzystania istniejących danych,
Wzrost współdziałania,
Elastyczny model danych,
Łatwiejszą integrację danych bibliotecznych w serwisach społecznościowych,
Lepsze wykorzystanie danych bibliotecznych przez wyszukiwarki.
BIBFRAME – słownik nadrzędny
21
Zastosowania biblioteczne
22
Efekt - innowacja destrukcyjna?
23
Koncepcja Claytona Christensena, ekonomisty (2008): niszczące innowacje
Innowacja: połączenie nowej technologii i bardziej efektywnego modelu ekonomicznego;
W wyniku innowacji produkt staje się prostszy i bardziej dostępny;
Niszczący wpływ na istniejący rynek.
Koncepcja Fostera i Kaplana (2003): twórcza destrukcja
Do rozpowszechnienia innowacji potrzebne zmiany: kultury i instytucji społeczeństwa, firm i czynników wpływających na proces produkcji.
Innowacje destrukcyjne
24
Dziękuję za uwagę!
marek.nahotko@uj.edu.pl 25