Udział Biblioteki Narodowej w bieżących projektach Europeany

Post on 28-Jan-2016

38 views 0 download

description

Udział Biblioteki Narodowej w bieżących projektach Europeany. Katarzyna Ślaska Biblioteka Narodowa. Europeana. - PowerPoint PPT Presentation

Transcript of Udział Biblioteki Narodowej w bieżących projektach Europeany

Udział Biblioteki Narodowej w bieżących projektach Europeany

Katarzyna Ślaska

Biblioteka Narodowa

Europeana

„Europeana daje nam okazję do podróżowania w czasie, ponad granicami i w głąb nowych koncepcji dotyczących definicji naszej kultury. Co więcej, pozwala stworzyć więź między ludźmi i ich historią oraz, dzięki interaktywnym stronom i narzędziom, także budować więzi międzyludzkie.”

Vivianne Reading, Komisarz UE ds. Społeczeństwa informacyjnego

Współpraca BN i Europeany

EDLnet: Thematic Networks (2007-2009)

Europeana v.1.0 (2009-2011) EuropeanaTravel (2009-2011) Europeana v.2.0 (2011-2014) Europeana Newspapers Online (2012-

2015)

Europeana v.2.0

Projekt finansowany w ramach ICT PSP Work Programme

Koordynatorem jest Europeana Foundation

Realizowany w latach 2011-2014

Partnerzy projektu

Europeana Foundation Biblioteka Brytyjska Biblioteka Narodowa Austrii Uniwersytet Humboldta w Berlinie Ministerstwo Kultury, Hiszpania Biblioteka Narodowa Polski Instytut Audiowizualny, Holandia Narodowy Instytut Audiowizualny, Francja Consiglio Nazionale delle Ricerche, Italy Department of Tourism, Culture and Sport, Ireland

Cele projektu Europeana v.2.0

Rozwój portalu Europeana, wzbogacenie jego zawartości cyfrowej i poprawa funkcjonalności

Poprawa satysfakcji użytkownika Lepsza koordynacja prac i poszerzenie

sieci współpracujących z Europeaną instytucji i organizacji

European Cultural Commons

European Cultural Commons to strategia rozumiana jako zespół działań zakładający masowe udostępnianie cyfrowe dziedzictwa kulturowego Europy.

Jest jednym z najważniejszych zadań zdefiniowanych w Europejskiej Agendzie Cyfrowej 2020.

Różnorodność …

… i współdziałanie

Konferencja European Cultural Commons, 12.10.2011

Konferencja European Cultural Commons

Celem konferencji było wypracowanie wizji realizacji strategii European Cultural Commons poprzez zapewnienie powszechnego dostępu do zdigitalizowanego dziedzictwa kulturowego, zaspokajającego potrzeby i oczekiwania zróżnicowanych grup użytkowników. Efektem prac ekspertów będzie analiza problemów w zakresie cyfrowego udostępniania dziedzictwa wraz z sugestiami sposobów ich rozwiązania.

Second European Cultural Commons Strategic Briefing

30 października 2012 Limassol, Cypr Kontynuacja dyskusji

zainicjowanej na konferencji w Warszawie

Przygotowanie rekomendacji do omówienia podczas Europeana Annual General Meeting

Projekt Europeana Newspapers online

Europeana Newspapers – dlaczego prasa?

„Gazety są wskazówką sekundową historii"

Arthur Schopenhauer

Dlaczego gazety?• Interesujące dla różnych grup odbiorców

• Projekt wpisuje się w politykę UE oraz realizuje cele Europeany

• W bibliotekach czasopisma są pomiędzy:• niebem = pełne ciągi zasobów, mikrofilmy wysokiej jakości• i piekłem = niska jakość oryginałów, brakujące numery i dodatki,

kopie mikrofilmowe złej jakości, prawa autorskie do współczesnych gazet

Europeana Newspapers: Plany i zamierzenia

• Agregacja i poprawa jakości reprodukcji cyfrowych gazet w Bibliotece Europejskiej i w portalu Europeana

• Zastosowanie nowoczesnych narzędzi wspierających OCR, OLR (segmentacja tekstu na artykuły) i rozpoznawanie nazw własnych (NER)

• Biblioteki biorące udział w projekcie dostarczą do Europeany 18 milionów stron gazet

• Kolejne biblioteki będą zachęcane do przekazywania reprodukcji gazet do Biblioteki Europejskiej i Europeany

Założenia projektu Europeana Newspapers

• Konsorcjum składa się z 17 partnerów reprezentujących 12 państw

• Biblioteki narodowe• Biblioteki uniwersyteckie• Inne jednostki

• Projekt zakłada zaangażowanie bibliotek nie wchodzących w skład konsorcjum

• Finansowany jest w ramach Best Practice Network programu ICT PSP Komisji Europejskiej

• Realizowany jest od lutego 2012 do lutego 2015 r.

Konsorcjum Europeana Newspapers

NLF

SBBONB

NLP

BnF

NLE

SUB HH

USAL

NLL

KB

LIBER

CCS

NLT

UB

UIBK

LFT

BL

Partnerzy projektu

9. Uniwersytet w Salford10. CCS Content Conversion Specialists GmbH11. LIBER12. Biblioteka Narodowa Łotwy13. Biblioteka Narodowa Turcji14. Biblioteka Uniwersytecka w Belgradzie

15. Uniwersytet w Innsbrucku16. Biblioteka Dr. Friedricha Tessmanna17. Biblioteka Brytyjska

1. Biblioteka Państwowa w Berlinie (koordynator)2. Biblioteka Narodowa Holandii3. Biblioteka Narodowa Estonii4. Biblioteka Narodowa Austrii5. Biblioteka Narodowa Finlandii6. Biblioteka Uniwersytecka w Hamburgu7. Biblioteka Narodowa Francji8. Biblioteka Narodowa Polski

Cele European Newspapers Online

1) Wybór, obróbka cyfrowa i agregacja prasy europejskiej• Europeana stanie się największą biblioteką cyfrową gazet• Wzbogacenie Europeany o 18 milionów stron gazet, w większości

przeszukiwalnych pełnotekstowo• Przeprowadzenie procesów OCR i segmentacji tekstu2) Analiza istniejących zasobów prasy • Zgromadzenie informacji o europejskich kolekcjach gazet3) Przygotowanie rekomendacji i zestawu dobrych praktyk• Opracowanie wzorcowej ścieżki digitalizacji prasy• Przygotowanie rekomendacji dotyczących digitalizacji, obróbki cyfrowej,

ścieżki digitalizacji, metadanych oraz narzędzi ewaluacyjnych 4) Udostęnienie gazet z możliwością przeszukiwania

pełnotekstowego• Poprawa dostępu do kolekcji prasy w Europeania

1) Wybór, obróbka cyfrowa i agregacja zasobów

• Agregacja 18 milionów stron gazet do European oraz Biblioteki Europejskiej

• 8 milionów stron bez obróbki cyfrowej

• 10 milionów stron z przeprowadzonym procesem OCR (Uniwersytet w Insbrucku)

• 2 miliony stron z przeprowadzonym procesem OCR oraz OLR (segmentacja tekstu) (CCS, Germany)

• Analiza dostarczonych zasobów prasy w postaci cyfrowej i wybór tytułów, przeznaczonych do obróbki cyfrowej

www.europeana.eu/

www.theeuropeanlibrary.org/

1) Obróbka cyfrowa – OCR i OLR

• 10 milionów stron z OCR: Uniwersytet w Insbrucku

• 2 miliony stron z OCR iOLR (firma CCS)

• Uniwersytet w Insbrucku wzbogaca OCR o informacje strukturalne na podstawie Document Understanding Platform

• CCS wykonuje pliki OCR i weryfikuje rozpoznaje szpalt, strukturyzację, segmentację na artykuły i typ strony

• CCS dostarcza bibliotekom oprogramowanie umożliwiające wprowadzanie poprawek rozpoznawania tekstu i jego segmentacji

CCS: Rozpoznawanie tekstu, segemntacja

Innsbruck: Rozpoznawanie nagłówków i przypisów oraz spisów treści

1) Obróbka cyfrowa - Named Entity Recognition

Biblioteka Narodowa Holandii prowadzi badania w zakresie rozpoznawania nazw własnych (NER) dla zasobów prasy publikowanych w języku holenderskim, angielskim oraz niemieckim

2) Analiza istniejących zasobów prasy

• Do połowy 2012 r. partnerzy projektu dokonają analizy zasobów czasopiśmienniczych w swoich zbiorach

• Dane zostaną udostępnione w “Zeitschriftendatenbank” (Centralnym Katalogu Czasopism) Biblioteki Państwowej w Berlinie

• Zaproponują również potencjalnych nowych partnerów projektu, którzy mogą swoimi zasobami wzbogacić kolekcję Europeana Newspapers

• Analiza będzie obejmowała również ocenę jakości technicznej zdigitalizowanych zasobów prasy i metadanych opisowych

• Kontaktowy adres mailowy dla instytucji zainteresowanych współpracą z projektem: survey@europeana-newspapers.eu/

3) Przygotowanie rekomendacji i zestawu dobrych praktyk

• Analiza formatów metadanych stosowanych przez partnerów projektu w opisie gazet i czasopism

• Zestawienie modeli metadanych ze standardami METS/ALTO i opracowanie rekomendacji dobrych praktyk w zakresie formatów stosowanych do opisu gazet i czasopism przeznaczonych do digitalizacji i obróbki cyfrowej

• Przygotowane rekomendacje zostaną przetestowane i poddane ewaluacji

• Przygotowanie rekomendacji i zestawu dobrych praktyk w zakresie obróbki cyfrowej reprodukcji cyfrowych gazet przeznaczonych do zamieszczania w portalu Europeana

4) Udostępnienie zasobów prasy

• W ramach projektu w portalu TEL zostanie udostępniona przeglądarka umożliwiająca:

• Przeszukiwanie pełnotekstowe przez m.in.

• terminy wyszukiwawcze,

• nazwy własne,

• kolekcje gazet,

• daty ….

• Przeglądanie reprodukcji cyfrowych gazet• Przejście do zasobów cyfrowych macierzystej biblioteki • Po zakończeniu projektu przeglądarka zostanie przeniesiona do Europeany

Gazety polskie w Newspapers Online

Dziękuję za uwagę!

Katarzyna Ślaska

k.slaska@bn.org.pl