Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek...

8

Click here to load reader

description

preprint

Transcript of Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek...

Page 1: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

Leszek Szafrański

Biblioteka Jagiellońska

[email protected]

Wykorzystanie programów firmy Google przy tworzeniu

Jagiellońskiej Biblioteki Cyfrowej

Abstrakt W artykule omówiono rodzaje formatów stosowanych w Jagiellońskiej Bibliotece Cyfrowej do prezentowania

dokumentów w Internecie. Przedstawiono również na podstawie zebranych danych formaty prezencyjne dostępne w

polskich bibliotekach cyfrowych oraz omówiono szczegółowo format text/html. Opisano również programy Picasa i

Google Maps Image Cutter, które wykorzystano w projekcie Jagiellońska Biblioteka Cyfrowa. W artykule na

wybranych przykładach została opisana praca z tymi programami przy tworzeniu kolekcji cyfrowych udostępnianych

na stronach Jagiellońskiej Biblioteki Cyfrowej.

Wprowadzenie

Jagiellońska Biblioteka Cyfrowa (JBC) została uruchomiona 19 lipca 2010 r. W pierwszym

okresie istnienia, działała w wersji pilotażowej. JBC jest wynikiem projektu współfinansowanego

przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach

Programu Operacyjnego Infrastruktura i Środowisko na lata 2007–2013. W ciągu pierwszego roku

działalności biblioteki cyfrowej zostało opublikowanych prawie 60 tysięcy dokumentów

bibliotecznych, na które składają się: czasopisma, dokumenty życia społecznego, książki,

Page 2: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

muzykalia, rękopisy, starodruki, zbiory ikonograficzne, zbiory kartograficzne1. JBC należy do

Federacji Bibliotek Cyfrowych (FBC). Pod względem ilości publikacji plasuje się obecnie na

trzecim miejscu wśród polskich bibliotek cyfrowych zrzeszonych w FBC.

W momencie powstawania Jagiellońskiej Biblioteki Cyfrowej (JBC) pojawił się też problem

sposobu prezentowania dokumentów bibliotecznych na stronach internetowych. Do udostępniania

czasopism, dokumentów życia społecznego, książek, muzykaliów, rękopisów oraz starodruków

został użyty format DjVu. Do dokumentów nowych, czyli publikowanych pod koniec XX w.

i w XXI w. użyty został format PDF. Natomiast do publikowania zbiorów ikonograficznych,

zbiorów kartograficznych zostały użyte formaty DjVu, text/html.

Do konwersji na poszczególne formaty w JBC zostały użyte w przeważającej większości

programy bezpłatne, dostępne za darmo w Internecie m. in.: użytych zostało kilka programów do

ręcznego tworzenia stron internetowych (edytory tekstowe), program Zoomify Express, oraz pakiet

programów firmy Google: Google Picasa i Google Maps Image Cutter. Jedynym programem

komercyjnym używanym w JBC jest Document Express Enterprise za pomocą, którego

konwertowane są dokumenty do formatu DjVu.

Formaty w bibliotekach cyfrowych

Rysunek 1 przedstawia rodzaje formatów stosowanych w dokumentach cyfrowych

publikowanych w polskich bibliotekach cyfrowych w układzie procentowym (dane dotyczą

wszystkich publikacji).

Rysunek 1. Rodzaje formatów w bibliotekach cyfrowych. Źródło: opracowanie własne na podstawie FBC. Tryb

1 Jagiellońska Biblioteka Cyfrowa obchodzi pierwsze urodziny. Kraków, 2011. Tryb dostępu:

http://149.156.73.3/dlibra/dlibra/news?news=full#5695b481-da21-4451-a528-cbd067b0008a [19.07.2011]

image/x.djvu pdf text/html pozostałe0

102030405060

708090

formaty dokumentów w bibliotekach cyfrowych

liczba dokumentów w %

rodzaje formatów

liczb

a do

kum

entó

w w

%

Page 3: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

dostępu: http://fbc.pionier.net.pl/owoc/attr-stats [19.07.2011].

Zgromadzone dane wskazują, że w polskich bibliotekach cyfrowych najpopularniejszym formatem

jest DjVu (78%) stworzony przez naukowców amerykańskiego koncernu AT&T. Główną zaletą

formatu jest metoda kompresji obrazu bez widocznych strat jego jakości. Polega ona na

rozdzieleniu obrazów na odrębne warstwy i poddaniu ich odrębnej optymalizacji i kompresji.

Kolejnymi pod względem popularności formatami w bibliotekach cyfrowych są PDF (9%) służący

do prezentacji, przenoszenia i drukowania treści tekstowo-graficznych, stworzony przez firmę

Adobe Systems oraz text/html (9%)2. Pozostałe formaty - m.in.: powerpoint, jpeg, msword, video/x-

flv, tiff, gif, audio/mpeg, rtf, występują tylko w 4% opublikowanych dokumentów.

Formaty dostępne w bibliotekach cyfrowych są istotnym elementem funkcjonalności

z punktu widzenia użytkowników. Ważne jest, aby pliki z dokumentami otwierały się szybko na

komputerach czytelników, aby format był powszechny i w miarę możliwości nie wymagał ściągania

aplikacji lub nakładek. Powolne otwieranie stron internetowych z dokumentami oraz konieczność

instalacji dodatkowego oprogramowania do ich przeglądania należą do głównych czynników

zniechęcających potencjalnych użytkowników3. Według badań Agnieszki Lewandowskiej i Marcina

Werli, 15,7% użytkowników rezygnuje z korzystania z biblioteki cyfrowej po napotkaniu informacji

o potrzebie zainstalowania wtyczki lub plugin'u. Natomiast po napotkania bariery w postaci

formatu, który nie jest powszechnie znany i nie otwiera się automatycznie w przeglądarce,

rezygnuje 12,6% użytkowników4.

Tak wysoki odsetek traconych użytkowników wymaga znalezienia rozwiązań, które

pozwalają na wyeliminowanie wspomnianych problemów. Szczególnie problem ten dotyczy

dokumentów graficznych i kartograficznych, które mają duże rozmiary pliku wyjściowego, dużą

rozdzielczość i zawierają bardzo dużo szczegółów. Do prezentacji tego typu dokumentów można

użyć formatu text/html. Przy pomocy edytora HTML można opisać strukturę informacji zawartych

wewnątrz strony internetowej, nadając znaczenie poszczególnym fragmentom tekstu oraz osadzić

w tekście dokumentu obiekty plikowe5. Zaletą tego formatu jest to, że wyświetla się bez problemu

w każdej przeglądarce internetowej. Wadą natomiast jest fakt, że strony w języku HTML mogą

wyświetlać się odmiennie na różnych przeglądarkach. W celu uniknięcia tego typu problemów

2 W. M. Kolasa: Formaty hybrydowe w bibliotekach cyfrowych : kontekst i praktyka. Kraków, 2008. Tryb dostępu:

http://mbc.malopolska.pl/dlibra/docmetadata?id=13394&dirds=1&tab=1 [18.07.2011] 3 E. Skubała, A. Kazan: Analiza zasobu polskich bibliotek cyfrowych w kontekście ich wykorzystania w dydaktyce.

Wrocław, 2009. Tryb dostępu: http://www.nowyebib.info/publikacje/matkonf/mat20/skubala_kazan.php [18.07.2011]

4 A. Lewandowska, M. Werla: Jak czytelnik porusza sie po bibliotece cyfrowej? Analiza wzorców zachowań. VI warsztaty „Biblioteki cyfrowe” 2009. Tryb dostępu: http://dl.psnc.pl/biblioteka/dlibra/publication?id=264&from=&dirids=6&tab=1&lp=1&QI= [19.07.2011]

5 B. Danowski: ABC tworzenia stron WWW. Gliwice, 2006. s. 7-8

Page 4: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

powinno się używać języka XHTML, który jest rekomendowany przez W3C (World Wide Web

Consortium)6. XHTML jest udoskonaloną wersją języka zbudowaną na bazie języka HTML. Strony

stworzone przy jego pomocy wyświetlają się poprawnie i identycznie w każdej przeglądarce7.

W bibliotekach cyfrowych format text/html, co wskazuje rysunek 1, jest używany tylko

w ograniczonym zakresie. Na 59 przebadanych przez autora artykułu bibliotek, które używają

systemu dLibra tylko w 23 znajdują się dokumenty w formacie text/html, przy czym średnia liczba

opublikowanych dokumentów w tym formacie wynosi 94.

Czynniki wpływające na funkcjonalność opublikowanych w JBC dokumentów

Funkcjonalność traktuje się obecnie jako dyscyplinę polegającą na stosowaniu zasad

naukowej obserwacji, pomiaru i projektowania podczas tworzenia i modyfikowania stron

internetowych w celu zwiększenia użyteczności, dostępności i wygody użytkowania8.

Funkcjonalność w kartografii dotyczy zarówno tradycyjnych, drukowanych map jak

i komputerowych wizualizacji kartograficznych. O funkcjonalności mapy drukowanej w głównej

mierze decyduje czytelność treści, pomocna w interpretacji legenda, wygodny podział sekcyjny

i sposób składania arkusza9. Czynniki te nie mają prawie żadnego przełożenia na funkcjonalność

dokumentu kartograficznego opublikowanego w wersji cyfrowej. W takim przypadku

najważniejszy jest bowiem format wyświetlania, szybkość ładowania treści mapy na stronie

internetowej, interaktywność oraz przyjazny dla użytkownika interfejs. Równie ważne jest, to aby

prezentacje kartograficzne posiadały tytuł i opis.

Kluczowe znaczenie dla funkcjonalności map ma ich jakość wizualna. Bardzo trudne jest

osiągnięcie zadowalającej jakości przy skanowaniu i obróbce graficznej XVII – XIX w.

dokumentów kartograficznych o bardzo dużych rozmiarach. Skany wyjściowe w formacie TIFF

zajmują średnio objętość około 250 MB. Sprawia to duże trudności przy obróbce graficznej plików

w powszechnie dostępnych programach. Również uzyskanie dobrej rozdzielczości przy dużych

powiększeniach nie jest łatwe do osiągnięcia po konwersji do formatów prezencyjnych. Nawet po

konwersji do formatu DjVu (format charakteryzuje się małą objętością pliku wyjściowego)

pojedynczy skan może nadal wolno otwierać się na stronie WWW. W bibliotekach cyfrowych

bardzo często prezentowane mapy nie są czytelne co praktycznie dyskwalifikuje taką publikację.

6 W3C Recommendation. XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition). 2002. Tryb

dostępu: http://www.w3.org/TR/xhtml1 [18.07.2011] 7 J. Cowell: Wprowadzenie do XHTML : tworzenie dynamicznych stron www z wykorzystaniem XHTML i JavaScript.

Warszawa, 2003. s. 8 M. Pearrow: Funkcjonalność stron internetowych. Gliwice, 2002. s. 13 9 P. J. Kowalski: Problem funkcjonalności prezentacji kartograficznych w internetowych serwisach informacyjnych.

Tryb dostępu: zk.gik.pw.edu.pl/PIK/Kartonet/Utylinet.pdf [17.07.2011]

Page 5: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

W plikach graficznych najważniejsza jest możliwość znacznego powiększenia obrazu

i łatwa nawigacja po nim. Dlatego stosowanie odpowiednich programów ma kluczowe znaczenie

przy prezentowaniu publikacji w Internecie.

Zasady publikacji materiałów kartograficznych i graficznych w JBC

W JBC do prezentacji dokumentów kartograficznych i grafiki zostały zastosowane dwa

formaty generowane przy pomocy programów: Google Maps Image Cutter, Picasa, Zoomify

i Document Express Enterprise. W artykule autor skupił się głównie na dwóch programach, które

przydatne są do prezentowania plików graficznych w JBC.

Google Maps Image Cutter to bardzo proste narzędzie do prezentowania grafiki rastrowej na

stronach internetowych. Jest to program opracowany przez The Centre for Advanced Spatial

Analysis is a (CASA) jako projekt badawczy University College London10. Na rysunku 2

przedstawiona jest mapa utworzona przy pomocy programu Google Maps Image Cutter. Praca

z aplikacją nie sprawia trudności nawet mało zaawansowanemu użytkownikowi. Wystarczy tylko

wczytać przygotowany plik do programu bez potrzeby obniżania rozdzielczości. Program generuje

prostą stronę WWW z osadzonym w niej obrazem, który dzieli na kilka tysięcy mniejszych

obrazków. Następnie wystarczy już tylko opublikować stronę WWW w Internecie. Zaletą Google

Maps jest to, że pliki opublikowane przy pomocy tego programu bardzo szybko wyświetlają się na

stronie WWW (cały obraz podzielony jest na mniejsze obrazki ładujące się niezależnie od siebie).

Na podobnych zasadach działa oprogramowanie Zoomify. Różnica polega na tym, że Zoomify w

wersji darmowej generuje tylko plik z rozdzielonym obrazem, a stronę internetową trzeba samemu

sobie utworzyć. Podobne efekty dla skanów o bardzo dużych rozdzielczościach są trudne do

osiągnięcia za pomocą innych programów, które w przeważającej większości, aby wyświetlić plik

muszą załadować go w całości (im większy plik tym dłuższy czas oczekiwania na jego otwarcie na

stronie internetowej).

10 The GMap Image Cutter. Tryb dostępu: http://www.casa.ucl.ac.uk/software/googlemapimagecutter.asp

[17.07.2011]

Page 6: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

Rysunek 2. Mapa utworzona za pomocą programu Google Maps Image Cutter. Źródło: opracowanie własne. Tryb

dostępu: http://149.156.73.3/dlibra/dlibra/doccontent?id=423&dirids=1 [19.07.2011]

W JBC Google Maps Image Cutter znalazł zastosowanie przy prezentacji dokumentów

kartograficznych, które ze względu na szczegółowość i duże rozmiary muszą być skanowane

w bardzo dużych rozdzielczościach przez co też otrzymywany plik wyjściowy w formacie TIFF po

skanowaniu ma bardzo duży rozmiar. Wadą programu jest potrzeba okresowego generowania

specjalnego klucza API na stronie internetowej Google Maps API Family

(http://code.google.com/intl/pl/apis/maps/signup.html), gdyż kod wymaga uaktualnienia. Zaletami

w ten sposób stworzonej strony internetowej jest interfejs znany użytkownikom na całym świecie,

szybkie ładowanie strony w przeglądarce.

Programem używanym w JBC do prezentacji plików graficznych oraz tworzenia galerii

i wystaw internetowych jest między innymi bardzo popularny Google Picasa. To narzędzie ma

wiele przydatnych funkcji. W programie tym można w prosty sposób edytować zdjęcia czy skany,

poprawiać ich jasność i nasycenie kolorów, przycinać je i obracać. Są dostępne również filtry takie

jak sepia czy barwienie. Dla potrzeb JBC najbardziej przydatną funkcją Picasa jest możliwość

automatycznego eksportu wielu plików jako jednej strony HTML. Przy pomocy szablonów

dostępnych w programie można w prosty sposób wygenerować pokaz grafik lub galerię internetową

i opublikować ją w sieci. Istnieje możliwość wgrania do programu własnych szablonów oraz

dodawania tekstów i podpisów pod publikowanymi zdjęciami. W tym przypadku potrzebna jest

podstawowa znajomość budowy programów oraz tworzenia i edycji stron internetowych. Rysunek

3 przedstawia galerię internetową utworzoną przez autora artykułu w Google Picasa i zamieszczoną

na stronach JBC.

Page 7: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

Rysunek 3. Galeria internetowa utworzona za pomocą programu Google Picasa. Źródło: opracowanie własne. Tryb

dostępu: http://jbc.bj.uj.edu.pl/dlibra/Content/421/index.html [19.07.2011]

Podsumowanie

W Jagiellońskiej Bibliotece Cyfrowej w dalszym ciągu udoskonalane są różne metody

edycji, przetwarzania i prezentacji obiektów cyfrowych ponieważ technika komputerowej edycji

obrazu zmienia się bardzo szybko. Nie można skupiać się na jednym lub kilku programach

ponieważ użytkownicy w tym względzie są bardzo zróżnicowani. W przyszłości prezentowanie

obrazów na stronach internetowych prawdopodobnie będzie odbywać się w technice 3D, gdzie

użytkownik przy pomocy specjalnego oprzyrządowania (wirtualne: rękawice, hełmy, całe

kombinezony) będzie poruszał się po cyfrowym świecie powiązanym z przeglądaną treścią

tematyczną. W kontekście obserwacji rynku gier komputerowych wydaje się to całkiem bliską

perspektywą.

Bibliografia

1. Cowell J.: Wprowadzenie do XHTML : tworzenie dynamicznych stron www z

wykorzystaniem XHTML i JavaScript. Warszawa, 2003. s.

2. Danowski B.: ABC tworzenia stron WWW. Gliwice, 2006. s. 7-8

3. Jagiellońska Biblioteka Cyfrowa obchodzi pierwsze urodziny. Kraków, 2011. Tryb dostępu:

http://149.156.73.3/dlibra/dlibra/news?news=full#5695b481-da21-4451-a528-

Page 8: Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański

cbd067b0008a [19.07.2011]

4. Kolasa W. M.: Formaty hybrydowe w bibliotekach cyfrowych : kontekst i praktyka.

Kraków, 2008. Tryb dostępu: http://mbc.malopolska.pl/dlibra/docmetadata?id=13394&dird

s=1&tab=1 [18.07.2011]

5. Kowalski P. J.: Problem funkcjonalności prezentacji kartograficznych w internetowych

serwisach informacyjnych. Tryb dostępu: zk.gik.pw.edu.pl/PIK/Kartonet/Utylinet.pdf

[17.07.2011]

6. Lewandowska A., Werla M.: Jak czytelnik porusza sie po bibliotece cyfrowej? Analiza

wzorców zachowań. VI warsztaty „Biblioteki cyfrowe” 2009. Tryb dostępu:

http://dl.psnc.pl/biblioteka/dlibra/publication?id=264&from=&dirids=6&tab=1&lp=1&QI=

[19.07.2011]

7. Pearrow M.: Funkcjonalność stron internetowych. Gliwice, 2002. s. 13

8. Skubała E., Kazan A.: Analiza zasobu polskich bibliotek cyfrowych w kontekście ich

wykorzystania w dydaktyce. Wrocław, 2009. Tryb dostępu: http://www.nowyebib

.info/publikacje/matkonf/mat20/skubala_kazan.php [18.07.2011]

9. The GMap Image Cutter. Tryb dostępu: http://www.casa.ucl.ac.uk/software/googlemap

imagecutter.asp [17.07.2011]

10. W3C Recommendation. XHTML™ 1.0 The Extensible HyperText Markup Language

(Second Edition). 2002. Tryb dostępu: http://www.w3.org/TR/xhtml1 [18.07.2011]