Formaty czasopism elektronicznych -...

70
1 Formaty czasopism i książek elektronicznych Dr hab. Marek Nahotko Transfer informacji w społeczeństwie

Transcript of Formaty czasopism elektronicznych -...

1

Formaty czasopism

i książek elektronicznych

Dr hab. Marek Nahotko

Transfer informacji w

społeczeństwie

2

Zalety publikacji tradycyjnych

Powszechnie znana i akceptowana konwencja;

Dobra jakość tekstu;

Dostosowanie do zdolności umysłowych człowieka;

Łatwo przenoszalne (w przestrzeni);

Publikacje elektroniczne, jeśli mają być konkurencją, muszą oferować jakąś wartość dodaną.

3

Zalety publikacji elektronicznych

Wiele zalet związanych z formatem:

Możliwości wyszukiwania (np.

pełnotekstowego);

Stosowanie multimediów;

Prezentacje interaktywne i symulacje;

Związki z innymi tekstami (odsyłacze, linki).

CZASOPISMA

ELEKTRONICZNE

Formaty publikacji elektronicznych

4

5

Pierwsze formaty

ASCII (American Standard Code for

Information Interchange)

Reprezentacja 128 znaków (symboli);

Nieadekwatna reprezentacja symboli

chemicznych i matematycznych;

Poważne trudności z reprezentacją języków

innych niż angielski;

Bardzo prymitywna grafika.

ASCII – pierwsze e-czasopisma

6

7

ASCII

8

ASCII

9

Pierwsze formaty

Bitmapa

Obraz graficzny zapisywany jako wzór

pojedynczych pikseli;

Duża objętość pliku, kiepska jakość obrazu;

Połączenie ASCII i bitmapy: możliwość

wyszukiwania pełnotekstowego z wyglądem

przypominającym druk;

Włączanie bitmap (np. wykresów, równań itp.)

do innych formatów (np. tekstowego, html).

10

Bitmapa

11

TeX i LaTeX

Oba formaty pozwalają na kodowanie tekstów;

TeX opisuje sposób wyświetlania tekstów;

LaTeX przedstawia strukturę logiczną tekstów – jest nadbudówką nad TeX, automatyzującą skład tekstu;

LaTeX używany bywa z dodatkowymi tzw. klasami (stylami) ułatwiającymi konkretne zastosowania (np. tworzenie tekstów chemicznych) – np. klasa RevTeX z grupy Physical Review;

Format WYSIWYM (What You See Is What You Mean) – autor tworzy strukturę logiczną (rozdziały, przypisy itp.), a tekst na stronie układa TeX.

Dokument LaTeX zawiera kod źródłowy, który w wyniku kompilacji tworzy plik DVI (Device Independent), który można konwertować np. do PostScriptu.

12

LaTeX – kod źródłowy

13

LaTeX - dokument

14

PostScript

Format opisuje ostateczny wygląd strony;

Akceptowany przez większość drukarek

laserowych;

Małe możliwości zmian przez użytkownika;

Fonty muszą być dołączone do

dokumentu (są odrębnym elementem).

15

PostScript w przeglądarce Ghostscript

16

CJTCS – formaty na początku XXI w.

CJTCS – formaty dziś

17

18

PDF

Wersja PostScript z nowymi cechami:

Linki hipertekstowe wewnątrz i między

dokumentami;

Przypisy i zakładki;

Przeglądanie miniaturek stron;

Fonty włączone do dokumentu

Indeksowanie i wyszukiwanie pełnotekstowe;

Efektywna kompresja (mniejsze pliki).

19

PDF

Możliwość utrzymania wyglądu strony;

Darmowe przeglądarki (podobnie jak dla

PS);

Coraz większe możliwości konwersji;

Strona czasopisma w HTML, artykuły w

PDF;

ISO 32000-1: 2008.

20

Inne formaty opisu strony

Replica - oprogramowanie opracowane we wczesnych latach 90. przez firmę Farallon Communications (od 2000 r. własność firmy Proxim), które służyło do przetwarzania dokumentów do formatu publikacji elektronicznej, podobnie jak PDF;

Common Ground - format dokumentu elektronicznego opracowany w latach 90. przez kanadyjską firmę Hummingbird z Toronto, służył do tworzenia międzyplatformowych publikacji elektronicznych w środowisku Windows i Mac OS, z użyciem specjalnego sterownika, działającego analogicznie jak sterownik drukarki;

Envoy - program opracowany w pierwszej połowie lat 90. przez firmę Tumbleweed Software, służący do generowania publikacji elektronicznych. Działał jak wirtualna drukarka, podobnie jak konkurencyjne do niego sterowniki PDF i Replica. Envoy został spopularyzowany przede wszystkim przez edytor WordPerfect dla Windows, razem z którym był przez pewien czas dostarczany. Jego rozwój został wstrzymany, a WordPerfect używa formatu PDF.

21

SGML (Standard Generalised Markup

Language)

Pozwala na opis logicznej struktury tekstu, nie

sposobu wyświetlania;

Definicja struktury w DTD (Document Type

Definition)

DTD dla czasopism: ISO 12083 Article DTD,

ISO 12083 Serial DTD;

Tworzenie własnych DTD przez wydawców;

SGML zbyt skomplikowany; przejście do innych

formatów (HTML).

22

SGML

23

SGML – interfejs GUIDON z OCLC

Cechy:

- linki do rys., tabl., równań

- dostęp wg numeru, dat

- wyszukiwanie pełnotekstowe

- automatyczne informacje o

nowych artykułach przez email

lub fax

24

Połączenie HTML i PDF - IDEAL

25

IDEAL

26

IDEAL

27

MUSE – html + pdf

28

XML

Pochodzi z SGML;

Definiuje strukturę dokumentu;

Tworzenie własnych DTD i Schematów

XML:

NewsML – standard dla newsów w agencjach

prasowych,

MathML – równania matematyczne,

ChemML (lub CML)

29

Pliki w XML

30

Pliki w XML

31

NewsML

32

MathML

33

MathML

34

DjVu

Dokumenty elektroniczne o wysokiej kompresji;

Oparta na segmentacji obrazu – rozdział na warstwy i oddzielna kompresja;

Cechy: Bardzo małe pliki;

Doskonała jakość;

Format rastrowy (łatwość przenoszenia między platformami);

Szybkie przeglądanie, powiększanie, przesuwanie obrazu, osadzanie w HTML;

Przeszukiwanie: specjalna warstwa na wersję tekstową.

35

DjVu – rozmiary plików

36

DjVu - warstwy

37

DjVu - obraz

38

DjVu - warstwy

39

Multimedia

40

Multimedia

41

Multimedia – quiz dla lekarzy

42

Inne zastosowania multimediów

43

Multimedia

44

Interactive tables

45

DANE – o artykułach w Excel (PLoS)

46

Graficzne wizualizacje danych

Graficzne wizualizacje danych

• Obracanie obiektów

• Modyfikacja orientacji

• Różne reprezentacje

• Ułatwiają badania

ale jednocześnie...

• Uzależnione od platformy, wymagają plugin’ów lub dodatkowych informacji

48

Multimedia: grafika

49

Multimedia: nagrania dźwiękowe

AR w czasopismach

50

Drukowana gazeta

Obraz gazety na ekranie tabletu

KSIĄŻKI ELEKTRONICZNE

Formaty publikacji elektronicznych

51

Wielość stosowanych, niekompatybilnych

formatów plików:

Formaty opisu strony (PS, PDF, DjVu)

Formaty opisu struktury (HTML, XML, EPUB,

Mobipocket – dwa ostatnie w XHTML+CSS)

Formaty natywne (Amazon AZW)

Formaty otwarte (PDF, EPUB)

Częsty brak kompatybilności i współdziałania.

Obecnie tzw. multiformat: Klient płacąc za tytuł,

otrzymuje go w każdym dostępnym dla niego w

danej chwili formacie.

Formaty plików

52

Formaty plików Czytnik Producent Odtwarzane formaty

Kindle3 Amazon AZW, PDF, TXT, MOBI, PRC

Nook Barnes&Noble EPUB, PDF, PDB, JPG

PRS-600 Sony EPUB, PDF, TXT, RTF, DOC, LRX, LRF

iRiver Story Iriver EPUB, PDF, TXT, DOC, PPT, XLS, HWP

PocketBook 302 PocketBook EPUB, PDF, FB2, TXT, RTF, HTML, PRC,

CHM, DJVU, DOC

Kobo eReader Kobo EPUB, PDF

BeBook Neo Endless ideas EPUB, PDF, TXT, HTML, RTF, MOBI, CHM,

PDB

Alex Reader Spring Design EPUB, PDF, TXT, HTML

Novel Pandigital EPUB, PDF

53

Formaty

plików

Formaty plików

55

Obecnie najczęściej stosowane

ePub Jest to format w którym ostateczny wygląd książki uzależniony jest od

urządzenia oraz indywidualnych preferencji użytkownika. Użytkownik

może decydować o marginesach a także rozmiarze wyświetlanej

czcionki, dzięki zastosowaniu standardu formatowania opartego o

XHTML oraz kaskadowych arkuszy styli CSS.

Mobi Format ten stosowany jest głównie w czytnikach Kindle firmy Amazon.

Format ten daje mniejsze możliwości formatowanie treści niż ePUB,

jego podstawą jest również XHTML i CSS.

PDF Format ten wyróżnia się na tle innych sztywnym podziałem książki na

strony, co niekorzystnie wpływa na mniejsze wyświetlacze gdzie

pojawia się problem skalowania wielkości treści.

56

ePUB

ePUB (electronic publication) to otwarty standard, oparty na

języku XML, służący do publikowania elektronicznych książek,

tworzony przez non-profit IDPF (Intern. Digital Publishing Forum).

Jest to bezpośredni następca rozwijanego wcześniej formatu Open

eBook. Tworzone w nim książki nie mają podziału na strony, choć

istnieje możliwość wyświetlania na marginesie numeru strony

pochodzącego z książki drukowanej. Format ten jest stosowany w

czytnikach książek elektronicznych, smartfonach i tabletach

(potrzebna aplikacja). Format ePUB jest wygodny w użytkowaniu –

można skalować obraz, zmieniać wielkość i rodzaj czcionki,

dostosowując je do swoich wymagań. Tekst wypełnia ekran czytnika

(brak stronicowania), a przy zmianie czcionki zachowuje swoje

właściwości, wysoki kontrast i komfort czytania. Aby móc

odczytywać pliki w formacie ePUB należy pobrać odpowiednie

oprogramowanie np. Adobe Digital Editions. Kindle go nie czyta,

trzeba konwertować, np. przy pomocy Calibre. 57

MOBI

Ogólnie przyjęte określenie formatu pliku tekstowego

odczytywanego m.in. przez program Mobipocket

Reader. Pliki zapisane w zależności od potrzeb

użytkownika i rodzaju czytniku mogą posiadać

rozszerzenie .mobi, .prc (Product Representation

Compact), a także .pdb. Format Mobi zyskuje coraz

większe uznanie i akceptację wraz z rosnącą

popularnością urządzeń mobilnych (Kindle). Plików nie

można drukować. Aplikacje na Windows i Apple, np.

Kindle for PC, Calibre i in.

Format Mobipocket jest zastępowany przez nowy format

KF8 Amazona. Oparty na HTML5 i CSS.

58

PDF

59

PDF jest bardzo popularnym formatem. Istneje wiele programów do

tworzenia PDF od produktów Adobe zaczynając, poprzez MS Word,

kończąc na wirtualnych drukarkach, pozwalających drukować do PDF z

prawie każdej aplikacji.

Głównym problemem z PDF jest brak możliwości dopasowania tekstu do

rozmiarów małych ekranów. Urządzenia do e-booków typu Kindle i Nook, a

także telefony i tablety jak iPhone, iPad oraz Kindle Fire, mają ekrany

mniejsze niż typowy komputer a nawet niż typowa książka. W rezultacie, po

załadowaniu na urządzenie pliku w formacie PDF zazwyczaj trzeba go

dostosować do rozmiarów ekranu. Z tego powodu większość formatów e-

booków, takich jak ePub i Kindle dostosowuje tekst do wielkości ekranu w

locie.

PDF ma opinię formatu trudnego w użytkowaniu. Wiele urządzeń podczas

próby ładowania pliku w tym formacie automatycznie konwertuje go na inny.

Zabezpieczenia

DRM - (z j. ang. digital rights management, Zarządzanie prawami cyfrowymi) –

metoda polegająca na zabezpieczeniu pliku przed możliwością kopiowania i

ograniczająca możliwość odczytania pliku do konkretnych modeli urządzeń. Ze

względu na pewne kontrowersje związane z ograniczeniami użytkowymi (np.

niemożliwość wykonania dopuszczalnej wyłącznie do własnego użytku kopii

bezpieczeństwa pliku), format jest coraz częściej zastępowany o wiele

wygodniejszym watermarkiem. Jednocześnie ze względu na pewien stopień

skomplikowania formatu, zdarzały się błędy, bądź luki w działaniu (które były

upubliczniane przez użytkowników), których łatanie powodowało dalsze ograniczenia.

Watermark (znak wodny) – rozwiązanie o wiele wygodniejsze, ze względu, na to że

w momencie zakupu książki elektronicznej, plik jest „tylko” wysyłany na specjalny

serwer treści, który znakuje go danymi osoby kupującej, umożliwiającymi

identyfikację osoby z konkretnym plikiem. Poza tym format nie ma ograniczeń DRM,

czyli można go skopiować na zasadzie wyłącznej kopii bezpieczeństwa (oczywiście

bez rozprzestrzeniania takiego pliku, bo widać od kogo pochodzi); nie ma również

ograniczeń sprzętowych do odtwarzania pliku z takim zabezpieczeniem. Ma to

zasadniczy aspekt psychologiczny – użytkownik przysłowiowo dwa razy zastanowi

się zanim udostępni e-book np. znajomemu.

60

Mobi, ePub (dostosowujące się)

61

KF8, PDF (stały układ strony)

62

Formaty dostosowujące się

Zalety: Duże możliwości

rozpowszechniania –

akceptowane przez większość

platform i urządzeń.

Użytkownik ma kontrolę nad

sposobem wyświetlania tekstu.

Zwykle mniejszy rozmiar pliku,

więc niższe koszty.

Zwykle tańszy w produkcji.

Łatwiejszy do aktualizacji.

Wady: Umożliwia tylko prosty układ

strony – bez wielu kolumn,

absolutnego pozycjonowania

treści.

Mała kontrola nad bękartami i

wdowami. Czytelnik kontroluje

wielkość tekstu, krój czcionki,

odstępy między wierszami i

marginesy, więc ilość widocznego

tekstu może być różna na

różnych urządzeniach i

ustawieniach.

Ograniczone możliwości

włączania fontów.

63

Stały układ strony

Zalety: Pełna kontrola nad wyglądem

strony, czyli np.:

Układ wielokolumnowy

Pozycjonowanie tekstu

względem ilustracji

Kolorowe tło

Ilustracje całkowicie

wypełniające stronę

Wyświetlanie dwóch stron

Bezproblemowe włączanie

fontów.

Wady: Ograniczone możliwości

dystrybucji.

eBooki nie nadają się na

wszystkie urządzenia lub aplikacje

ze wzgl. na specyficzne style

Duże rozmiary plików, co może

zwiększać opłaty za download.

Problemy z czytelnością na

niektórych urządzeniach ze

względu na rozmiar.

Zwykle droższe w produkcji i

aktualizacji.

64

Albo inaczej:

Formaty opisu strony (Postscript, PDF, djvu)

zawierają pełne informacje o sposobie

wyświetlania treści, układzie i podziale stron.

Decyzja o wyglądzie podczas przygotowania

publikacji

Formaty opisu struktury (HTML, XML, ePub,

MobiPocket) ostateczny wygląd tekstu określany

podczas wyświetlania publikacji. Wygląd może

zależeć np. od parametrów urządzenia,

oprogramowania. Układ może się zmienić np.

wraz ze zmianą czcionki. 65

Książka hybrydowa

66

„Książka wideo”

67 „Pierwsza polska książka wideo”: M. Karnowski, E. Mistkiewicz: Anatomia władzy

Nowinki sprzętowe

68

Znaczniki generujące obiekty w VR

Poezje autorstwa Amaranth Borsuk i

Brada Bourse

iDinosaur, książeczka dla dzieci

69

Książki personalizowane

PMITS – put me in the story:

Sourcebooks

70