Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI...

74
Narzędzia informatyczne w językoznawstwie Perl - Wprowadzenie do XML Marcin Junczys-Dowmunt [email protected] Zaklad Logiki Stosowanej http://www.logic.amu.edu.pl 16. kwietnia 2008 Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 1/22

Transcript of Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI...

Page 1: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Narzędzia informatyczne w językoznawstwiePerl - Wprowadzenie do XML

Marcin [email protected]

Zakład Logiki Stosowanejhttp://www.logic.amu.edu.pl

16. kwietnia 2008

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 1/22

Page 2: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Plan dzisiejszego wykładu

I Definicja XMLI Zalety i wady XMLI Składnia XMLI Krótka powtórka z XHTMLI Walidacja XML, czyli DTDI Przegląd XML-Schema, XPath, XSLI Ogólne standardy XMLI Standardy XML w językoznawstwie - Osobny wykład

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/22

Page 3: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 4: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.

I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 5: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 6: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 7: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 8: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XML - Definicja

I XML (Extensible Markup Language - Rozszerzalny językznaczników) jest uniwersalnym językiem formalnymprzeznaczonym do tworzenia dedykowanych językówznaczników.

I Pozwala użytkownikom na tworzenie własnych elementów.I Umożliwia współdzielenie danych ustrukturyzowanych przezróżne systemy informatyczne

I Wykorzystywany do zapisu dokumentów i do serializacjidanych (zapis złożonych struktur danych w postaci linearnej)

I Czytelny podzbiór języka SGML (Standard GeneralizedMarkup Language)

I Tworzony przez World Wide Web Consortium

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/22

Page 9: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekst

I Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 10: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 11: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 12: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniający

I Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 13: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanie

I Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 14: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardach

I Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 15: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanych

I Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 16: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnień

I Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 17: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Zalety XML

I Format plików XML to zwykły tekstI Korzysta standardowo z Unicode, najczęściej z kodowaniaUTF-8

I Prosta reprezentacja podstawowych struktur danych:rekordów, list i drzew

I Nazwy elementów opisują dane w sposób samowyjaśniającyI Rygorystyczna składnia ułatwia przetwarzanieI Oparty na międzynarodowych standardachI Pozwala na walidację składniową języków dedykowanychI Struktura hierarchiczna jest wystarczająca dla wielu zagadnieńI Niezależny od platformy

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/22

Page 18: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Wady XML

I Składnia XML jest nadmierna dla prostych danych (np. danetablice)

I Nadmierność ma niekorzystny wpływ na wydajność programówpoprzez większe wymagania pamięciowe i obliczeniowe

I Model hierarchiczny jest ograniczony w porównaniu zmodelami grafowymi

I Modelowanie związków typu ”zachodzenie na siebie” węzłówjest trudne

I Rozróżnienie pomiędzy treścią a atrybutami wydaje sięnienaturalne i utrudnia tworzenie struktur danych w XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/22

Page 19: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Wady XML

I Składnia XML jest nadmierna dla prostych danych (np. danetablice)

I Nadmierność ma niekorzystny wpływ na wydajność programówpoprzez większe wymagania pamięciowe i obliczeniowe

I Model hierarchiczny jest ograniczony w porównaniu zmodelami grafowymi

I Modelowanie związków typu ”zachodzenie na siebie” węzłówjest trudne

I Rozróżnienie pomiędzy treścią a atrybutami wydaje sięnienaturalne i utrudnia tworzenie struktur danych w XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/22

Page 20: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Wady XML

I Składnia XML jest nadmierna dla prostych danych (np. danetablice)

I Nadmierność ma niekorzystny wpływ na wydajność programówpoprzez większe wymagania pamięciowe i obliczeniowe

I Model hierarchiczny jest ograniczony w porównaniu zmodelami grafowymi

I Modelowanie związków typu ”zachodzenie na siebie” węzłówjest trudne

I Rozróżnienie pomiędzy treścią a atrybutami wydaje sięnienaturalne i utrudnia tworzenie struktur danych w XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/22

Page 21: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Wady XML

I Składnia XML jest nadmierna dla prostych danych (np. danetablice)

I Nadmierność ma niekorzystny wpływ na wydajność programówpoprzez większe wymagania pamięciowe i obliczeniowe

I Model hierarchiczny jest ograniczony w porównaniu zmodelami grafowymi

I Modelowanie związków typu ”zachodzenie na siebie” węzłówjest trudne

I Rozróżnienie pomiędzy treścią a atrybutami wydaje sięnienaturalne i utrudnia tworzenie struktur danych w XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/22

Page 22: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Wady XML

I Składnia XML jest nadmierna dla prostych danych (np. danetablice)

I Nadmierność ma niekorzystny wpływ na wydajność programówpoprzez większe wymagania pamięciowe i obliczeniowe

I Model hierarchiczny jest ograniczony w porównaniu zmodelami grafowymi

I Modelowanie związków typu ”zachodzenie na siebie” węzłówjest trudne

I Rozróżnienie pomiędzy treścią a atrybutami wydaje sięnienaturalne i utrudnia tworzenie struktur danych w XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/22

Page 23: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHMTL - Powtórka

I XHMTL to eXtensible HyperText Markup Language

I Jest rozwinięciem standardu HTML 4.01I Można powiedzieć, że jest przecięciem HTML 4.01 i XML(oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznegoprzetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np.MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekonieczniez HTML2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/22

Page 24: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHMTL - Powtórka

I XHMTL to eXtensible HyperText Markup LanguageI Jest rozwinięciem standardu HTML 4.01I Można powiedzieć, że jest przecięciem HTML 4.01 i XML(oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznegoprzetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np.MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekonieczniez HTML2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/22

Page 25: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHMTL - Powtórka

I XHMTL to eXtensible HyperText Markup LanguageI Jest rozwinięciem standardu HTML 4.01I Można powiedzieć, że jest przecięciem HTML 4.01 i XML(oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznegoprzetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np.MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekonieczniez HTML2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/22

Page 26: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHMTL - Powtórka

I XHMTL to eXtensible HyperText Markup LanguageI Jest rozwinięciem standardu HTML 4.01I Można powiedzieć, że jest przecięciem HTML 4.01 i XML(oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznegoprzetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np.MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekonieczniez HTML2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/22

Page 27: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

HTML, XHTML i XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 7/22

Page 28: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literamiI Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 29: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literamiI Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 30: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literamiI Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 31: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 32: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literamiI Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 33: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznikzamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst<em>wyróżniony</p></em> - <p>tekst<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literamiI Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)I Niedozwolona minimalizacja elementów (np. zamiast<textarea readonly> - <textareareadonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/22

Page 34: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.<html xmlns="http://www.w3.org/1999/xhtml"xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML,np. <?xml version="1.0" encoding="UTF-8"?>

I Należy zastosować odpowiednią definicję typu dokumentu (np.dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTDXHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/22

Page 35: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.<html xmlns="http://www.w3.org/1999/xhtml"xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML,np. <?xml version="1.0" encoding="UTF-8"?>

I Należy zastosować odpowiednią definicję typu dokumentu (np.dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTDXHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/22

Page 36: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.<html xmlns="http://www.w3.org/1999/xhtml"xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML,np. <?xml version="1.0" encoding="UTF-8"?>

I Należy zastosować odpowiednią definicję typu dokumentu (np.dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTDXHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/22

Page 37: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykład dokumentu XHTML 1.0

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"><html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl"><head><title>Przykład dokumentu zgodnego z XHTML 1.0 Strict</title><link rel="stylesheet" type="text/css" href="style.css" /></head><body><p>To jest przykład.</p></body></html>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 10/22

Page 38: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność dokumentów XML

Każdy dokument XML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność zpodstawowymi regułami składni XML

I Poprawność strukturalną/semantyczna (validity) -zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parserXML, w tym np. przeglądarka Firefox. Jeśli występuje błąd, toparser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.Walidator porównuje dokument z podaną definicją typudokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/22

Page 39: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność dokumentów XML

Każdy dokument XML musi spełniać dwa rodzaje poprawności:I Poprawność składniową (well-formedness) - zgodność zpodstawowymi regułami składni XML

I Poprawność strukturalną/semantyczna (validity) -zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parserXML, w tym np. przeglądarka Firefox. Jeśli występuje błąd, toparser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.Walidator porównuje dokument z podaną definicją typudokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/22

Page 40: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność dokumentów XML

Każdy dokument XML musi spełniać dwa rodzaje poprawności:I Poprawność składniową (well-formedness) - zgodność zpodstawowymi regułami składni XML

I Poprawność strukturalną/semantyczna (validity) -zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parserXML, w tym np. przeglądarka Firefox. Jeśli występuje błąd, toparser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.Walidator porównuje dokument z podaną definicją typudokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/22

Page 41: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność dokumentów XML

Każdy dokument XML musi spełniać dwa rodzaje poprawności:I Poprawność składniową (well-formedness) - zgodność zpodstawowymi regułami składni XML

I Poprawność strukturalną/semantyczna (validity) -zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parserXML, w tym np. przeglądarka Firefox. Jeśli występuje błąd, toparser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.Walidator porównuje dokument z podaną definicją typudokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/22

Page 42: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność dokumentów XML

Każdy dokument XML musi spełniać dwa rodzaje poprawności:I Poprawność składniową (well-formedness) - zgodność zpodstawowymi regułami składni XML

I Poprawność strukturalną/semantyczna (validity) -zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parserXML, w tym np. przeglądarka Firefox. Jeśli występuje błąd, toparser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.Walidator porównuje dokument z podaną definicją typudokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/22

Page 43: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 44: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 45: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 46: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 47: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 48: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżone

I Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 49: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność składniowa XML

Kryteria (te same jak dla XHTML, tylko ogólniejsze):I Istnieje dokładnie jeden element główny (np. <html>...</html>)

I Główny element może by poprzedzony opcjonalną deklaracjąXML <?xml version="1.0" encoding="UTF-8"?>

I Tekst objęty elementem głównym może zawierać dowolnąilość podelementów

I Nazwy podelementów są dowolne (Uwaga: <name> !=<NAME>)

I Każdy element musi zostać zamknięty (za pomocą znacznikazamykającego lub jako element samozamykający)

I Elementy muszą być poprawnie zagnieżdżoneI Wartości atrybutów muszą być objęte cudzysłowem

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/22

Page 50: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykład dokumentu XML (leksykon.xml)

<?xml version="1.0" encoding="UTF-8"?><leksykon><wpis nr="1"><lemat>analiza</lemat><informacje><część_mowy>rzeczownik</część_mowy><rodzaj>żeński</rodzaj><semantyka>process</semantyka>

</informacje><formy><forma p="mian" l="1">analiza</forma><forma p="dop" l="1">analizy</forma><forma p="cel" l="1">analizie</forma>...

</formy></wpis>...</leksykon>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/22

Page 51: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XML

I Spełniają wszystkie założenia dotyczące składni XMLI Najczęściej nazwy elementów i ich własności są ograniczaneI Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 52: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XMLI Spełniają wszystkie założenia dotyczące składni XML

I Najczęściej nazwy elementów i ich własności są ograniczaneI Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 53: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XMLI Spełniają wszystkie założenia dotyczące składni XMLI Najczęściej nazwy elementów i ich własności są ograniczane

I Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 54: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XMLI Spełniają wszystkie założenia dotyczące składni XMLI Najczęściej nazwy elementów i ich własności są ograniczaneI Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 55: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XMLI Spełniają wszystkie założenia dotyczące składni XMLI Najczęściej nazwy elementów i ich własności są ograniczaneI Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .

I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 56: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Języki dedykowane z rodziny XML

I Języki określone z pomocą języka XMLI Spełniają wszystkie założenia dotyczące składni XMLI Najczęściej nazwy elementów i ich własności są ograniczaneI Tzn. mamy ograniczenia semantyczne w porównaniu zpełnym XML

I Przykłady: XHTML, MathML, Open Document, SVG . . .I Np. element <tr>...</tr> nie ma znaczenia poza<table>...</table> w XHTML, składniowo nie byłoby tobłędem.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/22

Page 57: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność semantyczna - Walidacja

I XML nie określa dokładnych reguł składniowychdedykowanych języków z rodziny XML

I Wykorzystuje się w tym celu dokumenty DTD (document typedefinition), XML Schema lub inne języki schematów XML

I Można za ich pomocą określać np. dozwolone nazwyelementów, dozwolone sposoby zawierania się elementów,dozwolone atrybuty oraz typy danych

I Dokument zgodny z określonymi regułami w DTD/schemaciejest poprawny strukturalnie/semantycznie (valid)

I Dzięki DTD/schematom można sprawdzać automatycznie, czydany dokument XML jest zgodny z założeniami językadedykowanego (parser walidujący)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/22

Page 58: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność semantyczna - Walidacja

I XML nie określa dokładnych reguł składniowychdedykowanych języków z rodziny XML

I Wykorzystuje się w tym celu dokumenty DTD (document typedefinition), XML Schema lub inne języki schematów XML

I Można za ich pomocą określać np. dozwolone nazwyelementów, dozwolone sposoby zawierania się elementów,dozwolone atrybuty oraz typy danych

I Dokument zgodny z określonymi regułami w DTD/schemaciejest poprawny strukturalnie/semantycznie (valid)

I Dzięki DTD/schematom można sprawdzać automatycznie, czydany dokument XML jest zgodny z założeniami językadedykowanego (parser walidujący)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/22

Page 59: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność semantyczna - Walidacja

I XML nie określa dokładnych reguł składniowychdedykowanych języków z rodziny XML

I Wykorzystuje się w tym celu dokumenty DTD (document typedefinition), XML Schema lub inne języki schematów XML

I Można za ich pomocą określać np. dozwolone nazwyelementów, dozwolone sposoby zawierania się elementów,dozwolone atrybuty oraz typy danych

I Dokument zgodny z określonymi regułami w DTD/schemaciejest poprawny strukturalnie/semantycznie (valid)

I Dzięki DTD/schematom można sprawdzać automatycznie, czydany dokument XML jest zgodny z założeniami językadedykowanego (parser walidujący)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/22

Page 60: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność semantyczna - Walidacja

I XML nie określa dokładnych reguł składniowychdedykowanych języków z rodziny XML

I Wykorzystuje się w tym celu dokumenty DTD (document typedefinition), XML Schema lub inne języki schematów XML

I Można za ich pomocą określać np. dozwolone nazwyelementów, dozwolone sposoby zawierania się elementów,dozwolone atrybuty oraz typy danych

I Dokument zgodny z określonymi regułami w DTD/schemaciejest poprawny strukturalnie/semantycznie (valid)

I Dzięki DTD/schematom można sprawdzać automatycznie, czydany dokument XML jest zgodny z założeniami językadedykowanego (parser walidujący)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/22

Page 61: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność semantyczna - Walidacja

I XML nie określa dokładnych reguł składniowychdedykowanych języków z rodziny XML

I Wykorzystuje się w tym celu dokumenty DTD (document typedefinition), XML Schema lub inne języki schematów XML

I Można za ich pomocą określać np. dozwolone nazwyelementów, dozwolone sposoby zawierania się elementów,dozwolone atrybuty oraz typy danych

I Dokument zgodny z określonymi regułami w DTD/schemaciejest poprawny strukturalnie/semantycznie (valid)

I Dzięki DTD/schematom można sprawdzać automatycznie, czydany dokument XML jest zgodny z założeniami językadedykowanego (parser walidujący)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/22

Page 62: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność strukturalna - sposoby opisu

I DTD - najstarszy i na razie najczęściej stosowany językschematów. W miarę prosty i tym samym ograniczony. Niejest językiem XML, tylko innym podzbiorem SGML.

I XML Schema - wypiera DTD. Język schematu XML, którysam jest opisany za pomocą XML. Duże możliwości, aleniestety trudny.

I Relax NG - Opisany w XML, prostszy od XML Schema,rzadziej używany

I ISO DSDL - Zbiór mniejszych języków schematów XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/22

Page 63: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność strukturalna - sposoby opisu

I DTD - najstarszy i na razie najczęściej stosowany językschematów. W miarę prosty i tym samym ograniczony. Niejest językiem XML, tylko innym podzbiorem SGML.

I XML Schema - wypiera DTD. Język schematu XML, którysam jest opisany za pomocą XML. Duże możliwości, aleniestety trudny.

I Relax NG - Opisany w XML, prostszy od XML Schema,rzadziej używany

I ISO DSDL - Zbiór mniejszych języków schematów XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/22

Page 64: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność strukturalna - sposoby opisu

I DTD - najstarszy i na razie najczęściej stosowany językschematów. W miarę prosty i tym samym ograniczony. Niejest językiem XML, tylko innym podzbiorem SGML.

I XML Schema - wypiera DTD. Język schematu XML, którysam jest opisany za pomocą XML. Duże możliwości, aleniestety trudny.

I Relax NG - Opisany w XML, prostszy od XML Schema,rzadziej używany

I ISO DSDL - Zbiór mniejszych języków schematów XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/22

Page 65: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Poprawność strukturalna - sposoby opisu

I DTD - najstarszy i na razie najczęściej stosowany językschematów. W miarę prosty i tym samym ograniczony. Niejest językiem XML, tylko innym podzbiorem SGML.

I XML Schema - wypiera DTD. Język schematu XML, którysam jest opisany za pomocą XML. Duże możliwości, aleniestety trudny.

I Relax NG - Opisany w XML, prostszy od XML Schema,rzadziej używany

I ISO DSDL - Zbiór mniejszych języków schematów XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/22

Page 66: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykład dokumentu DTD (leksykon.dtd)

<!ELEMENT leksykon (wpis*)><!ELEMENT wpis (lemat, informacje, formy)><!ATTLIST wpis nr ID #REQUIRED><!ELEMENT lemat (#PCDATA)><!ELEMENT informacje (część_mowy, rodzaj?, semantyka?)><!ELEMENT część_mowy (#PCDATA)><!ELEMENT rodzaj (#PCDATA)><!ELEMENT semantyka (#PCDATA)><!ELEMENT formy (forma+)><!ELEMENT forma (#PCDATA)><!ATTLIST forma p CDATA #IMPLIED l CDATA #IMPLIED>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 17/22

Page 67: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykład dokumentu XML (leksykon.xml) z DTD

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE leksykon SYSTEM "leksykon.dtd"><leksykon><wpis nr="1"><lemat>analiza</lemat><informacje><część_mowy>rzeczownik</część_mowy><rodzaj>żeński</rodzaj><semantyka>process</semantyka>

</informacje><formy><forma p="mian" l="1">analiza</forma><forma p="dop" l="1">analizy</forma><forma p="cel" l="1">analizie</forma>...

</formy></wpis>...</leksykon>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 18/22

Page 68: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykłady formatów XML - MathML

<math><mrow><msup><mfenced><mrow><mi>x</mi><mo>+</mo><mi>y</mi></mrow></mfenced><mn>4</mn></msup></mrow></math>

oraz w zapisie czytelnym ale nie do przetworzenia: (x + y)4

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 19/22

Page 69: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykłady formatów XML - MathML

<math><mrow><msup><mfenced><mrow><mi>x</mi><mo>+</mo><mi>y</mi></mrow></mfenced><mn>4</mn></msup></mrow></math>

oraz w zapisie czytelnym ale nie do przetworzenia: (x + y)4

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 19/22

Page 70: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykłady formatów XML - SVG

<?xml version="1.0"?><!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN""http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">

<svg xmlns="http://www.w3.org/2000/svg" version="1.1"width="467" height="462">

<!-- This is for the red square --><rect x="80" y="60" width="250" height="250" rx="20" fill="red"

stroke="black" stroke-width="2px" /><!-- This is for the blue square --><rect x="140" y="120" width="250" height="250" rx="40" fill="blue"

fill-opacity="0.7" stroke="black" stroke-width="2px" />

</svg>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 20/22

Page 71: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Przykłady formatów XML - SVG (Wynik)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 21/22

Page 72: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Rozszerzanie XML

I XPath - Podjęzyk umożliwiający dostęp do elementówdokumentu XML, porównywalny ze strukturą katalogów nadysku

I XSL (EXtensible Stylesheet Language) - funkcyjny językprogramowania opisujący sposób prezentacji i przekształceńdokumentów zapisanych w XML

I XQuery - Język zapytań do baz danych zapisanych w XMLI . . .

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 22/22

Page 73: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Rozszerzanie XML

I XPath - Podjęzyk umożliwiający dostęp do elementówdokumentu XML, porównywalny ze strukturą katalogów nadysku

I XSL (EXtensible Stylesheet Language) - funkcyjny językprogramowania opisujący sposób prezentacji i przekształceńdokumentów zapisanych w XML

I XQuery - Język zapytań do baz danych zapisanych w XMLI . . .

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 22/22

Page 74: Narzedzia informatyczne w jezykoznawstwie - Perl ...logic.amu.edu.pl/images/3/30/Wykladxml.pdfI Składnia XML I Krótka powtórka z XHTML I Walidacja XML, czyli DTD I Przegląd XML-Schema,

Rozszerzanie XML

I XPath - Podjęzyk umożliwiający dostęp do elementówdokumentu XML, porównywalny ze strukturą katalogów nadysku

I XSL (EXtensible Stylesheet Language) - funkcyjny językprogramowania opisujący sposób prezentacji i przekształceńdokumentów zapisanych w XML

I XQuery - Język zapytań do baz danych zapisanych w XMLI . . .

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 22/22