Lingwistyka Matematyczna
description
Transcript of Lingwistyka Matematyczna
Lingwistyka Matematyczna
Mgr inż. Michał Jaros
Lingwistyka Matematyczna
wykład 2
Lingwistyka Matematyczna
Agenda
• Lingwistyka Matematyczna
• Gramatyka Chomsky’ego
• Hierarchia Chomsky’ego
• Notacja BNF
• Podsumowanie
• Q&A2008-03-16 Mgr inż. Michał Jaros 2
Lingwistyka Matematyczna
Lingwistyka MatematycznaLingwistyka Matematyczna – dział
językoznawstwa, w którym do badania języków stosuje się metody matematyczne, podzielony na dwa kierunki: syntetyczny i analityczny. Kierunek syntetyczny zajmuje się badaniem różnych typów gramatyk formalnych (związany z informatyką).
2008-03-16 Mgr inż. Michał Jaros 3
Lingwistyka Matematyczna
Lingwistyka Matematyczna
• Tworzenie języków programowania
• Budowa analizatorów
• Budowa translatorów
• Budowa kompilatorów
2008-03-16 Mgr inż. Michał Jaros 4
Lingwistyka Matematyczna
Lingwistyka Matematyczna
2008-03-16 Mgr inż. Michał Jaros 5
Lingwistyka Matematyczna
Lingwistyka Matematyczna
Słownik – zasób wyrazów (słów) danego języka, podstawa każdego języka. W językach formalnych elementy słownika (słowa) nazywamy symbolami (podstawowymi).
Zdanie – ciąg słów zbudowany według określonych reguł.
2008-03-16 Mgr inż. Michał Jaros 6
Lingwistyka Matematyczna
Lingwistyka Matematyczna
Syntaktyka (składnia) – dział gramatyki zajmujący się budową zdań, badaniem zależności między wyrazami w zdaniu. Badanie struktury języka.
Semantyka – dziedzina zajmująca się znaczeniem zdań.
2008-03-16 Mgr inż. Michał Jaros 7
Lingwistyka Matematyczna
Lingwistyka Matematyczna
Język formalny – język złożony ze wszystkich słów (wyrażeń) uzyskiwanych za pomocą ściśle określonych reguł; definiowany zwykle przez gramatykę formalną.
Gramatyka formalna – definicja składni języka. Zbiór reguł lub formuł, które określają zbiór formalnie poprawnych zdań.
2008-03-16 Mgr inż. Michał Jaros 8
Lingwistyka Matematyczna
Gramatyka Chomsky’ego
Noam ChomskyJęzyk jest według Chomsky'ego nieskończonym zbiorem zdań, generowanych za pomocą skończonej liczby reguł i słów.
Bezbarwne zielone idee wściekle śpią.
2008-03-16 Mgr inż. Michał Jaros 9
Lingwistyka Matematyczna
Gramatyka Chomsky’egoMatematyczna definicja języka
Język L = L ( T, N, P, S ) jest definiowany przez:T – słownik symboli końcowych;N – zbiór symboli pomocniczych;P – zbiór produkcji (reguł syntaktycznych);S – głowa języka, symbol początkowy należący
do N;
2008-03-16 Mgr inż. Michał Jaros 10
Lingwistyka Matematyczna
Gramatyka Chomsky’egoJęzyk L ( T, N, P, S ) jest zbiorem ciągów symboli końcowych ξ, które mogą być wyprowadzone z S zgodnie z podaną poniżej regułą
gdzie,ξ oznacza ciąg symboliT* oznacza zbiór wszystkich ciągów symboli z T
2008-03-16 Mgr inż. Michał Jaros 11
** TiS|L
Lingwistyka Matematyczna
Gramatyka Chomsky’egoCiąg n może być wyprowadzony z ciągu 0 wtedy i tylko wtedy, gdy istnieją ciągi 1, 2,…., n-1 takie, że każdy ciąg i może być bezpośrednio wyprowadzony z i-1 zgodnie z podaną poniżej regułą
2008-03-16 Mgr inż. Michał Jaros 12
n,,1idlai1in*
0
Lingwistyka Matematyczna
Gramatyka Chomsky’egoCiąg η może być bezpośrednio wyprowadzony z ξ ciągu wtedy i tylko wtedy gdy istnieją ciągi α, β, ξ’, η’ takie że:
• ξ = α ξ’ β
• η = α η’ β
• P zawiera produkcje ξ’ ::=η’
2008-03-16 Mgr inż. Michał Jaros 13
Lingwistyka Matematyczna
Hierarchia Chomsky’ego
2008-03-16 Mgr inż. Michał Jaros 14
Hierarchia klas języków formalnych.
Typ 0 – Języki rekursywnie przeliczalneTyp 0 – Języki rekursywnie przeliczalne
Typ 1 – Języki kontekstoweTyp 1 – Języki kontekstowe
Typ 2 – Języki bezkontekstoweTyp 2 – Języki bezkontekstowe
Typ 3 – Języki regularneTyp 3 – Języki regularne
Lingwistyka Matematyczna
Hierarchia Chomsky’egoJęzyki rekursywnie przeliczalne – języki
generowane przez wszystkie gramatyki formalne, zawierające produkcje postaci α → β, gdzie α, β dowolne słowa złożone z nieterminali i terminali.
(maszyna Turinga)
2008-03-16 Mgr inż. Michał Jaros 15
Lingwistyka Matematyczna
Hierarchia Chomsky’egoJęzyki kontekstowe – języki generowane przez
gramatyki kontekstowe, zawierające produkcje postaci αAβ → αγβ, gdzie α, β, γ dowolne słowa złożone z nieterminali i terminali, A – nieterminal
S → aBcS → εaAB → abCB
(automat liniowo ograniczony)
2008-03-16 Mgr inż. Michał Jaros 16
Lingwistyka Matematyczna
Hierarchia Chomsky’egoJęzyki bezkontekstowe – języki generowane
gramatyki bezkontekstowe.
S → aBcS → εA → BC
(niedeterministyczny automat ze stosem)
2008-03-16 Mgr inż. Michał Jaros 17
Lingwistyka Matematyczna
Hierarchia Chomsky’egoJęzyki regularne – języki generowane przez
gramatyki regularne. Mogą być generowane przy pomocy wyrażeń regularnych.
S → aBS → εA → a
(automat skończony)
2008-03-16 Mgr inż. Michał Jaros 18
Lingwistyka Matematyczna
Notacja BNF(Backus-Naur Form)
Notacja BNF jest sposobem zapisu reguł gramatyk, produkcji, czyli sposobem opisu języków formalnych.
<zdanie> ::= <podmiot> <orzeczenie><podmiot> ::= kwiaty | gwiazdy<orzeczenie> ::= kwitną | świecą
2008-03-16 Mgr inż. Michał Jaros 19
Lingwistyka Matematyczna
Notacja BNF• Produkcje – reguły poprzez które można
zdefiniować język• Symbol początkowy - <zdanie>• Symbole pomocnicze (nieterminalne):
<zdanie>, <podmiot>, <orzeczenie>• Symbole końcowe (terminalne):
kwiaty, gwiazdy, kwitną, świecą• Metasymbole notacji BNF: <, >, ::=, |
2008-03-16 Mgr inż. Michał Jaros 20
Lingwistyka Matematyczna
Notacja BNFGramatyka
<zdanie> ::= <podmiot> <orzeczenie><podmiot> ::= kwiaty | gwiazdy<orzeczenie> ::= kwitną | świecą
Zdania należące do gramatykikwiaty kwitnągwiazdy świecąkwiaty świecągwiazdy kwitną
2008-03-16 Mgr inż. Michał Jaros 21
Lingwistyka Matematyczna
Notacja BNFUproszczona notacja BNF
S ::= A BA ::= a | bB ::= c | d
Zdania należące do gramatykiacadbcbd
2008-03-16 Mgr inż. Michał Jaros 22
Lingwistyka Matematyczna
Notacja BNF• Symbol początkowy - S
• Symbole pomocnicze (nieterminalne):wielkie litery alfabetu
• Symbole końcowe (terminalne):małe litery alfabetu
2008-03-16 Mgr inż. Michał Jaros 23
Lingwistyka Matematyczna
Podsumowanie
2008-03-16 Mgr inż. Michał Jaros 24
• Lingwistyka Matematyczna
• Gramatyka Chomsky’ego
• Hierarchia Chomsky’ego
• Notacja BNF
Lingwistyka Matematyczna
Q&A
2008-03-16 Mgr inż. Michał Jaros 25
Lingwistyka Matematyczna
KONIEC
2008-03-16 Mgr inż. Michał Jaros 26