Lingwistyka Matematyczna

26
ingwistyka Matematyczna gr inż. Michał Jaros Lingwistyka Matematyczna wykład 2

description

Lingwistyka Matematyczna. wykład 2. Agenda. Lingwistyka Matematyczna Gramatyka Chomsky’ego Hierarchia Chomsky’ego Notacja BNF Podsumowanie Q&A. Lingwistyka Matematyczna. - PowerPoint PPT Presentation

Transcript of Lingwistyka Matematyczna

Page 1: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Mgr inż. Michał Jaros

Lingwistyka Matematyczna

wykład 2

Page 2: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Agenda

• Lingwistyka Matematyczna

• Gramatyka Chomsky’ego

• Hierarchia Chomsky’ego

• Notacja BNF

• Podsumowanie

• Q&A2008-03-16 Mgr inż. Michał Jaros 2

Page 3: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka MatematycznaLingwistyka Matematyczna – dział

językoznawstwa, w którym do badania języków stosuje się metody matematyczne, podzielony na dwa kierunki: syntetyczny i analityczny. Kierunek syntetyczny zajmuje się badaniem różnych typów gramatyk formalnych (związany z informatyką).

2008-03-16 Mgr inż. Michał Jaros 3

Page 4: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka Matematyczna

• Tworzenie języków programowania

• Budowa analizatorów

• Budowa translatorów

• Budowa kompilatorów

2008-03-16 Mgr inż. Michał Jaros 4

Page 5: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka Matematyczna

2008-03-16 Mgr inż. Michał Jaros 5

Page 6: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka Matematyczna

Słownik – zasób wyrazów (słów) danego języka, podstawa każdego języka. W językach formalnych elementy słownika (słowa) nazywamy symbolami (podstawowymi).

Zdanie – ciąg słów zbudowany według określonych reguł.

2008-03-16 Mgr inż. Michał Jaros 6

Page 7: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka Matematyczna

Syntaktyka (składnia) – dział gramatyki zajmujący się budową zdań, badaniem zależności między wyrazami w zdaniu. Badanie struktury języka.

Semantyka – dziedzina zajmująca się znaczeniem zdań.

2008-03-16 Mgr inż. Michał Jaros 7

Page 8: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Lingwistyka Matematyczna

Język formalny – język złożony ze wszystkich słów (wyrażeń) uzyskiwanych za pomocą ściśle określonych reguł; definiowany zwykle przez gramatykę formalną.

Gramatyka formalna – definicja składni języka. Zbiór reguł lub formuł, które określają zbiór formalnie poprawnych zdań.

2008-03-16 Mgr inż. Michał Jaros 8

Page 9: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Gramatyka Chomsky’ego

Noam ChomskyJęzyk jest według Chomsky'ego nieskończonym zbiorem zdań, generowanych za pomocą skończonej liczby reguł i słów.

Bezbarwne zielone idee wściekle śpią.

2008-03-16 Mgr inż. Michał Jaros 9

Page 10: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Gramatyka Chomsky’egoMatematyczna definicja języka

Język L = L ( T, N, P, S ) jest definiowany przez:T – słownik symboli końcowych;N – zbiór symboli pomocniczych;P – zbiór produkcji (reguł syntaktycznych);S – głowa języka, symbol początkowy należący

do N;

2008-03-16 Mgr inż. Michał Jaros 10

Page 11: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Gramatyka Chomsky’egoJęzyk L ( T, N, P, S ) jest zbiorem ciągów symboli końcowych ξ, które mogą być wyprowadzone z S zgodnie z podaną poniżej regułą

gdzie,ξ oznacza ciąg symboliT* oznacza zbiór wszystkich ciągów symboli z T

2008-03-16 Mgr inż. Michał Jaros 11

** TiS|L

Page 12: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Gramatyka Chomsky’egoCiąg n może być wyprowadzony z ciągu 0 wtedy i tylko wtedy, gdy istnieją ciągi 1, 2,…., n-1 takie, że każdy ciąg i może być bezpośrednio wyprowadzony z i-1 zgodnie z podaną poniżej regułą

2008-03-16 Mgr inż. Michał Jaros 12

n,,1idlai1in*

0

Page 13: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Gramatyka Chomsky’egoCiąg η może być bezpośrednio wyprowadzony z ξ ciągu wtedy i tylko wtedy gdy istnieją ciągi α, β, ξ’, η’ takie że:

• ξ = α ξ’ β

• η = α η’ β

• P zawiera produkcje ξ’ ::=η’

2008-03-16 Mgr inż. Michał Jaros 13

Page 14: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Hierarchia Chomsky’ego

2008-03-16 Mgr inż. Michał Jaros 14

Hierarchia klas języków formalnych.

Typ 0 – Języki rekursywnie przeliczalneTyp 0 – Języki rekursywnie przeliczalne

Typ 1 – Języki kontekstoweTyp 1 – Języki kontekstowe

Typ 2 – Języki bezkontekstoweTyp 2 – Języki bezkontekstowe

Typ 3 – Języki regularneTyp 3 – Języki regularne

Page 15: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Hierarchia Chomsky’egoJęzyki rekursywnie przeliczalne – języki

generowane przez wszystkie gramatyki formalne, zawierające produkcje postaci α → β, gdzie α, β dowolne słowa złożone z nieterminali i terminali.

(maszyna Turinga)

2008-03-16 Mgr inż. Michał Jaros 15

Page 16: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Hierarchia Chomsky’egoJęzyki kontekstowe – języki generowane przez

gramatyki kontekstowe, zawierające produkcje postaci αAβ → αγβ, gdzie α, β, γ dowolne słowa złożone z nieterminali i terminali, A – nieterminal

S → aBcS → εaAB → abCB

(automat liniowo ograniczony)

2008-03-16 Mgr inż. Michał Jaros 16

Page 17: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Hierarchia Chomsky’egoJęzyki bezkontekstowe – języki generowane

gramatyki bezkontekstowe.

S → aBcS → εA → BC

(niedeterministyczny automat ze stosem)

2008-03-16 Mgr inż. Michał Jaros 17

Page 18: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Hierarchia Chomsky’egoJęzyki regularne – języki generowane przez

gramatyki regularne. Mogą być generowane przy pomocy wyrażeń regularnych.

S → aBS → εA → a

(automat skończony)

2008-03-16 Mgr inż. Michał Jaros 18

Page 19: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Notacja BNF(Backus-Naur Form)

Notacja BNF jest sposobem zapisu reguł gramatyk, produkcji, czyli sposobem opisu języków formalnych.

<zdanie> ::= <podmiot> <orzeczenie><podmiot> ::= kwiaty | gwiazdy<orzeczenie> ::= kwitną | świecą

2008-03-16 Mgr inż. Michał Jaros 19

Page 20: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Notacja BNF• Produkcje – reguły poprzez które można

zdefiniować język• Symbol początkowy - <zdanie>• Symbole pomocnicze (nieterminalne):

<zdanie>, <podmiot>, <orzeczenie>• Symbole końcowe (terminalne):

kwiaty, gwiazdy, kwitną, świecą• Metasymbole notacji BNF: <, >, ::=, |

2008-03-16 Mgr inż. Michał Jaros 20

Page 21: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Notacja BNFGramatyka

<zdanie> ::= <podmiot> <orzeczenie><podmiot> ::= kwiaty | gwiazdy<orzeczenie> ::= kwitną | świecą

Zdania należące do gramatykikwiaty kwitnągwiazdy świecąkwiaty świecągwiazdy kwitną

2008-03-16 Mgr inż. Michał Jaros 21

Page 22: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Notacja BNFUproszczona notacja BNF

S ::= A BA ::= a | bB ::= c | d

Zdania należące do gramatykiacadbcbd

2008-03-16 Mgr inż. Michał Jaros 22

Page 23: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Notacja BNF• Symbol początkowy - S

• Symbole pomocnicze (nieterminalne):wielkie litery alfabetu

• Symbole końcowe (terminalne):małe litery alfabetu

2008-03-16 Mgr inż. Michał Jaros 23

Page 24: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Podsumowanie

2008-03-16 Mgr inż. Michał Jaros 24

• Lingwistyka Matematyczna

• Gramatyka Chomsky’ego

• Hierarchia Chomsky’ego

• Notacja BNF

Page 25: Lingwistyka Matematyczna

Lingwistyka Matematyczna

Q&A

2008-03-16 Mgr inż. Michał Jaros 25

Page 26: Lingwistyka Matematyczna

Lingwistyka Matematyczna

KONIEC

2008-03-16 Mgr inż. Michał Jaros 26