3. Formalny opis języka naturalnego

56
marzec, 2007 1 3. Formalny opis języka 3. Formalny opis języka naturalnego naturalnego Składnia. Gramatyki bezkontekstowe Zapis wymagań i modyfikatorów

description

3. Formalny opis języka naturalnego. Składnia. Gramatyki bezkontekstowe Zapis wymagań i modyfikatorów. Plan wykładu. Definicja składni i analizy składniowej Najważniejsze typy fraz Podstawowe problemy składniowe, m.in. wymagania, modyfikacje uzgodnienia Formalna analiza składniowa - PowerPoint PPT Presentation

Transcript of 3. Formalny opis języka naturalnego

Page 1: 3. Formalny opis języka naturalnego

marzec, 2007 1

3. Formalny opis języka 3. Formalny opis języka naturalnegonaturalnego

Składnia. Gramatyki

bezkontekstowe

Zapis wymagań i modyfikatorów

Page 2: 3. Formalny opis języka naturalnego

marzec, 2007 2

Plan wykładuPlan wykładu Definicja składni i analizy składniowej Najważniejsze typy fraz Podstawowe problemy składniowe, m.in.

– wymagania, modyfikacje– uzgodnienia

Formalna analiza składniowa Gramatyki bezkontekstowe (CFG) Zapis w CFG uzgodnień i wymagań

Page 3: 3. Formalny opis języka naturalnego

marzec, 2007 3

Cechy słów - kategoria składniowaCechy słów - kategoria składniowa Słowa należące do danego języka naturalnego dzielą się na wiele (ok.

kilkunastu) kategorii składniowych. Słowa z tej samej kategorii mogą występować w zdaniach w tym samym miejscu (pomijamy tu sensowność).

Najważniejsze kategorie składniowe to: – czasowniki (śpi, daje, ...) Verbs– rzeczowniki (przypadek, dom, szczęście, ...) Nouns– przymiotniki (wesoły, ...) Adjectives– przysłówki (wesoło, ...) Adverbs– przyimki (na, pod, ...) Prepositions– liczebniki (dwa, sto pięć, ...) Numerals– spójniki podrzędne (który, ponieważ, ...) – spójniki współrzędne (i, lub, oraz, ...) ... Conjunctions

Page 4: 3. Formalny opis języka naturalnego

marzec, 2007 4

SkładniaSkładnia wiedza o sposobie łączenia słów we frazy,

a fraz w zdaniaPotrzeba informacji składniowych:

– analiza i korekta gramatyczna, – analiza pytań do baz danych, – wyszukiwanie informacji, – generowanie wypowiedzi, tłumaczenie.

Istniejące opisy formalne języka polskiego: Szpakowicz, S.: Formalny opis składniowy zdań polskich, UW, 1986Świdziński, M.: Formalna gramatyka języka polskiego, UW, 1992Przepiórkowski, A., A. Kupśc, M. Marciniak, A. Mykowiecka, Formalny opis języka polskiego w formalizmie HPSG, EXIT, 2000.

Page 5: 3. Formalny opis języka naturalnego

marzec, 2007 5

Składniki wyrażeń języka Składniki wyrażeń języka naturalnego - frazynaturalnego - frazy

• Frazy (phrases) to spójne składniowo i semantycznie ciągi słów/fraz (zdania, składające się z fraz, także są frazami).

Frazy zbudowane są na ogół wokół jednego słowa – elementu głównego, określającego cechy frazy widoczne na zewnątrz, (te cechy to na przykład rodzaj i przypadek)

podział fraz w zależności od typu elementu głównego:– rzeczownikowe – przymiotnikowe– przysłówkowe– przyimkowe– czasownikowe– liczebnikowe

Page 6: 3. Formalny opis języka naturalnego

marzec, 2007 6

Frazy rzeczownikowe, NPFrazy rzeczownikowe, NP

dom najstarszy dom w okolicy dom, którego dach pomalowany był na niebiesko największa ulewa od czasu, kiedy jego dziadek, zmuszony

przez rodzinę żony, przeprowadził się do tego miasteczka

koordynacja (frazy rzeczownikowe współrzędnie złożone): kobieta, dziecko i pies ani wznoszenie błagalnych okrzyków ani bicie głową w mur

Page 7: 3. Formalny opis języka naturalnego

marzec, 2007 7

Frazy przyimkowe, PPFrazy przyimkowe, PP

w domu z [szybkim napastnikiem należącym do drużyny przeciwnej] do [punktu, z którego już nie mógł się wycofać ]

koordynacja (frazy przyimkowe współrzędnie złożone):– do smutku i żalu lub do czarnej rozpaczy– w góry lub nad morze

Page 8: 3. Formalny opis języka naturalnego

marzec, 2007 8

Frazy liczebnikowe, NumPFrazy liczebnikowe, NumP

trzynaście dwadzieścia tysięcy czterysta trzy i pół godziny pierwsi dwaj chłopcy

albo pięciu albo tylko dwóch

liczebniki porządkowe (pierwszy, trzysta trzeci ) są zwykle traktowane jako przymiotniki

Page 9: 3. Formalny opis języka naturalnego

marzec, 2007 9

Frazy przymiotnikowe, AdjPFrazy przymiotnikowe, AdjP

biały najbardziej zmęczony z całej drużyny

większy i bielszy niż przed rokiem

koordynacja (frazy przymiotnikowe współrzędnie złożone): zarówno pewny i głęboko przeświadczony o swej racji i w

istocie najbardziej zacięty z nas wszystkich, jak też zaciekle walczący o swoje prawa

Page 10: 3. Formalny opis języka naturalnego

marzec, 2007 10

Frazy przysłówkowe, AdvPFrazy przysłówkowe, AdvP

szybko szybciej niż ktokolwiek mógł przypuszczać

koordynacja (frazy przysłówkowee współrzędnie złożone): ładniej, a także bardziej elegancko wczoraj lub jeszcze

dawniej zarówno niewygodnie, jak też z całą pewnością

Page 11: 3. Formalny opis języka naturalnego

marzec, 2007 11

Frazy czasownikowe, VPFrazy czasownikowe, VP kupił obraz wierzę, że o tym nie zapomnisz wczoraj bez żadnego namawiania przewiózł fotel

samochodem z mieszkania ciotki do pracowni za 200 zł

koordynacja (frazy czasownikowe współrzędnie złożone): kupił używany samochód, naprawił go i sprzedał za

dwukrotnie wyższą cenę

Page 12: 3. Formalny opis języka naturalnego

marzec, 2007 12

Podstawowe problemy składniowePodstawowe problemy składnioweUzgodnienia (~równość cech) podmiot orzeczenie: (rodzaj, liczba, osoba)

– Piotr idzie *idąale:– Piotr i Maria idą. Idzie / idą Piotr i Maria.– Pięciu chłopców przyszło. Dwaj chłopcy przyszli.

rzeczownik przymiotnik: (przypadek, rodzaj, liczba)– białym krukiem (*kruka)

Page 13: 3. Formalny opis języka naturalnego

marzec, 2007 13

Problemy składniowe - wymaganiaProblemy składniowe - wymagania

Wymagania (dopełnienia) czasownika: (typ frazy, przypadek frazy rzeczownikowej)

– szukam miejsca (czego? fraza rzeczownikowa w dopełniaczu),

– chcę spać (co? fraza czasownikowa bezokolicznikowa),

– mówię o pogodzie; mówię, że pada– daję mu cukierki

przyimka: (przypadek)– w domu– na dom /na domu

Page 14: 3. Formalny opis języka naturalnego

marzec, 2007 14

Problemy składniowe, cd.Problemy składniowe, cd.Negacja Jan chciał kupić książkę. Jan nie chciał kupić książki / *książkę.

Jan nikogo nie oszukał. *Jan nikogo oszukał.

Koordynacja (struktury współrzędne) frazy tego samego typu: koń i osioł; mały i zadziorny frazy różnego typu: ufnie i bez strachu frazy „niepełne”: złapał i ze złością odrzucił piłkę

Page 15: 3. Formalny opis języka naturalnego

marzec, 2007 15

Kolejne problemyKolejne problemySzyk (ew. „przesunięcia”)

– Do niego Jan szedł po raz drugi.– I looked up his grade. I looked his grade up.

Zależności odległe– Kogo chciałabyś, aby Piotr zaprosił?– to ten, którego musiałbyś poprosić o zgodę

Nieciągłość fraz– Smutny czekał go koniec.

Elipsy (brak wymaganych słów bądź fraz) – dialogi: Kogo widzisz? - Piotra [widzę].– koordynacja różnego typu składników czy elipsa?

Pittsburgh prowadzi 4:0 ale Detroit [prowadzi] tylko 3:1. – pro-drop (pominięcie zaimkowego podmiotu) (to dość proste do analizy)

[Ja] Zdałam egzamin.

Page 16: 3. Formalny opis języka naturalnego

marzec, 2007 16

SkładniaSkładniawiedza o sposobie łączenia słów we frazy, a fraz w zdania

Analiza składniowa: rozpoznanie fraz i ich powiązań składniowych (zbudowanie rozbioru syntaktycznego)

mała dziewczynka dała bukiet fiołków mamie -> (anal. morf.) -> anal. składniowa

[[mała]mod dziewczynka] podmiot dać

[bukiet [fiołków]mod ] dopełnienie

[mama] dopełnienie

Page 17: 3. Formalny opis języka naturalnego

marzec, 2007 17

Analiza składniowaAnaliza składniowa

rozpoznanie fraz i ich powiązań składniowych pozwala na

ustalenie wartości cech gramatycznych dla generowanego tekstu, a więc rozstrzygnięcie wielu niejednoznaczności morfologicznych np.

dał słonia mamie -> [dać] 3os,cz. przeszły [słoń]dopełniacz lub biernik [mama]celownik

[dać] 3os,cz. przeszły [słoń]biernik [mama]celownik

Page 18: 3. Formalny opis języka naturalnego

marzec, 2007 18

Reprezentacja struktury Reprezentacja struktury syntaktycznej (składniowej)syntaktycznej (składniowej)

Drzewo (w sensie teorii grafów) odzwierciedlających zbudowane według jednej z dwóch strategii:

struktura frazowa (constituency structure)

struktura zależności funkcjonalnych (dependency structure)– zasadnicza relacja: head (governor) - dependent– powiązania (krawędzie) oznaczone nazwami funkcji

syntaktycznych (Sb, Obj, ...)– struktura frazowa odzwierciedlona tylko pośrednio

Page 19: 3. Formalny opis języka naturalnego

marzec, 2007 19

Drzewo struktury frazowejDrzewo struktury frazowej

((DaimlerChrysler’s shares)NP (rose (three eights)NUMP (to 22)PP-NUM )VP )S

Page 20: 3. Formalny opis języka naturalnego

marzec, 2007 20

Drzewo zależnościDrzewo zależności

Daimler Chrysler’s shares rose three eights to 22

Page 21: 3. Formalny opis języka naturalnego

marzec, 2007 21

Formalny opis językaFormalny opis języka

Alfabet - dowolny zbiór symboli (T). Słowo - skończony (także pusty-) ciąg symboli z alfabetu Słownik - zbiór wszystkich słów nad alfabetem T, (T*).

Język L to dowolny podzbiór zbioru słów T*.

Prosty przykład:

Alfabet - {Ala, ma, Asa, As, Amadeusza, kota} Słowa: {Ala Asa ma, kota ma Asa, ma ma ma ....}

Język L1= { Ala ma kota, Ala ma Asa, Ala ma Amadeusza}

Page 22: 3. Formalny opis języka naturalnego

marzec, 2007 22

Gramatyka <V,T,S,P >Gramatyka <V,T,S,P >V- alfabet (skończony zbiór symboli),

T- podzbiór V (symbole terminalne), (V-T symbole nieterminalne)S - element V-T (symbol początkowy wyróżniony nieterminalny), P - zbiór produkcji (reguł), czyli przyporządkowań z V* w V*

słowo w wynika bezpośrednio ze słowa v, jeżeli istnieje reguła gramatyki R, która zastosowana do w przekształca go w v. ( v -> w lub v ->R w)

słowo w wynika pośrednio z v, jeżeli istnieje ciąg reguł gramatyki R1 ... Rn, takich że v ->R1 v1 v1 ->R2 v2 ... vn-1 ->Rn vn, i vn=w ( v -> * w)

Jeżeli pierwsze słowo, od którego zaczniemy przekształcenia jest symbolem początkowym gramatyki (v=S) to ciąg reguł R1, .. Rn nazywamy wywodem w

Język L to dowolny podzbiór zbioru słów T* ( T TT TTT ...) (Język to zbiór generowanych przez gramatykę słów zawierających wyłącznie symbole terminalne.)

Page 23: 3. Formalny opis języka naturalnego

marzec, 2007 23

Prosty przykładProsty przykład

V ={Ala, ma, Asa, As, Amadeusza, kota, S, Nm, Nb, V} T ={Ala, ma, Asa, As, Amadeusza, kota} symbol początkowy - Sprodukcje: S -> Nm V Nb Nm -> Ala V -> ma Nb -> kota | Asa | Amadeusza

Page 24: 3. Formalny opis języka naturalnego

marzec, 2007 24

Analiza na składniki bezpośrednie, 1Analiza na składniki bezpośrednie, 1 Wyróżnienie zdań.

Przyjmiemy dla uproszczenia kryterium ortograficzne - zdanie to ciąg słów rozpoczynający się od wielkiej litery, kończący kropką (.!?) i zawierający jako element centralny formę finitywną czasownika lub składający się z kilku części, posiadających czasownikowy element centralny, np.

– Jan idzie.– Kto to zrobił?– Podaj mi książkę albo się przesuń.– Gdybym chciał, to Piotr musiał by mnie wysłuchać.

Page 25: 3. Formalny opis języka naturalnego

marzec, 2007 25

Analiza na składniki bezpośrednie, 2Analiza na składniki bezpośrednie, 2 Wyróżnienie frazy pomiotu i orzeczenia (to dla polskiego

nie zawsze daje podział na dwie rozłączne spójne frazy, ale przyjmiemy to uproszczenie dla wygody)

Mały brat Zosi podrzuca kolorową piłkę na ścieżce w parku

[Mały brat Zosi] fraza podmiotu (rzeczownikowa)

[podrzuca kolorową piłkę na ścieżce w parku] fraza orzeczenia (czasownikowa)

Page 26: 3. Formalny opis języka naturalnego

marzec, 2007 26

Analiza na składniki bezpośrednie, 3Analiza na składniki bezpośrednie, 3

Podział fraz na frazy składowe

Mały brat Zosi podrzuca kolorową piłkę na ścieżce w parku

[Mały brat Zosi] [podrzuca kolorową piłkę na ścieżce w parku]

[Mały brat] [ Zosi ] [podrzuca] [kolorową piłkę] [na ścieżce w parku]

[Mały] [brat] [kolorową] [piłkę] [na] [ ścieżce w parku]

[ścieżce] [w parku]

[w] [parku]

Page 27: 3. Formalny opis języka naturalnego

marzec, 2007 27

Typy konstrukcji składniowychTypy konstrukcji składniowych Dla niektórych konstrukcji (fraz) możemy wyróżnić element,

który może (w sensie składniowym) zastąpić całą frazę

Mały brat Zosi -> brat fraza rzeczownikowa(bardzo) kolorową piłkę (w kropki) -> piłkę fraza

rzeczownikowabardzo kolorową -> kolorową fraza przymiotnikowa

są też konstrukcje, których żaden element nie może być uznany za ich reprezentanta, np.na dłoni fraza przyimkowa że przyjdzie zdanie ze spójnikiem podrzędnymJaś i Małgosia fraza rzeczownikowa współrzędna

Page 28: 3. Formalny opis języka naturalnego

marzec, 2007 28

Gramatyki bezkontekstowe Gramatyki bezkontekstowe (CFG - Context Free Grammars)(CFG - Context Free Grammars)

Gramatyka CFG to <V, T, S, P>:P - zbiór produkcji A-> , gdzie A NT= V-T, V*

S -> NP VP NP -> Det Nominal Nominal -> Noun VP -> V | V NPDet -> a | myNoun -> flight | friend | morningV -> left | prefers

Zapis składników i ich kolejności Brak informacji o zależnościach funkcyjnych Współczesne teorie opierają się o CFG, ale wykorzystują też dodatkowe

elementy

Page 29: 3. Formalny opis języka naturalnego

marzec, 2007 29

CFG - wywódCFG - wywód

S-> NP VP -> Det Nominal VP -> Det Noun VP-> Det Noun V NP->

-> Det Noun V Det Nominal -> Det Noun V Det Noun Nominal-> -> Det Noun V Det Noun Noun -> my Noun V Det Noun Noun ->* my friend prefers a morning flight

(wybór symbolu do zamiany dowolny, może prowadzić do różnych wywodów)

S -> NP VP NP -> Det NominalNominal -> Noun Nominal | NounVP -> V NPDet -> a | myNoun -> flight | friend | morningV -> prefers

Page 30: 3. Formalny opis języka naturalnego

marzec, 2007 30

S

NP VP

NP

Nominal Nominal Det Noun V Det Noun Nominal Noun my friend prefers a morning flight

Drzewo wywoduDrzewo wywoduS -> NP VP NP -> Det NominalNominal -> Noun Nominal | NounVP -> V NPDet -> a | myNoun -> flight | friend | morningV -> prefers

Page 31: 3. Formalny opis języka naturalnego

marzec, 2007 31

Wielość wywodówWielość wywodów

S S

NP VP NP VP

Noun V NP Noun VP PP

Jan kupił NP PP Jan V NP Prep NP

N Prep NP kupił N na N

Jan kupił dom na wsi. dom na N dom wsi

wsi

S -> NP VP NP -> N | NP PPVP -> V | V NP | VP | PP PP -> Prep NP

Niejednoznaczności składniowe powodują, że jedno zdanie (fraza) może mieć wiele różnych rozbiorów składniowych – wiele drzew wywodu (ich liczba zależy od konkretnej gramatyki)

Page 32: 3. Formalny opis języka naturalnego

marzec, 2007 32

Wielość wywodówWielość wywodówRóżne rozbiory syntaktyczne mogą mieć

• różne znaczenia [Jan] kupił [dom na wsi] (dom jest na wsi)

[Jan] kupił [dom] [na wsi] (kupowanie odbywało się na wsi)• (prawie) takie samo znaczenie

[Jan] ma [starą [książkę [do angielskiego]]][Jan] ma [[starą książkę] [do angielskiego]]

lub niektóre z nich mogą nie mieć żadnego sensownego znaczenia:Jan zobaczył [biuro] [w piątek.]Jan zobaczył [biuro w piątek.] ??

Page 33: 3. Formalny opis języka naturalnego

marzec, 2007 33

Uzgodnienia Uzgodnienia Cechy języków naturalnych, których opis w gramatykach bezkontekstowych jest trudny, a co najmniej uciążliwy, to przykładowo uzgodnienia i wymagania.

Jaki problem powstaje w wyniku zastosowania następujących reguł?S -> NP VP NP -> Det Nominal

Odpowiedź: nadmiarowość gramatyki generującej przykładowo następujące zdania i frazy:*They sleeps. czy *Oni śpi.*this dogs *ten psy.

Page 34: 3. Formalny opis języka naturalnego

marzec, 2007 34

Gramatyki CFG z atrybutami Gramatyki CFG z atrybutami ((features, attributesfeatures, attributes))

Potraktowanie symboli nieterminalnych jako symboli złożonych z przypisanymi własnościami (cechami, atrybutami).

Pozwala to przykładowo na ograniczenie stosowania reguły:

S -> NP VP tylko do sytuacji, gdy liczba, rodzaj i osoba frazy rzeczownikowej NP i czasownikowej VP są takie same (czyli reprezentację uzgodnień podmiot-orzeczenie)

S -> NP(case-nom,Gender,Nb,Person) VP (Gender,Nb,Person)

NP(Case,Gender,Number) -> Noun(Case,Gender,Number)

Page 35: 3. Formalny opis języka naturalnego

marzec, 2007 35

Uzgodnienia Uzgodnienia rzeczownik-przymiotnikrzeczownik-przymiotnik

Rzeczownik i modyfikujący go przymiotnik muszą mieć taką samą liczbę, przypadek i rodzaj:

NP(case-nom,Gender,Nb,Person) -> AdjP(Case, Gender,Nb) NP(Case,Gender,Nb,Person)

NP(Case,Gender,Number, Person) -> Noun(Case,Gender,Number, Person)

małego psa, ostatni film …

Page 36: 3. Formalny opis języka naturalnego

marzec, 2007 36

Elementy wymagane (dopełnienia) Elementy wymagane (dopełnienia) Niektóre słowa wymagają, by w skład tworzonej przez nie frazy wchodziła fraza (słowo) o ściśle określonych cechach morfo-syntaktycznych (morfologicznych lub syntaktycznych):

– przyimek wymaga, by następowała po nim fraza rzeczownikowa w określonym przypadku (przypadkach), np. przyimek ‘na’ wymaga frazy rzeczownikowej w bierniku lub miejscowniku*na (brak frazy wymaganej)* na morzem (fraza rzeczownikowa w celowniku)

*na wysoko (fraza przysłówkowa) na głębokim morzu (fraza rzeczownikowa w miejscowniku) na spokojne morze (fraza rzeczownikowa w miejscowniku)* oznacza wypowiedzenia niepoprawne

Page 37: 3. Formalny opis języka naturalnego

marzec, 2007 37

Elementy wymagane (dopełnienia), 2Elementy wymagane (dopełnienia), 2

Czasowniki określają frazy, które są niezbędne do utworzenia poprawnego wyrażenia, przy czym ten sam czasownik może dopuszczać różne zestawy dopełnień), np. czasownik powiedzieć może łączyć się z frazą rzeczownikową w bierniku, ze zdaniem podrzędnym rozpoczynającym się od że, lub z dowolnym wypowiedzeniem stanowiącym cytat:

*Ewa powiedziała (brak frazy wymaganej)*Ewa powiedziała na morzem (fraza przyimkowa)*Ewa powiedziała ładny (fraza przyimkowa) Ewa powiedziała wiersz (fraza rzeczownikowa w bierniku) Ewa powiedziała, że przyjdzie. (zdanie „że”) Ewa powiedziała „Dość!” (cytat – forma dowolna)

* oznacza wypowiedzenia niepoprawne

Page 38: 3. Formalny opis języka naturalnego

marzec, 2007 38

Elementy opcjonalne (modyfikatory)Elementy opcjonalne (modyfikatory)

Frazy można (teoretycznie) dowolnie rozszerzać o elementy opcjonalne, przy czym typ tych elementów zależy od typu frazy:

– frazy rzeczownikowe mogą być modyfikowane frazami przymiotnikowymi:

mały biały pies gładki szeroki skórzany pas

– frazy czasownikowe i przymiotnikowe mogą być modyfikowane frazami przysłówkowymi:

spał niespokojnie latał niebezpiecznie wysoko przeraźliwie głośno bardzo mało zabawny

(nie rozważamy tu ograniczeń semantycznych)

Page 39: 3. Formalny opis języka naturalnego

marzec, 2007 39

Elementy opcjonalne (modyfikatory) 2Elementy opcjonalne (modyfikatory) 2frazy rzeczownikowe i czasownikowe mogą być

modyfikowane frazami przyimkowymi: bułka z masłem czytał z uwagą pojechał w piątek, po porannym spotkaniu, przed obiadem sukienka ze sztruksu w niebieskie pasy z krótkimi

rękawkami z białymi mankietami

frazy rzeczownikowe mogą być modyfikowane zdaniami względnymi:

człowiek, który wie wszystko to, co zostało po wczorajszym przyjęciu

Page 40: 3. Formalny opis języka naturalnego

marzec, 2007 40

CFG - wymaganiaCFG - wymagania Jaki problem powstaje w wyniku stosowania następujących

reguł? VP -> V VP -> V NP PP -> Prep NP

Odpowiedź – nadmiarowość, czyli tworzenie rozbiorów konstrukcji niepopoprawnych:

*He took. *He slept the cat. *On spał kota.*She disappeared the elephant. *na stołem *w worka

Page 41: 3. Formalny opis języka naturalnego

marzec, 2007 41

CFG z atrybutami, zapis wymagańCFG z atrybutami, zapis wymagańprzyimki

– łączą się tylko z frazami rzeczownikowymi (nie musimy więc traktować typu frazy jak atrybutu),

– narzucając im przypadek (który powinien być zatem atrybutem dla przyimka)

frazy przyimkowe są wymagane przez czasowniki i wtedy musimy znać zarówno przypadek jak i sam przyimek (np. prosić o coś, czyli przyimek ‘o’ i fraza w bierniku `o’+NPacc,

ale nie prosić o czymś (‘o’ + NPloc) *prosić o bajce

ani nie prosić z co (‘z’+NPacc) *prosić z bajkę czyli prep (form, case), np. prep(‘o’, acc) -> ‘o’

Page 42: 3. Formalny opis języka naturalnego

marzec, 2007 42

CFG z atrybutami, zapis wymagańCFG z atrybutami, zapis wymagań

Przyimek z może łączyć się z frazami rzeczownikowymi w dopełniaczu lub narzędniku:

PP (Form, Case) -> Prep (Form, Case) NP (Case,Gender, Number,Person)

Prep (z, gen) -> z (gen czyli genetive czyli dopełniacz) Prep (z, ins) -> z (ins czyli instrumental czyli narzędnik)

z domu, z domem, z moim domem ...

* Wartości argumentów pisane od wielkiej litery – zmienne, zaczynające się od małej litery - stałe

Page 43: 3. Formalny opis języka naturalnego

marzec, 2007 43

CFG z atrybutami, zapis wymagań, ICFG z atrybutami, zapis wymagań, I Wprowadzenie podziału na klasy, w zależności od typu i liczby

wymagań: 1) czasowniki bez wymagań (tylko podmiot), np. iść, biec, stać VP(Gender,Num,Person,Tense) -> V1(Gender, Num,Person,Tense)V1(masc, sg,3rd,past) -> szedł

2) czasowniki z wymaganiem frazy rzeczownikowej w bierniku, np. widzieć

VP(Gender,Num,Person,Tense) -> V2(Gender, Num,Person,Tense) NP(acc,Gender,Numb,Person)

V2(fem, sg,3rd,past) -> widziała

itd.

Page 44: 3. Formalny opis języka naturalnego

marzec, 2007 44

CFG z atrybutami, zapis wymagań IICFG z atrybutami, zapis wymagań II Nie dzielimy czasowników na klasy, ale zapisujemy odpowiednie

informacje w słowniku (leksykalizacja gramatyki) ustalamy maksymalną liczbę wymagań (3-4), tu przyjmiemy 3 ustalamy symbol dla pustego wymagania (null)

VP (Gend,Num,Pers,tense) -> V (Gend, Num,Pers,Tense,W1,W2,W3)

Arg (W1) Arg (W2) Arg (W3){Arg - argument - dopełnienie/wymaganie}

Arg(null) -> V(masc, sg,3rd,past, null, null, null) -> szedłArg(np-acc) -> NP(acc,Gend, Numb,Pers)V(fem, sg,3rd,past, np-acc, null, null) -> widziała

Page 45: 3. Formalny opis języka naturalnego

marzec, 2007 45

zapis wymagań II, cdzapis wymagań II, cd Aby wprowadzić nowy typ wymagań należy:

1. wprowadzić nazwę wymagania (wx) i użyć jej w definicji odpowiedniego czasownika

2. dopisać regule definiującą, co rozumiemy przez dane wymaganie, czyli regułę Arg(wx) -> ….

Wymagnie będące frazą rzeczownikową w celowniku 1) Nazwa wymagania: np-dat

użycie dla czasownika dać (dać kogo/co? komu/czemu?) V(fem, pl, 3, past, np-acc, np-dat, null) -> dały

2) Arg(np-dat) -> NP(dat, Gend, Num,Pers,)

Page 46: 3. Formalny opis języka naturalnego

marzec, 2007 46

zapis wymagań II, cdzapis wymagań II, cd Aby dopuścić swobodny szyk definiujemy dodatkowe reguły:

a) VP(Gend,Num,Pers,Tense) -> V(gend, Num,Pers,Tense,W1,W2,W3) Arg(W2) Arg(W1)Arg(W3)

b) VP(Gend,Num,Pers,Tense) -> Arg(W1) V(Gend, Num,Pers,Tense,W1,W2,W3) Arg(W2) Arg(W3) ...

JeśliV(masc, sg,3rd,past, np-acc, np-instr, null) -> wbił to reguła a) pozwala na analizę frazy: wbił młotkiem gwóźdź a reguła b) gwóźdź wbił młotkiem

Page 47: 3. Formalny opis języka naturalnego

marzec, 2007 47

zapis wymagań II, cd.zapis wymagań II, cd. Dla dopuszczenia podmiotu przeplecionego z dopełnieniami traktujemy podmiot także

jako wymaganie (argument), które zapisujemy na pierwszej pozycji (tu jako np-nom3fsg, bo wtedy trzeba też pamiętać o uzgodnieniu podmiotu i orzeczenia)

VP(Gend,Num,Pers,Tense) -> V(Gend, Num,Pers,Tense,W1,W2,W3)

Comp(W1) Comp(W2) Comp(W3)

Comp(null) -> V(masc, sg,3rd,past, np-nom3msg, null, null) -> szedłComp(np-nom) -> NP(nom, Gend, Numb, Pers)Comp(np-acc) -> NP(acc, Gend, Numb, Pers)V(fem, sg,3rd,past, np-nom3fsg, np-acc, null) -> widziała

Page 48: 3. Formalny opis języka naturalnego

marzec, 2007 48

Elementy opcjonalne (modyfikatory)Elementy opcjonalne (modyfikatory) Frazy można rozszerzać o elementy opcjonalne, przy czym typ tych elementów zależy od typu frazy:

– frazy rzeczownikowe mogą być modyfikowane frazami przymiotnikowymi:

mały biały pies gładki szeroki skórzany pas

– frazy czasownikowe i przymiotnikowe mogą być modyfikowane frazami przysłówkowymi:

spał niespokojnie latał niebezpiecznie wysoko przeraźliwie głośno bardzo mało zabawny

Page 49: 3. Formalny opis języka naturalnego

marzec, 2007 49

Opis frazy przymiotnikowej Opis frazy przymiotnikowej

AdjP -> Adj białyAdjP -> Adj AdjP biały mały wesołyAdjP -> AdvP AdjP bardzo biały AdvP -> Adv | Adv AdvPAdjP -> Adj PPPP -> Prep NP biały z połyskiemAdjP -> AdjP Conj AdjP biały i ciemno niebieskiAdjP -> AdjP Coma AdjP biały, zielony i

brązowyConj -> i | lubComa -> ,

Page 50: 3. Formalny opis języka naturalnego

marzec, 2007 50

Opis frazy przymiotnikowej Opis frazy przymiotnikowej

AdjP (C, G, N) -> Adj (C, G, N) białyAdjP (C, G, N) -> Adj (C, G, N) AdjP (C, G, N) AdjP (C, G, N) -> AdvP AdjP (C, G, N) bardzo biały AdvP -> Adv | Adv AdvPAdjP (C, G, N) -> Adj (C, G, N) PP (F,C1) biały z połyskiemAdjP (C, G,N) -> AdjP (C, G, N) Conj AdjP (C, G, N)AdjP(C,G,N) -> AdjP (C, G, N) Coma AdjP (C,G,N)

biały i ciemno niebieski, biały, zielony i brązowy

Conj -> i | lubComa -> ,

Page 51: 3. Formalny opis języka naturalnego

marzec, 2007 51

Zapis modyfikacjiZapis modyfikacji Fraza rzeczownikowa modyfikowana frazą przymiotnikową

NP (C, G, N, P) -> AdjP (C,G, N) NP (C,G,N,P) NP (C, G, N, P) -> NP (C,G,N,P) AdjP (C,G, N)

Problem: wiele (niepotrzebnych) rozbiorów mały piec kaflowy: [mały piec] kaflowy

mały [piec kaflowy]Możliwe rozwiązanie: ustalenie kolejności dołączania

modyfikatorów np. od prawej

Page 52: 3. Formalny opis języka naturalnego

marzec, 2007 52

Elementy opcjonalne (modyfikatory) 2Elementy opcjonalne (modyfikatory) 2

frazy rzeczownikowe i czasownikowe mogą być modyfikowane frazami przyimkowymi:

bułka z masłem czytał z uwagą pojechał w piątek, po porannym spotkaniu, przed

obiadem sukienka ze sztruksu w niebieskie pasy z krótkimi

rękawkami z białymi mankietami

frazy rzeczownikowe mogą być modyfikowane zdaniami względnymi:

człowiek, który wie wszystko to, co zostało po wczorajszym przyjęciu

Page 53: 3. Formalny opis języka naturalnego

marzec, 2007 53

Konstrukcje współrzędneKonstrukcje współrzędne Wszystkie typy konstrukcji można łączyć spójnikami tworząc

konstrukcje współrzędne (czasem można łączyć też konstrukcje różnych typów)

– idzie i śpiewa – goło i wesoło– do tańca i do różańca– po południu i wieczorem

Page 54: 3. Formalny opis języka naturalnego

marzec, 2007 54

Zapis modyfikacjiZapis modyfikacji Fraza rzeczownikowa modyfikowana frazą przyimkową

NP (C, G, N, P) -> NP (C,G,N,P) PP (Form, C1)

Fraza czasownikowa modyfikowana frazą przyimkową

VP ( G, N, P, W1, W2, W3) -> VP ( G, N, P, W1, W2, W3) PP (Form, C1)

Page 55: 3. Formalny opis języka naturalnego

marzec, 2007 55

Analiza składniowa, Analiza składniowa, podział na wymagania i modyfikacjepodział na wymagania i modyfikacje

Dwa typy fraz: wymagania składniowe (mogą być opisane w słownikach) i modyfikatory, które są praktycznie dowolne– Jan widzi papugę. Jan widzi *papugą/ *o papudze– Jan widzi czarnego kota, który śpi na kanapie.

Jednak wprowadzenie modyfikatory odpowieda za wielość rozbiorów składniowych, gdyż mogą przyłączane do różnych fraz (a na tym poziomie nie mamy interpretacji semantycznej) np.

Kot Bonifacego pije [mleko] [z wielką chęcią]. Bonifacy pije [ mleko [z miodem]].

Page 56: 3. Formalny opis języka naturalnego

marzec, 2007 56

Dziękuję za uwagę.