NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

34
NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: [email protected] Konsultacje: śr 14.00-15.00, pok. 1 śr 14.00-15.00, pok. 1 Adres internetowy: www.mswidz.republika.pl

description

NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008. Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e- mail : m .r. swidz inski @ uw. edu.pl Konsultacje: śr 14.00-15.00, pok. 1 Adres internetowy: www.mswidz.republika.pl. - PowerPoint PPT Presentation

Transcript of NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Page 1: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

NOWA DEFINICJA FORMALNAPOLSKIEJ FRAZY NOMINALNEJ

IPIPAN * 21.01.2008

Prof. dr hab. Marek ŚwidzińskiZakład Językoznawstwa Komputerowego

Instytut Języka Polskiego UWe-mail: [email protected] Konsultacje: śr 14.00-15.00, pok. 1śr 14.00-15.00, pok. 1

Adres internetowy:www.mswidz.republika.pl

Page 2: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Program

• Cel• Motywacja• (Pre)historia• Dziury i błędy w opisie fno• fno: co to jest?• Format i parametry• Przykładowe reguły• Rozwiązanie I: jałowa rekursja• Rozwiązanie II: realizacje atrybutywne• Rozwiązanie III: opis przecinka• Luźne końce…

–2

Page 3: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Cel

• Prezentacja projektu przebudowy GFJP.• „Łóżko testowe”: opis jednej jednostki składniowej.• Pokaz gotowych rozwiązań kilku problemów

teoretycznych i praktycznych.

–3

Page 4: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Motywacja

• GFJP była / jest testowana ( Świgra).• GFJP musi być poprawiona / rozbudowana (?).

• Dlaczego nie napisać GFJP lepiej?

• Zacząć od jakiejś jednostki składnikowej.• fno:

fraza (jednostka prostsza niż zdaniowa);nominalna (jednostka ważna, częsta w tekstach,

strukturalnie bogata); jednostka „oddolna”.

–4

Page 5: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

(Pre)historia (1)

• Szpakowicz, S., Świdziński, M.: Formalna definicja równorzędnej grupy nominalnej we współczesnej polszczyźnie pisanej. Warszawa 1981. 74. Maszynopis powielony. Również w: Studia gramatyczne t. IX, Wrocław 1990. 9-54.

• Świdziński, M.: Gramatyka formalna języka polskiego, Warszawa 1992.

• Świdziński, M., Derwojedowa , M., Rudolf, M.: „A computational account of multi-word numeral phrases in Polish”. Linguistik International Band 10. Investigations into Formal Slavic Linguistics. Contributions of the FDSL IV. Frankfurt am Main i in. 2003. 405-415.

–5

Page 6: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

(Pre)historia (2)

• Świdziński, M., Derwojedowa , M., Rudolf, M.: „Two formal approaches to Polish numeral phrases implemented”. Studia z gramatyki i leksykologii języka polskiego. Red. M. Gębka-Wolak, I. Kaproń-Charzyńska, M. Urban. Toruń 2003. 93-108.

• Woliński, M.: Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska. IPI PAN: Warszawa 2005.

• Świdziński, M.: „A DCG account of Polish relative constructions”. [W:] Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 3rd L&T Conference, October 5-7, 2007, Poznań, Poland. Poznań 2007. 478-482.

–6

Page 7: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

(Pre)historia (3)

• Świdziński, M., Woliński, M.: „Towards a new version of the formal grammar of Polish: the NP redefined”. [W:] Formal Description of Slavic Languages FDSL-7. University of Leipzig, 30 November – 2 December, 2007. Book of Abstracts, Leipzig 2007. 101-103.

–7

Page 8: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (1)

• Brak definicji fraz z koordynacją.• Brak definicji fraz z liczebnikiem.• Brak definicji fraz liczebnikowych.• ………….

–8

Page 9: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (2)

Są to także błędy ogólne!!!

1. Mechanizm jałowej rekursji.2. Realizacja przymiotnikowa fno.3. Opis przecinka.

–9

Page 10: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (3)

1. Jałowa rekursja

• Hierarchia kanoniczna:

– Fraza nominalna (FNO)– Konstrukcja nominalna z dopełniaczem (KNODOP)– Konstrukcja nominalna z frazą przyimkową (KNOPM)– Konstrukcja nominalna z atrybutem (KNOATR)– Konstrukcja nominalna z inkorporacją (KNOINK)– Konstrukcja nominalna (KNOM)

–10

Page 11: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (4)

- FNO = KNODOP FZD- KNODOP = KNOPM FNO- ……………..- KNOM = FNO

• KNOM (p, rl, o, neg, z, kl)= FNO (p, rl, o, neg, NI, z, kl). (NO48)

–11

Page 12: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (5)

2. Realizacja przymiotnikowa fno

- FNO = KNODOP FZD- KNODOP = KNOPM FNO- ……………..- KNOATR = FPT- ……………..

KNOATR (p, rl, 3, neg, i, z, kl)

= FPT (p, rl, st, neg, i, z, kl). (NO38)

–12

Page 13: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziury i błędy w opisie fno (6)

3. Opis przecinka

• Przecinek jako jednostka składniowa – duży problem ogólny:

- wielofunkcyjność słowa ,- wielomotywacyjność wystąpień przecinka

ortograficznego- opcjonalność w pewnych kontekstach

• W GFJP – przecinek pusty międzyspójnikowy:

% Wiem, że jeśli przyjdą, umrę.% * Wiem, że, jeśli przyjdą, umrę.

–13

Page 14: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

fno: co to jest? (1)

• Występuje jako realizacja lub składnik:– frazy wymaganej,– frazy luźnej,– frazy przyimkowo-nominalnej,– frazy nominalnej (w szczególności skoordynowanej),– frazy przymiotnikowej.

–14

Page 15: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

fno: co to jest? (2)

• Ma różne struktury:– współrzędną– podrzędną– egzocentryczną

• Ma różne centra:– rzeczownikowe– liczebnikowe– zaimkowe różnych typów– przymiotnikowe (?)– gerundialne (?)

–15

Page 16: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

fno: co to jest? (3)

• Ma bogaty zestaw cech gramatycznych:– przypadek– rodzaj– liczba– osoba– klasa (centrum)

……..

• Gęsta sieć uzgodnień wewnętrznych i zewnętrznych

–16

Page 17: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Format i parametry (1)

fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz])

fnokoor(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz, Sp])

–17

Page 18: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Format i parametry (2)

• P przypadek• R/L rodzaj i liczba• O osoba• Neg negacja• I inkorporacja: bowiem, natomiast, więc, zaś,

ni, bp; R/L• Pnw pytajno-niepytajność: npyt, pyt, pz, wz• Kl klasa: rzecz, os, co, kto, który, jaki, nuzg, uzg• Tak taktylowatość: tk, tyle• Sub nad-podrzędność: na, po• Pk przecinkowość końcowa: bp, stan• Poz pozycja: pre, post, egz• Sp oznaczenie spójnika

–18

Page 19: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Format i parametry (3)

• Porządek zapisu reguł:

Pnw dowolnePnw = pytPnw = npytPnw = wzPnw = pz

–19

Page 20: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Przykładowe reguły (1)

fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),

fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).

% Chłopiec, którego znam, [umarł.]% Chłopiec, którego znam [, który umarł, nie przyjdzie.]

–20

Page 21: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Przykładowe reguły (2)

fno(mian, nij/poj, 3, Neg, I, pyt, licz, Tak, Sub, Pk) --> s(no#),

fpt(mian, R/L, St, Neg1, I1, Pnw1, Kl1, Tak1, po, Pk1), { oblink(I, I1, I2), oblink(I, I2, I3), oblnegf(Neg, Neg1, Neg2) },flicz(mian, R/L, O, Neg2, I2, Pnw2, nuzg, Tak2, na, Pk2), fno(dop, R/L, O, Neg3, I3, Pnw3, Kl3, Tak3, po, Pk),{ rozne(R, mos), rowne(pyt, Pnw1.Pnw2), rowne(Pnw1, npyt.pyt), rowne(Pnw2, npyt.pyt), rowne(Pnw3, npyt.pyt), obltak(Tak, Tak1, Tak2), rozne(Kl3, licz), obltak(Tak, Tak2, Tak3) }.

% Które pięć facetek [było zaproszonych?]

% Te pięć z której klasy facetek [przyszło?]–21

Page 22: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie I: jałowa rekursja

fno przec spoj fnofno spoj fnospoj fno przec spoj fno

fnokoor

fno fzd <flicz fno><fno fno(dop,...)><fno fpm><fno fpt>fno(...,I,...) spoj(Tsp, I, ni)

fno bez podrzędnika [różne realizacje]:

formarzecz, zaimpyt, zaimwzg, zaimos,...–22

Page 23: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie II: realizacje atrybutywne (1)

• Nie ma takiej realizacji ogólnej!!!• Zamiast niej – wyliczanka realizacyj szczegółowych:

Pnw dowolne:

Przymiotnik

fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),

fpt(P, R/L, St, Neg, I, Pnw, Kl, Tak, na, Pk),{ rowne(St, wyz.naj) }.

 % Nowszą od czego [czytano?]% Najnowszej [nie czytano.]

–23

Page 24: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie II: realizacje atrybutywne (2)

Liczebnik porządkowy fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),

flicz_porz(P, R/L, Neg, I, Pnw, Kl, Tak, na, Pk). % Drugiego [widziałem.]

–24

Page 25: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie II: realizacje atrybutywne (3)

Zaimek przymiotny

 fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),

fno_zaim_przym(P, R/L, Neg, I, Pnw, Kl, Tak, Sub, Pk).  % Każdą [lubiłem.]% [Nie znam] żadnej [.]

Jest osobna definicja fno_zaim_przym

–25

Page 26: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie II: realizacje atrybutywne (4)

Pnw = wz

fno(P, R/L, 3, Neg, I, wz, Kl, Tak, Sub, Pk) --> s(no#),

przyimek(Forma, dop),{ rowne(Forma, z.spośród) },fno(dop, R/mno, O, Neg1, I1, wz, Kl1, Tak1, po, Pk1), { oblnegf(Neg, Neg1, Neg2), oblink(I, I1, I2), obltak(Tak, Tak1, Tak2) }, fno_zaim_przym(P, R/L, Neg2, I2, Pnw2, Kl2, Tak2, na, Pk).

 

% [Książek, ] z których żadnej [nie znam, nie czytano.]

–26

Page 27: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie III: opis przecinka (1)

• Problem:

% Chłopiec, którego znam, umarł.% * Chłopiec, którego znam umarł.% Umarł chłopiec, którego znam.% * Umarł chłopiec, którego znam,.% Chłopiec, którego znam, który umarł, nie przyjdzie.% Chłopiec, którego znam,, który umarł, nie przyjdzie.

–27

Page 28: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie III: opis przecinka (2)

fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),

fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).

Jednostki zawierające przec lub spoj(przec,…)

• zdanie (koordynacja!!!)• fw• fl• fno• fpt• fzd

–28

Page 29: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie III: opis przecinka (3)

• W regułach definiujących te jednostki składnik przedprzecinkowy / przedspójnikowo-przecinkowy X dostaje wartość bpk.

• W regule definiującej wypowiedzenie jednostka zdanie ma wartość bpk.

• Wewnątrz X wartość ta spada na składnik końcowy.

• Dla X = fzd są dwie realizacje:- stan – z przec na końcu- bpk – bez przec na końcu

• Dla X będącego frazą bez przecinka każda realizacja jest stan.

–29

Page 30: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie III: opis przecinka (4)

% Chłopiec, którego znam [Pk = stan], umarł. % * Chłopiec, którego znam umarł.% Umarł chłopiec, którego znam [Pk = bpk].% * Umarł chłopiec, którego znam,.% Chłopiec, którego znam [Pk = bpk], który umarł, nie

przyjdzie.% Chłopiec, którego znam,, który umarł, nie przyjdzie.

–30

Page 31: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Rozwiązanie III: opis przecinka (5)

• Problem przecinka początkowego: rozwiązany przez parametr I (?).

% Kto pyta, nie błądzi.% * , Kto pyta, nie błądzi.

• Pozostaje problem opisu braku przecinka wewnątrz fzd o pierwszym składniku będącym fzd:

% Wiem, że kto pyta, nie błądzi.% * Wiem, że, kto pyta, nie błądzi.

–31

Page 32: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Luźne końce… (1)

• Definicja frazy liczebnikowej (banał…).• Porządna definicja fno z koordynacją.• Opis fno egzocentrycznej:

% Chłopiec i dziewczyna [przyszli.] egz% My i dziewczyna [przyszliśmy.] egz% [Przyszli] chłopiec i dziewczyna [.] egz% [Przyszliście] chłopiec i wy [.] egz % [Przyszedł] chłopiec i dziewczyna [.] post% [Przyszedł] chłopiec i ktoś jeszcze [.] post% [Przyszedł] chłopiec i dwie dziewczyny [.] post% [Przyszedł] chłopiec i pięć dziewczyn [.] post 

–32

Page 33: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Luźne końce… (2)

% Chłopiec i ktoś jeszcze [przyszedł.] pre% Chłopiec i dwie dziewczyny [przyszły.] pre % Chłopiec i pięć dziewczyn [przyszło.] pre

Ale także:

% naszych Jasia i Marysi % kochane Joasiu i dziewczyny% tymi filozofią i matematyką

–33

Page 34: NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008

Dziękuję za uwagę!!!

–34