Krzysztof Mossakowski [email protected] mini.pw.pl/~mossakow
description
Transcript of Krzysztof Mossakowski [email protected] mini.pw.pl/~mossakow
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
1
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof [email protected]
http://www.mini.pw.edu.pl/~mossakow
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
2
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Przetwarzanie języka naturalnego
• Natural Language Processing - NLP• „inteligentna analiza”• „zrozumienie znaczenia”
• Zastosowania:• rozpoznawania mowy• synteza mowy• rozpoznawanie tekstu• narzędzia leksykograficzne• automatyczne tłumaczenia• analiza dokumentów
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
3
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Słowa kluczowe
• natural language processing• written text understanding• information retrieval, document retrieval• information extraction• text processing• language learning
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
4
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Język naturalny
• Problemy:• długie, wielokrotnie złożone zdania• różne znaczenia w różnych kontekstach• wyjątki gramatyczne• specjalne formatowanie tekstu• błędy (ortografia, gramatyka, interpunkcja)
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
5
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Techniki NLP - Knowledge Base
• Semantyczna reprezentacja i interpretacja poszczególnych słów w tekście
• Słowniki• powiązania między słowami (synonimy)
• Wiedza:• morfologiczna - budowa i odmiana wyrazów• syntaktyczna - składnia• semantyczna - znaczenie wyrazów• pragmatyczna - związki logiczne
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
6
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Techniki NLP - Linguistic
• Gramatyki i automaty• Zagadnienia:
• stemming - pobranie podstawowego fragmentu słowa niezmiennego w odmianie
• normalization - identyfikacja odmian słowa i redukcja ich do pojedynczej formy podstawowej
• lemmatization - przynależność słów i fraz do grup• conflation - złączenie nieidentycznych słów w grupy
wg znaczenia
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
7
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Techniki NLP - Statistical (Probabilistic)
• Zagadnienia:• klasyfikacja słów• segmentacja tekstu• częstość występowania słów (fraz)
• Document Retrieval - prawdopodobieństw, że dokument odpowiada zapytaniu
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
8
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Techniki NLP - Connectionist
• Zagadnienia:• kojarzenie słów i fraz• predykcja następnego słowa w zdaniu• podział zdania na fragmenty funkcjonalne• wieloznaczność słów i fraz• automatyczne dopasowanie struktury i funkcji
(SOM)
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
9
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Techniki NLP - Semantic
• Znaczenie wyrazów• WordNet
• słowa (94 tys. rzeczowników, 10 tys. czasowników, 20 tys. przymiotników, 4 500 przysłówków)
• określenie złożone• idiomy
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
10
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Wybrane zagadnienia NLP
• Wyszukiwanie dokumentów dla zadanego pytania• Wyszukiwanie słów kluczowych w tekście • Tworzenie podsumowania informacji• Odpowiadanie na pytania zadawane w
naturalnym języku• Uniwersalność w sensie zakresu słownictwa• Uniwersalność w sensie języka
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Krzysztof Mossakowski - http://www.mini.pw.edu.pl/~mossakow
11
Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia
Mechanizmy przetwarzania języka naturalnego jako wspomaganie systemów decyzyjnych - wybrane zagadnienia