Waw nlp #2 lokalizacja i narzedzia cat

14
WAW NLP Meetup #2 Computer Assisted/Aided Translation Katarzyna Wojtacha Warszawa, 7 listopad, 2016

Transcript of Waw nlp #2 lokalizacja i narzedzia cat

Page 1: Waw nlp #2   lokalizacja i narzedzia cat

WAW NLP Meetup #2 Computer Assisted/Aided Translation

Katarzyna WojtachaWarszawa, 7 listopad, 2016

Page 2: Waw nlp #2   lokalizacja i narzedzia cat

Podstawy lokalizacjiNarzędzia będące częścią CAT: -spellchecker wbudowany w program bądź stanowiący osobny produkt;-moduł sprawdzania gramatyki;-elektroniczne słowniki;-narzędzia do wyszukiwania całych tekstów (wskaźniki), które pozwalają użytkownikowi przeszukiwać teksty już przetłumaczone lub różne dokumenty, do których się odnosi. Narzędzia tego typu to między innymi Naturel, ISYS Search Software i dtSearch;-organizator terminologii,-bazy terminologiczne; -programy konkordancyjne;-tekst równoległy (bitext);-oprogramowanie do zarządzania projektami – Translation Memory System;-programy do zarządzania pamięcią tłumaczeń (TMM – z ang. translation memory manager);-systemy prawie automatycznego tłumaczenia. MT vs. MAHT (HAMT)FAHQT = Fully Automatic High Quality Translation – cel do osiągnięcia.

Page 3: Waw nlp #2   lokalizacja i narzedzia cat

Najchętniej używane narzędzia CAT:

Page 4: Waw nlp #2   lokalizacja i narzedzia cat

Pamięć tłumaczeniowaStanowi bazę

danych złożoną z rekordów

zwierających co najmniej dwie

wersje językowe danego fragmentu tekstu, najczęściej

zdania.

Występuje zwykle w formie pliku lub

kilku plików, których format jest obsługiwany przez oprogramowanie

typu CAT.

Jest stale uzupełniana i poszerzana o nowy korpus tłumaczeń

Najczęściej stosowany format

to TMX (ang. Translation Memory eXchange) lub prosty format tekstowy txt.

Może być przechowywana w różnych formatach przeznaczonych dla

danego oprogramowania

plików wspomagających

tłumaczenie

Zapewnia spójność

terminologiczną i stylistyczną.

Pozwala na dużą oszczędność czasu i

wysiłku, gdyż przetłumaczone wcześniej

fragmenty są automatycznie

wyszukiwane w bazie i mogą być w łatwy sposób wykorzystane ponownie.

Page 5: Waw nlp #2   lokalizacja i narzedzia cat

Przykład interface-u narzędzia CAT

Page 6: Waw nlp #2   lokalizacja i narzedzia cat

Zalety narzędzi CAThttp://www.wordbee.com/computer-assisted-translation:

Much faster and more consistent translations, especially in technical and highly repetitive texts: no more million copy-paste operations and a lot of typing saved, since a translation can be just edited where needed;

Interchangeable memories among translators, who can all benefit from each other’s work inside a project;

Format retaining: the CAT tool does all the dirty work of keeping the layout of the original text exactly as it is. Without such a tool, the translator would indeed have to worry about tables, footnote placement, indents, paragraph breaks, font changes and the like. Instead, thanks to the CAT tool’s ability to assemble the segments together just as they were, the translator only has to focus on the actual words, not on their placement on the page.

Page 7: Waw nlp #2   lokalizacja i narzedzia cat

Wady narzędzi CAThttp://forum.mlingua.pl/:

„Programy wspomagają w dużej mierze tłumacza, ale jednak nie zastąpią ludzkiej intuicji ani wiedzy.” „Problemy z wybieraniem właściwych odpowiedników, jeżeli tłumacz nie zna dobrze dziedziny tłumaczenia.”„CAT przydaje się, gdy mamy do czynienia z powtarzalnością tekstów, natomiast nie przyda się jeśli mamy do czynienia z tekstami o zróżnicowanej stylistyce.”„Bezużyteczne w przypadku tłumaczeń literackich i poetyckich.”Podsumowanie: „Maszyna jednak to maszyna i póki co pierwiastek ludzki jest wciąż potrzebny do efektywnego działania skomputeryzowanych urządzeń.”....?

Page 8: Waw nlp #2   lokalizacja i narzedzia cat

Dlaczego niektórzy tłumacze nie chcą korzystać z narzędzi CAT?58% - koszty;47% - nieprzydatność narzędzia w danej dziedzinie;czas i wysiłek potrzebny do opanowania narzędzia – trzeba dobrze znać program, żeby faktycznie zaoszczędzić czas przy tłumaczeniu; trudność w wyborze odpowiedniego narzędzia CAT;

Page 9: Waw nlp #2   lokalizacja i narzedzia cat

CAT: przyszłość i nowości. Collaborative translation: many translators can work in real time on the same project, on the exact same interface, whereas revisers can directly insert real-time comments and changes; Wyszukiwarka tłumaczeniowa (Language Search Engine software)  Wyszukiwarka tłumaczeniowa pozwala na dostęp do większego zasobu tłumaczeń, tworzonego przez wielu użytkowników, niż tradycyjne oprogramowanie tłumaczeniowe opierające się na tłumaczeniach wykonanych przez jednego tłumacza.Oprogramowanie porównawcze: analizują ukończone tłumaczenie, dzielą tekst źródłowy i docelowy próbując stworzyć z nich nową bazę danych. MLDB - The multilingual lexical data bases - include, for example, EuroDicautom at the EU (European Commission), Aquila by SITE-Sonovision, and MultiTerm by TradosEMBT – Example Based MT - aims at producing translation proposals by combining the translations of similar chunks of texts making up the sentence and previously identified as possible translation units in the translation memory....?

Page 10: Waw nlp #2   lokalizacja i narzedzia cat

Na koniec...kilka słów o internacjonalizacji i lokalizacji.

Page 11: Waw nlp #2   lokalizacja i narzedzia cat

Lokalizacja (l10n)Lokalizacja jest związana z adaptacją produktu, aplikacji, lub zawartości dokumentu do specyficznego rynku pod względem językowym, kulturowym i innymi wymaganiami.Może ona obejmować dopasowanie do potrzeb klienta związane z :Wartościami numerycznymi, datami, formatami czasuWalutamiUżycie klawiaturyPorównaniem i sortowaniemSymbolami, ikonami i koloramiTekstem i grafiką odnoszącą się do obiektów, akcji, lub pomysłów, które w danym kontekscie kulturowym mogą być źle zinterpretowane, lub postrzegane jako niewrażliwe.Wymaganiami prawnymi.Note: Lokalizacja może nawet nawet pociągnąć za sobą całkowitą zmianę logiki, projektu wizualnego, lub prezentacji jeśli prowadzenie biznesu (np: księgowości), lub przyjęty sposób uczenia się (np: skupienie się na osobniku a nie grupie) jest kompletnie odmienny w danej kulturze.

Page 12: Waw nlp #2   lokalizacja i narzedzia cat

Internacjonalizacja –(l18n)Inne nazwy: globalizacja, umiędzynarodowienie. Internacjonalizacja jest projektowaniem i rozwijaniem produktów, aplikacji, lub treści dokumentów, które umożliwiają łatwą lokalizację dla odbiorców docelowych, którzy różnią się co do kultury, regionu, lub języka. alizacja. Internacjonalizacja szczególnie wpływa na łatwość z jaką produkt jest lokalizowany.Przystosowanie produktu do funkcjonowania w różnych kręgach językowych – w przypadku np. oprogramowania komputerowego będzie to możliwość używania w nim znaków służących do zapisów różnych języków. Chodzi więc o to, aby bez konieczności dokonywania zmian technicznych można było dostosowywać aplikację do potrzeb różnych języków i regionów.

Page 13: Waw nlp #2   lokalizacja i narzedzia cat

Cytowane strony: https://pl.wikipedia.org/wiki/T%C5%82umaczenie_wspomagane_komputerowohttps://blog.stepes.com/cat-tools-for-translators-just-arent-doing-enough/https://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-using/http://www.wordbee.com/computer-assisted-translationhttp://noradiaz.blogspot.com/2011/08/using-multiterm-termbases-in-sdl-trados.htmlhttp://serwistlumacza.com/content/view/22/32/http://www.wordfast.com/WFP3/Translating_in_a_project/Leveraging_and_Updating_Translation_Memory.htmhttp://www.cslu.ogi.edu/HLTsurvey/ch8node6.htmlhttp://blog.lionbridge.com/poland/2012/10/09/jaka-jest-roznica-pomiedzy-tlumaczeniem-a-lokalizacja-2/http://www.boredpanda.com/funny-chinese-translation-fails/

Page 14: Waw nlp #2   lokalizacja i narzedzia cat

Dowiedzcie sie wiecej o nas na

https://www.meetup.com/WarsawNLP/