Waw nlp #2 lokalizacja i narzedzia cat

Post on 11-Feb-2017

41 views 0 download

Transcript of Waw nlp #2 lokalizacja i narzedzia cat

WAW NLP Meetup #2 Computer Assisted/Aided Translation

Katarzyna WojtachaWarszawa, 7 listopad, 2016

Podstawy lokalizacjiNarzędzia będące częścią CAT: -spellchecker wbudowany w program bądź stanowiący osobny produkt;-moduł sprawdzania gramatyki;-elektroniczne słowniki;-narzędzia do wyszukiwania całych tekstów (wskaźniki), które pozwalają użytkownikowi przeszukiwać teksty już przetłumaczone lub różne dokumenty, do których się odnosi. Narzędzia tego typu to między innymi Naturel, ISYS Search Software i dtSearch;-organizator terminologii,-bazy terminologiczne; -programy konkordancyjne;-tekst równoległy (bitext);-oprogramowanie do zarządzania projektami – Translation Memory System;-programy do zarządzania pamięcią tłumaczeń (TMM – z ang. translation memory manager);-systemy prawie automatycznego tłumaczenia. MT vs. MAHT (HAMT)FAHQT = Fully Automatic High Quality Translation – cel do osiągnięcia.

Najchętniej używane narzędzia CAT:

Pamięć tłumaczeniowaStanowi bazę

danych złożoną z rekordów

zwierających co najmniej dwie

wersje językowe danego fragmentu tekstu, najczęściej

zdania.

Występuje zwykle w formie pliku lub

kilku plików, których format jest obsługiwany przez oprogramowanie

typu CAT.

Jest stale uzupełniana i poszerzana o nowy korpus tłumaczeń

Najczęściej stosowany format

to TMX (ang. Translation Memory eXchange) lub prosty format tekstowy txt.

Może być przechowywana w różnych formatach przeznaczonych dla

danego oprogramowania

plików wspomagających

tłumaczenie

Zapewnia spójność

terminologiczną i stylistyczną.

Pozwala na dużą oszczędność czasu i

wysiłku, gdyż przetłumaczone wcześniej

fragmenty są automatycznie

wyszukiwane w bazie i mogą być w łatwy sposób wykorzystane ponownie.

Przykład interface-u narzędzia CAT

Zalety narzędzi CAThttp://www.wordbee.com/computer-assisted-translation:

Much faster and more consistent translations, especially in technical and highly repetitive texts: no more million copy-paste operations and a lot of typing saved, since a translation can be just edited where needed;

Interchangeable memories among translators, who can all benefit from each other’s work inside a project;

Format retaining: the CAT tool does all the dirty work of keeping the layout of the original text exactly as it is. Without such a tool, the translator would indeed have to worry about tables, footnote placement, indents, paragraph breaks, font changes and the like. Instead, thanks to the CAT tool’s ability to assemble the segments together just as they were, the translator only has to focus on the actual words, not on their placement on the page.

Wady narzędzi CAThttp://forum.mlingua.pl/:

„Programy wspomagają w dużej mierze tłumacza, ale jednak nie zastąpią ludzkiej intuicji ani wiedzy.” „Problemy z wybieraniem właściwych odpowiedników, jeżeli tłumacz nie zna dobrze dziedziny tłumaczenia.”„CAT przydaje się, gdy mamy do czynienia z powtarzalnością tekstów, natomiast nie przyda się jeśli mamy do czynienia z tekstami o zróżnicowanej stylistyce.”„Bezużyteczne w przypadku tłumaczeń literackich i poetyckich.”Podsumowanie: „Maszyna jednak to maszyna i póki co pierwiastek ludzki jest wciąż potrzebny do efektywnego działania skomputeryzowanych urządzeń.”....?

Dlaczego niektórzy tłumacze nie chcą korzystać z narzędzi CAT?58% - koszty;47% - nieprzydatność narzędzia w danej dziedzinie;czas i wysiłek potrzebny do opanowania narzędzia – trzeba dobrze znać program, żeby faktycznie zaoszczędzić czas przy tłumaczeniu; trudność w wyborze odpowiedniego narzędzia CAT;

CAT: przyszłość i nowości. Collaborative translation: many translators can work in real time on the same project, on the exact same interface, whereas revisers can directly insert real-time comments and changes; Wyszukiwarka tłumaczeniowa (Language Search Engine software)  Wyszukiwarka tłumaczeniowa pozwala na dostęp do większego zasobu tłumaczeń, tworzonego przez wielu użytkowników, niż tradycyjne oprogramowanie tłumaczeniowe opierające się na tłumaczeniach wykonanych przez jednego tłumacza.Oprogramowanie porównawcze: analizują ukończone tłumaczenie, dzielą tekst źródłowy i docelowy próbując stworzyć z nich nową bazę danych. MLDB - The multilingual lexical data bases - include, for example, EuroDicautom at the EU (European Commission), Aquila by SITE-Sonovision, and MultiTerm by TradosEMBT – Example Based MT - aims at producing translation proposals by combining the translations of similar chunks of texts making up the sentence and previously identified as possible translation units in the translation memory....?

Na koniec...kilka słów o internacjonalizacji i lokalizacji.

Lokalizacja (l10n)Lokalizacja jest związana z adaptacją produktu, aplikacji, lub zawartości dokumentu do specyficznego rynku pod względem językowym, kulturowym i innymi wymaganiami.Może ona obejmować dopasowanie do potrzeb klienta związane z :Wartościami numerycznymi, datami, formatami czasuWalutamiUżycie klawiaturyPorównaniem i sortowaniemSymbolami, ikonami i koloramiTekstem i grafiką odnoszącą się do obiektów, akcji, lub pomysłów, które w danym kontekscie kulturowym mogą być źle zinterpretowane, lub postrzegane jako niewrażliwe.Wymaganiami prawnymi.Note: Lokalizacja może nawet nawet pociągnąć za sobą całkowitą zmianę logiki, projektu wizualnego, lub prezentacji jeśli prowadzenie biznesu (np: księgowości), lub przyjęty sposób uczenia się (np: skupienie się na osobniku a nie grupie) jest kompletnie odmienny w danej kulturze.

Internacjonalizacja –(l18n)Inne nazwy: globalizacja, umiędzynarodowienie. Internacjonalizacja jest projektowaniem i rozwijaniem produktów, aplikacji, lub treści dokumentów, które umożliwiają łatwą lokalizację dla odbiorców docelowych, którzy różnią się co do kultury, regionu, lub języka. alizacja. Internacjonalizacja szczególnie wpływa na łatwość z jaką produkt jest lokalizowany.Przystosowanie produktu do funkcjonowania w różnych kręgach językowych – w przypadku np. oprogramowania komputerowego będzie to możliwość używania w nim znaków służących do zapisów różnych języków. Chodzi więc o to, aby bez konieczności dokonywania zmian technicznych można było dostosowywać aplikację do potrzeb różnych języków i regionów.

Cytowane strony: https://pl.wikipedia.org/wiki/T%C5%82umaczenie_wspomagane_komputerowohttps://blog.stepes.com/cat-tools-for-translators-just-arent-doing-enough/https://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-using/http://www.wordbee.com/computer-assisted-translationhttp://noradiaz.blogspot.com/2011/08/using-multiterm-termbases-in-sdl-trados.htmlhttp://serwistlumacza.com/content/view/22/32/http://www.wordfast.com/WFP3/Translating_in_a_project/Leveraging_and_Updating_Translation_Memory.htmhttp://www.cslu.ogi.edu/HLTsurvey/ch8node6.htmlhttp://blog.lionbridge.com/poland/2012/10/09/jaka-jest-roznica-pomiedzy-tlumaczeniem-a-lokalizacja-2/http://www.boredpanda.com/funny-chinese-translation-fails/

Dowiedzcie sie wiecej o nas na

https://www.meetup.com/WarsawNLP/