Baza tłumaczeń dla programistów
Zbiór około 1 miliona zdań z wysokiej jakości tłumaczeniami na 22 języki UE został udostępniony przez Komisję Europejską. Będą z nich mogli korzystać twórcy oprogramowania, którzy pracują nad translatorami i innymi narzędziami językowymi (jak np. systemy klasyfikacji tekstów, narzędzia sprawdzania pisowni i gramatyki itd.).
reklama
Zbiory tłumaczeń, w których posiadaniu są instytucje europejskie są jedyne w swoim rodzaju. Ze względu na wymóg tłumaczenia prawodawstwa unijnego na wszystkie 23 oficjalne języki, instytucje UE produkują więcej tekstów wielojęzycznych niż jakakolwiek inna organizacja. Służby tłumaczeniowe pracują w 253 możliwych kombinacjach par języków. Jak podaje KE, Rocznie powstaje około 1,5 mln stron tłumaczeń.
Stworzone w ten sposób zasoby mogą znacznie ułatwić prace twórcom systemów tłumaczenia maszynowego. Tego typu programy zazwyczaj korzystają z bazy przetłumaczonych zdań, aby potem za pomocą metod statystycznych znaleźć najlepszą konstrukcje językową dla tłumaczenia danego wyrażenia.
Nierzadko twórcy takich programów musieli poświecić sporo czasu na tworzenie bazy zdań i korzystali z dokumentów dostępnych w internecie. Teraz Komisja udostępniła ogromny zbiór zdań odpowiednio oznaczonych aby programiści dokładnie wiedzieli gdzie szukać tłumaczeń danego wyrażenia.
Zaletą zbioru zdań udostępnionego przez KE jest nie tylko wielkość, ale także specjalistyczny charakter. Znajdują się w nim tłumaczenia m. in. z zakresu technologii informatycznych, telekomunikacji, prawa pracy, rolnictwa i rybołówstwa. Ponadto dostępne są tłumaczenia w językach takich jak łotewski czy litewski podczas gdy większość dokumentów dostępnych w internecie to tłumaczenia pomiędzy popularnymi językami takimi jak francuski i angielski.
Komisji Europejskiej opłaca się udostępnianie swoich zbiorów. Dobre translatory komputerowe - jeśli powstaną - będą szybkie, tanie i przyczynią się do większej dostępności informacji online dla ludzi z mniejszości językowych.
Osoby zainteresowane tworzeniem translatorów mogą pobrać teksty ze strony DGT. Do ich przeglądania potrzebny będzie specjalny program oraz biblioteka. Więcej informacji można znaleźć pod adresem langtech.jrc.it/DGT-TM.html.