Co tam słychać w tłumaczeniu maszynowym

Co tam słychać w tłumaczeniu maszynowym

Bogaty program merytoryczny, podzielony na cztery ścieżki tematyczne, to bez wątpienia jeden z głównych powodów, dla których branżową konferencję MT Summit 2019 odwiedziła rekordowa liczba uczestników – blisko 300 osób z całego świata. Byliśmy tam także i my.

W dniach 19-23 sierpnia 2019 r. stowarzyszenie International Association for Machine Translation (IAMT) zorganizowało 17. edycję konferencji MT Summit. To odbywające się co dwa lata wydarzenie, tym razem miało miejsce na terenie uniwersytetu w Dublinie. Dyskusje i wykłady toczyły się w ramach odrębnych kategorii tematycznych: badawczej, użytkowników, projektów i tłumaczy.

Opinie tłumaczy

Rozmowy prowadzone w ramach ścieżki tłumaczeniowej wskazują, że tłumaczenie maszynowe jest nadal tematem wzbudzającym duże emocje. Jednak wydaje się, że największe kontrowersje budzi nie tyle sama technologia, z której tłumacze chętnie korzystają we własnym zakresie, ile sposób rozliczenia pracy wykonanej z jej wsparciem oraz szacowania nakładu pracy związanego z postedycją. W oczywisty sposób nasuwają się pewne analogie do czasów, gdy narzędzia CAT i technologia pamięci tłumaczeń budziła podobne wątpliwości wśród tłumaczy.

Definitywnie przyszłością są silniki neuronowe, a uwaga deweloperów, użytkowników i badawczy skierowana jest na problematykę niwelowania błędów. Technologia silników statystycznych cechowała się większą przewidywalnością oraz umożliwiała ścisłe kontrolowanie terminologii. Nie jest to tak łatwe do osiągnięcia w przypadku silników neuronowych, które w zamian zapewniają bardziej naturalnie brzmiące tłumaczenie. W zawiązku z tym dużo uwagi poświęcono sposobom kontroli i doboru korpusów szkoleniowych, szczególnie w obrębie jednej dziedziny oraz języków, w których zasoby językowe (szczególnie dwujęzyczne) są skąpe. Innym ważnym rozwiązaniem są techniki automatycznej postedycji, które redukują pewną część problemów. Proponowane rozwiązania wykorzystują korpus szkoleniowy zbudowany z dużej liczby segmentów poprawionych ręcznie w ramach postedycji.

Jakość tłumaczenia

Bardzo ważnym obszarem zainteresowań jest estymacja jakości hipotez (propozycji) silników tłumaczenia maszynowego. Istotne jest zwłaszcza szacowanie jakości propozycji silnika oraz wskazanie potencjalnych problemów. Może to przybliżyć sposób pracy z takimi segmentami do sposobu pracy z niskimi kategoriami podpowiedzi z pamięci tłumaczeń, w przypadku których narzędzia wskazują różnice między nowym a zapisanym segmentem. Wydaje się, że takie rozwiązania mogą przekonać sceptycznych do tej pory lingwistów.

Na konferencji przedstawiono również kilka bardzo ciekawych projektów, takich jak np. „tłumaczenie” zapytań formułowanych w języku naturalnym na zapytania SQL, czy „detektory MT”. Dobitnie świadczy to, że potencjał takich rozwiązań ograniczony jest w dużej mierze wyobraźnią i dostępnością korpusów szkoleniowych.

Piotr PeszyńskiSpotkania takie jak MT Summit to dokonała okazja, by skonfrontować opinie i wymagania badaczy, deweloperów, użytkowników i tłumaczy. Zawsze chętnie w nich uczestniczymy, jesteśmy na bieżąco z najnowszymi trendami, uczymy się od innych i wymieniamy spostrzeżenia. Na kolejną edycję, która odbędzie się prawdopodobnie w Kanadzie, trzeba poczekać kolejne dwa lata, ale na pewno warto. 

Piotr Peszyński, Machine Translation Specialist, GET IT