Aby se v překladu nic neztrácelo
Přestavte si, že přijdete na konferenci nebo na úřad v cizině a nerozumíte místnímu jazyku. Stačí ale vytáhnout telefon, připojit se k nové službě a za chvíli máte přímo v uchu simultánní tlumočnici.
Utopie? Zdaleka ne. Tyto možnosti nejsou hudbou vzdálené, nýbrž velice blízké budoucnosti. Na rychlém strojovém překládání a tlumočení pracuje například technologická konzultační společnost Trask solutions.
„Loni v srpnu za námi přišly společnost Microsoft a Nejvyšší kontrolní úřad (NKÚ) se zajímavým projektem. V říjnu totiž NKÚ pořádal seminář za účasti několika desítek kontrolorů z celého světa, na kterém byli účastníci hovořící jedenácti různými jazyky, včetně například finštiny nebo indonéštiny. Chtěli najít způsob, jak zjednodušit jinak velice náročné simultánní tlumočení. Nabídli jsme jim technologii, která umí převést mluvené slovo na text, ten v podstatě v reálném čase strojově přeložit a překlad zobrazit na displejích počítačů či tabletů jednotlivých účastníků,“ popisuje Zuzana Poláčková, Architekt řešení ve společnosti Trask solutions.
Jako nejnáročnější úkol se nakonec ukázalo celý systém naladit tak, aby překládal svižně, bez zakolísání a zdržení. A současně bylo třeba jazykový model intenzivně trénovat, aby rozuměl různým lidem s různými přízvuky či dialekty. Model se postupně v rychlosti i v přesnosti zlepšoval. Zpoždění překladu nepřekročilo hodnotu jedné sekundy, přesnost přepisu i překladu se pohybovala kolem devadesáti procent. To nastartovalo novou spolupráci s cílem zajistit překládání pro velký čtyřdenní kongres, který bude NKÚ pořádat v Praze v roce 2020.
Model bude umět mluvit
Trask chce svůj systém rozšířit o podporu dalších jazyků. Ideální představa totiž je, že všichni přednášející budou mluvit v rodném jazyce, aby nebylo nutné potýkat se s přízvuky a chybami v angličtině. V pilotní fázi se počítá s jedenácti vstupními jazyky včetně češtiny, slovenštiny, maďarštiny či polštiny.
Se samotným překladem přitom podle Zuzany Poláčkové až takový problém není. „Strojové překladače jsou dnes velice kvalitní, navíc s Microsoftem spolupracujeme na dotrénování jejich modelu. Tohle totiž mnoho jiných překladačů nenabízí: lze do něj nahrát konkrétní specializované domény, tedy vlastně odborný jazyk, například z medicíny nebo životního prostředí,” popisuje výhody spolupráce s Microsoftem.
Druhým vylepšením má být i konečná syntetizace výstupu neboli převod výsledného přeloženého textu do řeči, aby posluchači stačilo jen sluchátko v uších. V pilotní fázi vyvíjí Trask syntetizaci do angličtiny, němčiny a češtiny.
Překlad v cloudu
Celý systém je postavený na technologii Azure a jeho službě Cognitive Services. Trask nevyužívá žádný server, vše běží na platformě v cloudu. „Skvělá je možnost integrace. Dokážeme jedním skriptem vytvořit kompletní prostředí, které obslouží vše od začátku až do konce. Navíc to funguje zcela automaticky, nemusíme řešit jakýkoliv hardware, dostupnost ani nic dalšího,“ pochvaluje si Poláčková.
A jak celá věc funguje prakticky „v terénu“? Zákazník aktivuje službu s připravenými modely, připojí se k webové stránce, zapojí mikrofon a spustí nahrávání. Vše funguje v cloudu, takže jediné, co je potřeba, je kvalitní a rychlé internetové spojení. Posluchači se rovněž připojí notebookem či telefonem k webové službě a na displeji se jim zobrazuje přeložený text. V následující verzi přes sluchátka poslouchají přímo mluvený překlad.
A její kolega Lukáš Čejka doplňuje: „Tohle je právě vize našeho řešení. Přijedete na konferenci a zjistíte, že se tam mluví jazykem, který neovládáte. Vytáhnete chytrý telefon, zapnete náš překladač, zapojíte sluchátka a máte v kapse simultánní tlumočnici. Věříme, že tohle se nám podaří zprovoznit ještě do konce letošního roku. Dalším stupněm je pak tyto technologie nabídnout třeba na úřadech.“