Umelá inteligencia zažíva veľký rozmach vďaka technológiám spoločnosti Microsoft pre jazykové preklady

Nový rozmach umelej inteligencie, ktorý prichádza vďaka technológiám spoločnosti Microsoft pre jazykové preklady, prináša presnejšie rozpoznávanie reči pre viac svetových jazykov a vyššiu kvalitu strojových prekladov pre všetkých 60 jazykov podporovaných prekladovými technológiami Microsoftu. Vylepšenia boli oznámené 16. novembra na konferencii Microsoft Tech Summit, ktorá sa konala v austrálskom Sydney. „Máme komplexný stroj a inovujeme vo všetkých oblastiach,“ uviedol Olivier Fontana, riaditeľ produktovej stratégie pre platformu Microsoft Translator, určenú pre služby prekladu textov a reči. Dodal taktiež, že s prebiehajúcim pokrokom tieto nástroje na strojový preklad umožňujú väčšiemu množstvu ľudí rozvíjať podnikania, budovať si vzťahy a zoznamovať sa s rôznymi kultúrami. Výskumné laboratóriá spoločnosti Microsoft po celom svete využívajú tieto technológie, aby pomohli ľuďom naučiť sa hovoriť novými jazykmi. Na technologickom summite usporiadanom v tomto týždni bola napríklad oznámená aplikácia na výučbu jazykov určená pre osoby, ktoré sa chcú naučiť čínsky.

Neurónové siete

Práve dosiahnutý pokrok Microsoft Translatora vychádza z vlaňajšieho prechodu na strojové preklady využívajúce hlboké neurónové siete, ktoré ponúkajú plynulejšie a prirodzenejšie znejúce preklady než predchádzajúca technológie označovaná ako štatistický strojový preklad.

Obe metódy zahŕňajú algoritmy učenia, ktoré používajú profesionálne preložené dokumenty, takže sa systém môže naučiť, ako sa slová a frázy z jedného jazyka vyjadrujú v inom jazyku. Štatistická metóda je však obmedzená na prekladanie slova v rámci miestneho kontextu niekoľkých okolitých slov, čo môže viesť k ťažkopádnym a neprirodzeným prekladom.

Inšpiráciou pre neurónové siete sa stali ľudské teórie o tom, ako prebieha proces rozpoznávania vzorov v mozgoch osôb, ktoré ovládajú viac jazykov. Neurónové siete vďaka tomu ponúkajú prirodzenejšie znejúce preklady.

Microsoft nedávno prešiel pri ďalších 10 jazykoch na modely pre strojový preklad založené na neurónových sieťach, takže celkovo používa neurónové siete pre 21 jazykov. Preklady využívajúce neurónové siete vykazujú podľa automatizovanej vyhodnocovacej metriky pre strojový preklad označovanej ako BLEU, alebo Bilingual Evaluation Understudy, zvýšenie presnosti o 6 až 43 percent v závislosti od konkrétnych jazykových párov.

„V uplynulom roku sme rozšírili počet jazykov a zvýšili komplexnosť a hĺbku modelov, takže disponujeme oveľa vyššou kvalitou,“ povedal Arul Menezes, vedúci tímu strojového prekladu skupiny Microsoft AI and Research. Uviedol taktiež, že sú pre všetkých vývojárov, ktorí používajú prekladové služby Microsoftu, štandardne dostupné preklady využívajúce neurónové siete pre dva z najrozšírenejších svetových jazykov, hindčinu a čínštinu.

Výskumní pracovníci spoločnosti Microsoft (zľava doprava): Yan Xia, Jonathan Tien a Frank Soong (fotografia bola použitá s láskavým súhlasom spoločnosti Microsoft)

Kroky procesu prekladu

Proces strojového prekladu z jedného jazyka do druhého je rozdelený do niekoľkých krokov. Každý krok ovplyvňuje výslednú kvalitu prekladu. V prípade prekladu hovoreného prejavu osoby hovoriacej jedným jazykom je prvým krokom rozpoznanie reči, čo je proces prevodu hovorených slov na text.

Všetky jazyky podporované technológiami Microsoftu pre preklad reči teraz používajú na rozpoznávanie reči typ umelej inteligencie, ktorý je označovaný ako LSTM (Long Short-Term Memory) a spoločne s doplnkovými dátami má za následok zvýšenie kvality až o 29 percent v porovnaní s modelmi hlbokých neurónových sietí pre konverzačnú reč. „Keď prekladáte reč, najprv reč rozpoznáte a potom nasleduje vlastný preklad,“ vysvetľuje Menezes. „Takže ak dôjde k chybe pri rozpoznávaní reči, v ďalšom kroku sa jej dopad ešte viac zosilní, lebo chybne rozpoznané slovo spôsobí, že sa preklad stane nezrozumiteľným.“

V druhom kroku strojového prekladu prebehne prevod textu z jedného jazyka do druhého pomocou modelov založených na neurónových sieťach. Microsoft disponuje modelmi pre 21 jazykov. Zlepšenie kvality prekladov je zrejmé, aj keď je modelom založeným na neurónovej sieti podporovaný iba jeden z jazykov, a to vďaka prístupu, kde sú oba jazyky prekladané cez angličtinu.

Predstavte si napríklad osobu, ktorá chce prekladať z holandčiny do katalánčiny. Holandčina je po novom podporovaná neurónovými sieťami a v prípade katalánčiny inžinieri stále ešte pracujú na infraštruktúre podpory neurónových sietí. Menezes poznamenal, že koncoví používatelia zaznamenajú zlepšenie kvality prekladu z holandčiny do katalánčiny používajúceho tento hybridný prístup, pretože jeho polovica je teraz lepšia.

V záverečnom kroku prekladu reči sa preložený text prevedie na hlas prostredníctvom technológie prevádzania textu na hovorené slovo. I tu dosiahli výskumní pracovníci v oblasti reči a jazykov pokrok, vďaka ktorému je možné produkovať presnejšie a prirodzenejšie znejúce syntetické hlasy. Tieto zdokonalenia prispievajú k vyššej kvalite všetkých súčasných prekladových služieb Microsoftu a taktiež otvárajú dvere k novým funkciám pre výučbu jazykov.

Aplikácia Learn Chinese

Ak sa napríklad chcete skutočne naučiť hovoriť cudzím jazykom, nezaobídete sa bez praktického precvičovania. Býva však problematické nájsť niekoho, kto má čas, trpezlivosť a znalosti, aby vám pomohol precvičovať výslovnosť, slovnú zásobu a gramatiku.

Pre ľudí, ktorí sa učia čínsky, sa Microsoft snaží vyplniť doterajšiu medzeru pomocou novej aplikácie pre smartfóny, ktorá môže slúžiť ako vždy dostupný asistent pre výučbu jazykov ponúkajúci umelú inteligenciu. Čoskoro bude uvedená na trh bezplatná aplikácia Learn Chinese pre platformu iOS spoločnosti Apple.

Cieľom tejto aplikácie je vyriešiť problém, ktorý dôverne pozná každý, kto sa učí cudzí jazyk a strávil nespočetné množstvo hodín načúvaním učiteľom v preplnených učebniach, sledovaním videí pre výučbu jazykov v domácom prostredí alebo prechádzaním kopy kartičiek určených na osvojenie slovnej zásoby a gramatiky – pocit žalostne malej pripravenosti na skutočné konverzácie s rodenými hovoriacimi.

„Možno sa domnievate, že viete po čínsky, ale keď stretnete Číňana a chcete hovoriť po čínsky, nebudete to schopní, ak ste čínštinu neprecvičovali,“ vysvetlil Yan Xia, vedúci tímu vývoja zo spoločnosti Microsoft Research Asia, ktorá sídli v Pekingu. „Naša aplikácia rieši tento problém využitím technológie rozpoznávania reči.“

„Aplikácia je podobná asistentovi učiteľa,“ uviedol Frank Soong, hlavný výskumný pracovník a vedúci skupiny pre výskum reči pekinského laboratória, ktoré vyvinulo modely strojového učenia využívané aplikáciou Learn Chinese, rovnako ako chatovacieho robota Xiaoying na výučbu angličtiny. Toho laboratórium nasadilo v roku 2016 na platforme WeChat v Číne.

„Naša aplikácia nie je náhradou za dobrého skutočného učiteľa,“ uviedol Soong. „Ale môže pomôcť svojou trvalou dostupnosťou, keď má príslušný jedinec chuť alebo čas si precvičovať.“

Technológie výučby jazykov spoliehajú na balík nástrojov umelej inteligencie, ako sú hlboké neurónové siete, ktoré Soongova skupina vyladila tak, aby rozpoznali, čo sa osoby učiace sa jazyk snažia povedať, a dokázali vyhodnotiť ich výslovnosť, rytmus a tón. Nástroje sú založené na porovnávaní s modelmi, ktoré boli vytvorené na základe dát od rodených hovoriacich, a taktiež na najmodernejšej technológii prevodu textu na hovorené slovo.

Jedinci, ktorí aplikáciu používajú, získajú spätnú väzbu vo forme skóre, spoločne so zvýraznenými slovami, v prípade ktorých sa potrebujú zdokonaliť, a odkazy na zvukové ukážky, aby si mohli vypočuť správnu výslovnosť. „Aplikácia s vami bude spolupracovať ako partner pre výučbu jazykov,“ uviedol Xia. „Bude vám odpovedať a poskytovať spätnú väzbu na základe toho, čo poviete.“

Olivier Fontana, výskumný pracovník spoločnosti Microsoft (fotografie: Dan DeLong)

Dosiahnutie ďalších miest

Aplikácia Learn Chinese a rozhodujúce služby Microsoftu pre jazykové preklady využívajú cloudovú strojovú inteligenciu. To ľuďom umožňuje flexibilne a pohodlne pristupovať k týmto službám z ľubovoľného miesta poskytujúceho pripojenie na internet, ako sú autobusové zastávky, reštaurácie alebo konferenčné centrá.

Pre klientov, ktorí potrebujú prekladať vysoko dôverný obsah alebo vyžadujú prekladové služby na miestach, kde nie je dostupné pripojenie na internet, Microsoft teraz ponúka preklady využívajúce neurónové siete pre lokálne servery. Podľa Fontany je tento vývoj ďalším príkladom, ako rozmach umelej inteligencie postupuje a zasahuje stále viac miest a stále viac jazykov.

Tento článok bol prevzatý z anglického originálu.