Umělá inteligence zažívá velký rozmach díky technologiím společnosti Microsoft pro jazykové překlady

Arul Menezes, výzkumný pracovník společnosti Microsoft (fotografie: Dan DeLong)

Nový rozmach umělé inteligence, který přichází díky technologiím společnosti Microsoft pro jazykové překlady, přináší přesnější rozpoznávání řeči pro více světových jazyků a vyšší kvalitu strojových překladů pro všech 60 jazyků podporovaných překladovými technologiemi Microsoftu. Vylepšení byla oznámena 16. listopadu na konferenci Microsoft Tech Summit, která se konala v australském Sydney.

„Máme komplexní stroj a inovujeme ve všech oblastech,“ uvedl Olivier Fontana, ředitel produktové strategie pro platformu Microsoft Translator, určenou pro služby překladu textů a řeči. Dodal také, že s probíhajícím pokrokem tyto nástroje pro strojový překlad umožňují většímu množství lidí rozvíjet podnikání, budovat si vztahy a seznamovat se s různými kulturami.

Výzkumné laboratoře společnosti Microsoft po celém světě využívají tyto technologie, aby pomohly lidem naučit se hovořit novými jazyky. Na technologickém summitu uspořádaném v tomto týdnu byla například oznámena aplikace pro výuku jazyků určená pro osoby, které se chtějí naučit čínsky.

Neuronové sítě

Nově dosažený pokrok Microsoft Translatoru vychází z loňského přechodu na strojové překlady využívající hluboké neuronové sítě, které nabízejí plynulejší a přirozeněji znějící překlady než předchozí technologie označovaná jako statistický strojový překlad.

Obě metody zahrnují algoritmy učení, které používají profesionálně přeložené dokumenty, takže se systém může naučit, jak se slova a fráze z jednoho jazyka vyjadřují v jiném jazyce. Statistická metoda je však omezena na překládání slova v rámci místního kontextu několika okolních slov, což může vést k těžkopádným a nepřirozeným překladům.

Inspirací pro neuronové sítě se staly lidské teorie o tom, jak probíhá proces rozpoznávání vzorů v mozcích osob, které ovládají více jazyků. Neuronové sítě díky tomu nabízejí přirozeněji znějící překlady.

Microsoft nedávno přešel u dalších 10 jazyků na modely pro strojový překlad založené na neuronových sítích, takže celkem používá neuronové sítě pro 21 jazyků. Překlady využívající neuronové sítě vykazují podle automatizované vyhodnocovací metriky pro strojový překlad označované jako BLEU, neboli Bilingual Evaluation Understudy, zvýšení přesnosti o 6 až 43 procent v závislosti na konkrétních jazykových párech.

„V uplynulém roce jsme rozšířili počet jazyků a zvýšili komplexnost a hloubku modelů, takže disponujeme mnohem vyšší kvalitou,“ řekl Arul Menezes, vedoucí týmu strojového

překladu skupiny Microsoft AI and Research. Uvedl také, že jsou pro všechny vývojáře, kteří používají překladové služby Microsoftu, standardně dostupné překlady využívající neuronové sítě pro dva z nejrozšířenějších světových jazyků, hindštinu a čínštinu.

Výzkumní pracovníci společnosti Microsoft (zleva doprava): Yan Xia, Jonathan Tien a Frank Soong (fotografie byla použita s laskavým svolením společnosti Microsoft)

Kroky procesu překladu

Proces strojového překladu z jednoho jazyka do druhého je rozdělen do několika kroků. Každý krok ovlivňuje výslednou kvalitu překladu. V případě překladu mluveného projevu osoby hovořící jedním jazykem je prvním krokem rozpoznání řeči, což je proces převodu mluvených slov na text.

Všechny jazyky podporované technologiemi Microsoftu pro překlad řeči nyní používají k rozpoznávání řeči typ umělé inteligence, který je označovaný jako LSTM (Long Short-Term Memory) a společně s doplňkovými daty má za následek zvýšení kvality až o 29 procent v porovnání s modely hlubokých neuronových sítí pro konverzační řeč.

„Když překládáte řeč, provedete nejprve rozpoznání řeči a poté vlastní překlad,“ vysvětluje Menezes. „Takže pokud dojde k chybě při rozpoznávání řeči, v dalším kroku se její dopad ještě zesílí, neboť chybně rozpoznané slovo způsobí, že se překlad stane nesrozumitelným.“

V druhém kroku strojového překladu proběhne převod textu z jednoho jazyka do druhého pomocí modelů založených na neuronových sítích. Microsoft disponuje modely pro 21 jazyků. Zlepšení kvality překladů je zřejmé, i když je modelem založeným na neuronové síti podporovaný pouze jeden z jazyků, a to díky přístupu, kdy jsou oba jazyky překládané přes angličtinu.

Představte si například osobu, která chce překládat z holandštiny do katalánštiny. Holandština je nově podporovaná neuronovými sítěmi a v případě katalánštiny inženýři stále ještě pracují na infrastruktuře podpory neuronových sítí. Menezes poznamenal, že koncoví uživatelé zaznamenají zlepšení kvality překladu z holandštiny do katalánštiny používajícího tento hybridní přístup, protože jeho polovina je nyní lepší.

V závěrečném kroku překladu řeči je přeložený text převeden na hlas prostřednictvím technologie převádění textu na mluvené slovo. I zde dosáhli výzkumní pracovníci v oblasti řeči a jazyků pokroku, díky kterému je možné produkovat přesnější a přirozeněji znějící syntetické hlasy. Tato zdokonalení přispívají k vyšší kvalitě všech stávajících překladových služeb Microsoftu a také otevírají dveře k novým funkcím pro výuku jazyků.

Aplikace Learn Chinese

Pokud se například chcete skutečně naučit mluvit cizím jazykem, neobejdete se bez praktického procvičování. Bývá však problematické najít někoho, kdo má čas, trpělivost a znalosti, aby vám pomohl procvičovat výslovnost, slovní zásobu a gramatiku.

Pro lidi, kteří se učí čínsky, se Microsoft snaží vyplnit dosavadní mezeru pomocí nové aplikace pro smartphony, která může sloužit jako vždy dostupný asistent pro výuku jazyků nabízející umělou inteligenci. Brzy bude uvedena na trh bezplatná aplikace Learn Chinese pro platformu iOS společnosti Apple.

Cílem této aplikace je vyřešit problém, který důvěrně zná každý, kdo se učí cizí jazyk a strávil nespočet hodin nasloucháním učitelům v přeplněných učebnách, sledováním

videí pro výuku jazyků v domácím prostředí nebo procházením spousty kartiček určených k osvojení slovní zásoby a gramatiky – pocit žalostně malé připravenosti pro skutečné konverzace s rodilými mluvčími.

„Možná se domníváte, že umíte čínsky, ale když potkáte Číňana a chcete hovořit čínsky, nebudete toho schopni, pokud jste čínštinu neprocvičovali,“ vysvětlil Yan Xia, vedoucí týmu vývoje ze společnosti Microsoft Research Asia, která sídlí v Pekingu. „Naše aplikace řeší tento problém využitím technologie rozpoznávání řeči.“ „Aplikace je podobná asistentovi učitele,“ uvedl Frank Soong, hlavní výzkumný pracovník a vedoucí skupiny pro výzkum řeči pekingské laboratoře, která vyvinula modely strojového učení využívané aplikací Learn Chinese, stejně jako chatovacího robota Xiaoying pro výuku angličtiny. Toho laboratoř nasadila v roce 2016 na platformě WeChat v Číně.

„Naše aplikace není náhradou za dobrého skutečného učitele,“ uvedl Soong. „Ale může pomoci svou trvalou dostupností, když má příslušný jedinec chuť nebo čas si procvičovat.“

Technologie výuky jazyků spoléhají na sadu nástrojů umělé inteligence, jako jsou hluboké neuronové sítě, které Soongova skupina vyladila tak, aby rozpoznaly, co se osoby učící se jazyk snaží říci, a dokázaly vyhodnotit jejich výslovnost, rytmus a tón. Nástroje jsou založené na porovnávání s modely, které byly vytvořené na základě dat od rodilých mluvčích, a také na nejmodernější technologii převodu textu na mluvené slovo.

Jedinci, kteří aplikaci používají, získají zpětnou vazbu ve formě skóre, společně se zvýrazněnými slovy, u nichž se potřebují zdokonalit, a odkazy na zvukové ukázky, aby si mohli poslechnout správnou výslovnost. „Aplikace s vámi bude spolupracovat jako partner pro výuku jazyků,“ uvedl Xia. „Bude vám odpovídat a poskytovat zpětnou vazbu na základě toho, co řeknete.“

Olivier Fontana, výzkumný pracovník společnosti Microsoft (fotografie: Dan DeLong)

Dosažení dalších míst

Aplikace Learn Chinese a stěžejní služby Microsoftu pro jazykové překlady využívají cloudovou strojovou inteligenci. To lidem umožňuje flexibilně a pohodlně přistupovat k těmto službám z libovolného místa poskytujícího připojení k internetu, jako jsou autobusové zastávky, restaurace nebo konferenční centra.

Pro klienty, kteří potřebují překládat vysoce důvěrný obsah nebo vyžadují překladové služby na místech, kde není dostupné připojení k internetu, Microsoft nyní nabízí překlady využívající neuronové sítě pro místní servery. Podle Fontany je tento vývoj dalším příkladem, jak rozmach umělé inteligence postupuje a zasahuje stále více míst a stále více jazyků.

Článek byl převzat z anglického originálu.