A Google Neural Machine Translation (GNMT) a Google által kifejlesztett és 2016 novemberében bevezetett neurális gépi fordítási (NMT) rendszer, amely mesterséges neurális hálózatot használ a fordítási gördülékenység és a Google Fordító pontosságának javítására . [1] [2] [3]
A GNMT a fordítás minőségét javítja a példaalapú gépi fordítás ( EBMT) használatával, amelyben a rendszer „több millió példából tanul”. [2] A javasolt GNMT rendszertanulási architektúrát először több mint száz nyelven tesztelték a Google Fordító által támogatott nyelven. [2] A nagy végpontok közötti struktúra miatt a rendszer idővel megtanulja, hogy jobb és természetesebb fordításokat készítsen. [1] A GNMT egész mondatokat képes lefordítani, nem részeket. [1] A GNMT hálózat nyelvközi gépi fordítást tud végrehajtani úgy , hogy egy mondat szemantikáját kódolja az egyes kifejezések fordításainak memorizálása helyett. [2] [4]
A Google Brain projektet 2011-ben a "Google X titkos kutatólaboratóriumában" [5] hozta létre Jeff Dean , a Google egyik alkalmazottja, Greg Corrado, a Google kutatója és Andrew Ng , a Stanford Egyetem informatikai professzora . [6] [7] [8] Eun munkája volt az egyik legnagyobb technológiai áttörés alapja a Google-nál és a Stanfordnál. [5]
2016 szeptemberében a Google kutatócsoportja bejelentette a GNMT fordítórendszer fejlesztését, novemberre pedig a Google Translate a korábbi statisztikai módszerek (SMT) helyett a neurális gépi fordítást (NMT) kezdte használni [1] [9] [10] [ 11] , amelyet 2007 októbere óta használunk saját zárt SMT rendszerünkön belül. [12] [13]
A Google Fordítón belüli NMT rendszer egy nagy mesterséges neurális hálózatot használ, amely alkalmas a mély tanulásra . [1] [2] [3] Példák millióinak vizsgálatával a GNMT javítja a fordítás minőségét azáltal, hogy szélesebb kontextust használ a legmegfelelőbb fordításra. Az eredményt ezután átrendezik és hozzáigazítják az emberi nyelv nyelvtanához. A GNMT nem alkotta meg saját belső univerzális nyelvét, sokkal inkább arra törekedett, hogy sok nyelv között közös vonásokat találjon, amelyek inkább a pszichológusokat és nyelvészeket kell, hogy érdekeljék, mint az informatikusokat. [14] Mindkét irányban kilenc nyelvre új fordítómotor került beépítésre: angol, francia, német, spanyol, portugál, kínai, japán, koreai és török 2016-ban. [15] 2017 márciusában további három nyelv került hozzáadásra: orosz, hindi és vietnami. [16] Ugyanebben a hónapban a Google Fordító közösség segítségével hozzáadták a héber és az arab nyelv támogatását. [17] 2017. április végén további támogatást nyújtottak kilenc indiai nyelvhez, nevezetesen a hindi, bengáli, marathi, gudzsaráti, pandzsábi, tamil, telugu, malajálam és kannada számára. [tizennyolc]
Az alábbiakban felsoroljuk azokat a nyelvpárokat, amelyek a Google Neural Machine Translation (NMT) modelljét használják a fordításhoz. 2017 júliusától minden nyelven csak az angolra és angolról történő fordítás támogatott: [19]
nyelvpár | Nyelvi kódok | |
---|---|---|
egy | afrikaans <-> angol | af<->en |
2 | arab <-> angol | ar<->en |
3 | bolgár <-> angol | bg<->en |
négy | kínai (egyszerűsítve) <-> angol | zh-CN <->en |
5 | kínai (hagyományos) <-> angol | zh-TW<->en |
6 | horvát <-> angol | hr<->en |
7 | cseh <-> angol | cs<->en |
nyolc | dán <-> angol | da<->en |
9 | holland <-> angol | nl<->en |
tíz | francia <-> angol | fr<->en |
tizenegy | német <-> angol | de<->en |
12 | görög <-> angol | el<->en |
13 | héber <-> angol | iw<->en |
tizennégy | hindi <-> angol | hi<->en |
tizenöt | izlandi <-> angol | is<->en |
16 | indonéz <-> angol | id<->en |
17 | olasz <-> angol | it<->en |
tizennyolc | japán <-> angol | ja<->en |
19 | Koreai <-> angol | ko<->en |
húsz | norvég <-> angol | no<->en |
21 | lengyel <-> angol | pl<->en |
22 | portugál <-> angol | pt<->en |
23 | román <-> angol | ro<->en |
24 | orosz <-> angol | ru<->en |
25 | szlovák <-> angol | sk<->en |
26 | spanyol <-> angol | es<->en |
27 | svéd <-> angol | sv<->en |
28 | thai <-> angol | th<->en |
29 | török <-> angol | tr<->en |
harminc | vietnami <-> angol | vi<->en |
A GNMT rendszerről azt mondják, hogy felülmúlja a Google Fordító előző verzióját, mivel képes „közvetlen fordítást” végezni, pl. közvetlenül fordíthat egyik nyelvről a másikra (például japánról koreaira). [2] Korábban a Google Fordító először a forrásnyelvről fordított angolra, majd angolról a célnyelvre , ahelyett, hogy közvetlenül fordított volna egyik nyelvről a másikra. [négy]
A gépi fordítás megközelítései | |
---|---|
|
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |