A Neural Machine Translation ( NMT) a gépi fordítás olyan megközelítése, amely nagy mesterséges neurális hálózatot használ . Ez különbözik a frázisstatisztikán alapuló gépi fordítási módszerektől , amelyek külön kifejlesztett részösszetevőket használnak [1] .
A Google , a Yandex , a Microsoft és a PROMT [2] fordítói szolgáltatásai már használnak neurális fordítást. A Google a Google Neural Machine Translation -t (GNMT) használja a korábban használt statisztikai módszerek helyett. [3] A Microsoft hasonló technológiát használ a beszédfordításhoz (beleértve a Microsoft Translator és a Skype Translator alkalmazást ). [4] A Harvard Natural Language Processing Group kiadott egy nyílt forráskódú neurális gépi fordítórendszert, az OpenNMT-t [5] . A Yandex.Translate hibrid modellel rendelkezik: mind a statisztikai modell, mind a neurális hálózat saját fordítási lehetőséget kínál. Ezt követően a gépi tanuláson alapuló CatBoost technológia választja ki a kapott eredmények közül a legjobbat [6] .
Az NMT modellek mély tanulást és jellemző tanulást használnak . A hagyományos statisztikai gépi fordítási (SMT) rendszerekhez képest csak kis mennyiségű memóriát igényelnek. Ezenkívül a hagyományos fordítási rendszerekkel ellentétben a neurális fordítási modell minden részét együtt (végpontokig) tanítják a fordítási hatékonyság maximalizálása érdekében [7] [8] [9] .
A kétirányú ismétlődő neurális hálózatot (RNN), más néven kódolót , a neurális hálózat az eredeti mondat kódolására használ egy második visszatérő hálózathoz, amelyet dekódernek is neveznek, és amely a végső nyelven lévő szavak előrejelzésére szolgál [10 ] .
A gépi fordítás megközelítései | |
---|---|
|
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |