Google Neurális gépi fordítás

A Google Neural Machine Translation  (GNMT)  a Google által kifejlesztett és 2016 novemberében bevezetett neurális gépi fordítási (NMT) rendszer, amely mesterséges neurális hálózatot használ a  fordítási gördülékenység és a Google Fordító pontosságának javítására . [1] [2] [3]

A GNMT a fordítás minőségét javítja a példaalapú gépi fordítás ( EBMT) használatával, amelyben a rendszer „több millió példából tanul”. [2] A javasolt GNMT rendszertanulási architektúrát először több mint száz nyelven tesztelték a Google Fordító által támogatott nyelven. [2] A nagy végpontok közötti struktúra miatt a rendszer idővel megtanulja, hogy jobb és természetesebb fordításokat készítsen. [1] A GNMT egész mondatokat képes lefordítani, nem részeket. [1] A GNMT hálózat nyelvközi gépi fordítást tud végrehajtani úgy , hogy egy mondat szemantikáját kódolja az egyes kifejezések fordításainak memorizálása helyett. [2] [4]

Történelem

A Google Brain projektet 2011-ben a "Google X titkos kutatólaboratóriumában" [5] hozta létre Jeff Dean , a Google egyik alkalmazottja, Greg Corrado, a Google kutatója és Andrew Ng , a Stanford Egyetem informatikai professzora . [6] [7] [8] Eun munkája volt az egyik legnagyobb technológiai áttörés alapja a Google-nál és a Stanfordnál. [5]

2016 szeptemberében a Google kutatócsoportja bejelentette a GNMT fordítórendszer fejlesztését, novemberre pedig a Google Translate a korábbi statisztikai módszerek (SMT) helyett a neurális gépi fordítást (NMT) kezdte használni [1] [9] [10] [ 11] , amelyet 2007 októbere óta használunk saját zárt SMT rendszerünkön belül. [12] [13]

A Google Fordítón belüli NMT rendszer egy nagy mesterséges neurális hálózatot használ, amely alkalmas a mély tanulásra . [1] [2] [3] Példák millióinak vizsgálatával a GNMT javítja a fordítás minőségét azáltal, hogy szélesebb kontextust használ a legmegfelelőbb fordításra. Az eredményt ezután átrendezik és hozzáigazítják az emberi nyelv nyelvtanához. A GNMT nem alkotta meg saját belső univerzális nyelvét, sokkal inkább arra törekedett, hogy sok nyelv között közös vonásokat találjon, amelyek inkább a pszichológusokat és nyelvészeket kell, hogy érdekeljék, mint az informatikusokat. [14] Mindkét irányban kilenc nyelvre új fordítómotor került beépítésre: angol, francia, német, spanyol, portugál, kínai, japán, koreai és török ​​2016-ban. [15] 2017 márciusában további három nyelv került hozzáadásra: orosz, hindi és vietnami. [16] Ugyanebben a hónapban a Google Fordító közösség segítségével hozzáadták a héber és az arab nyelv támogatását. [17] 2017. április végén további támogatást nyújtottak kilenc indiai nyelvhez, nevezetesen a hindi, bengáli, marathi, gudzsaráti, pandzsábi, tamil, telugu, malajálam és kannada számára. [tizennyolc]

A GNMT által támogatott nyelvek

Az alábbiakban felsoroljuk azokat a nyelvpárokat, amelyek a Google Neural Machine Translation (NMT) modelljét használják a fordításhoz. 2017 júliusától minden nyelven csak az angolra és angolról történő fordítás támogatott: [19]

nyelvpár Nyelvi kódok
egy afrikaans <-> angol af<->en
2 arab <-> angol ar<->en
3 bolgár <-> angol bg<->en
négy kínai (egyszerűsítve) <-> angol zh-CN <->en
5 kínai (hagyományos) <-> angol zh-TW<->en
6 horvát <-> angol hr<->en
7 cseh <-> angol cs<->en
nyolc dán <-> angol da<->en
9 holland <-> angol nl<->en
tíz francia <-> angol fr<->en
tizenegy német <-> angol de<->en
12 görög <-> angol el<->en
13 héber <-> angol iw<->en
tizennégy hindi <-> angol hi<->en
tizenöt izlandi <-> angol is<->en
16 indonéz <-> angol id<->en
17 olasz <-> angol it<->en
tizennyolc japán <-> angol ja<->en
19 Koreai <-> angol ko<->en
húsz norvég <-> angol no<->en
21 lengyel <-> angol pl<->en
22 portugál <-> angol pt<->en
23 román <-> angol ro<->en
24 orosz <-> angol ru<->en
25 szlovák <-> angol sk<->en
26 spanyol <-> angol es<->en
27 svéd <-> angol sv<->en
28 thai <-> angol th<->en
29 török ​​<-> angol tr<->en
harminc vietnami <-> angol vi<->en

Közvetlen fordítás

A GNMT rendszerről azt mondják, hogy felülmúlja a Google Fordító előző verzióját, mivel képes „közvetlen fordítást” végezni, pl. közvetlenül fordíthat egyik nyelvről a másikra (például japánról koreaira). [2] Korábban a Google Fordító először a forrásnyelvről fordított angolra, majd angolról a célnyelvre , ahelyett, hogy közvetlenül fordított volna egyik nyelvről a másikra. [négy]

Lásd még

Linkek

  1. 1 2 3 4 5 Barak Turovsky (2016. november 15.), Fordításban található: Pontosabb, gördülékenyebb mondatok a Google Fordítóban , < https://blog.google/products/translate/found-translation-more-accurate-fluent -sentences-google-translate/ > . Letöltve: 2017. január 11. Archiválva : 2017. április 7. a Wayback Machine -nél 
  2. 1 2 3 4 5 6 Mike Schuster, Melvin Johnson és Nikhil Thorat (2016. november 22.), Zero-Shot Translation a Google többnyelvű neurális gépi fordítórendszerével , < https://research.googleblog.com/2016/11/ zero-shot-translation-with-googles.html > . Letöltve: 2017. január 11. Archiválva : 2017. július 10. a Wayback Machine -nél 
  3. 1 2 Gil Fewster (2017. január 5.), A Google elképesztő mesterséges intelligencia-bejelentése, amelyet valószínűleg elmulasztottál that-you-probably-missed-2ffd31334805#.msj1mdvbh > . Letöltve: 2017. január 11. Archiválva : 2017. május 31. a Wayback Machine -nél 
  4. 12 Boitet , Christian; Blanchon, Herve; Seligman, Mark; Bellynck, Valérie MT a weben és a weben (PDF)  (hivatkozás nem elérhető) (2010). Hozzáférés időpontja: 2016. december 1. Az eredetiből archiválva : 2017. március 29.
  5. 1 2 Robert D. Hof. Egy kínai internetes óriás álmodozni kezd: a Baidu az online élet egyik eleme Kínában, de globális hatalommá akar válni. Segíthet-e a világ egyik vezető mesterséges intelligenciakutatója a Szilícium-völgy legnagyobb vállalatainak kihívásában? . Technológiai Szemle (2014. augusztus 14.). Letöltve: 2017. január 11. Az eredetiből archiválva : 2020. január 8..
  6. Nagyszabású agyi szimulációk használata gépi tanuláshoz és mesterséges intelligenciához . Hivatalos Google Blog (2012. június 26.). Letöltve: 2015. január 26. Az eredetiből archiválva : 2020. augusztus 23.
  7. A Google nagyszabású mély neurális hálózatok projektje . Letöltve: 2015. október 25. Az eredetiből archiválva : 2019. február 16.
  8. Markoff, John Hány számítógép azonosítja a macskát? 16 000 . New York Times (2012. június 25.). Hozzáférés időpontja: 2014. február 11. Az eredetiből archiválva : 2017. május 9.
  9. Katyanna Quach (2016. november 17.), a Google neurális hálózata megtanulja lefordítani azokat a nyelveket, amelyekre nem képezték ki: A gépi fordítás először használt valódi transzfer tanulást , < https://www.theregister.co.uk/ 2016/ 11/17/googles_neural_net_translates_languages_not_traained_on > . Letöltve: 2017. január 11. Archiválva : 2017. szeptember 22. a Wayback Machine -nél 
  10. Lewis-Kraus, Gideon . The Great Awakening , The New York Times  (2016. december 14.). Archiválva az eredetiből 2017. május 5-én. Letöltve: 2017. január 11.
  11. Le, Quoc; Schuster, Mike Neurális hálózat gépi fordításhoz, termelési léptékben . Google kutatási blog . Google (2016. szeptember 27.). Letöltve: 2016. december 1. Az eredetiből archiválva : 2018. május 7..
  12. A Google átvált saját fordítórendszerére, archiválva : 2017. április 29. a Wayback Machine -nél , 2007. október 22.
  13. Barry Schwartz. Google Translate Drops SYSTRAN házi készítésű fordításhoz . Search Engine Land (2007. október 23.). Letöltve: 2017. május 4. Az eredetiből archiválva : 2017. május 21..
  14. Chris McDonald (2017. január 7.), kommentálja Gil Fewster január 5-i cikkét az Atlanti -óceánban , < https://medium.com/@chrismcdonald_94568/ok-slow-down-516f93f83ac8#.l0ti3ct0b > . Letöltve: 2017. január 11. Archiválva : 2017. június 22. a Wayback Machine -nél 
  15. Turovsky, Barak Fordításban található: Pontosabb, gördülékenyebb mondatok a Google Fordítóban . A Kulcsszó Google Blog . Google (2016. november 15.). Letöltve: 2016. december 1. Az eredetiből archiválva : 2020. április 14.
  16. Turovsky, Barak Jobb minőségű neurális fordítások még egy csomó nyelvre . A Kulcsszó Google Blog . Google. Letöltve: 2017. március 6. Az eredetiből archiválva : 2017. március 7..
  17. Novet, Jordánia A Google mostantól mesterségesintelligencia-alapú fordításokat biztosít arab és héber nyelvekre . Venture Beat (2017. március 30.). Az eredetiből archiválva : 2020. január 1.
  18. Turovsky, Barak Az internet befogadóbbá tétele Indiában . A kulcsszó (2017. április 25.). Archiválva : 2020. november 11.
  19. Fordító API nyelvi támogatás . Google Cloud Platform (2017. május 4.). Archiválva az eredetiből 2017. szeptember 16-án.

Külső linkek