Interaktív gépi fordítás

Az interaktív gépi fordítás ( IMT ) a számítógépes fordítás egy speciális részhalmaza . A fordítási paradigma az, hogy a számítógépes szoftver segít a fordítónak azáltal, hogy megpróbálja megjósolni a szöveget, amelyet a felhasználónak be kell írnia, figyelembe véve az összes rendelkezésére álló információt. Ha egy ilyen tippelés helytelen, a rendszer visszajelzést ad a felhasználónak , és az új információ alapján új előrejelzést ad. Ezt a folyamatot addig ismételjük, amíg a fordítás nem felel meg a felhasználó elvárásainak.

Az interaktív gépi fordítás különösen érdekes szövegek fordítása során olyan területeken, ahol a hibás fordítás nem megengedett, ezért emberi felhasználónak kell módosítania a rendszer által biztosított fordítást. Ilyen esetekben az interaktív gépi fordítást továbbfejlesztik, hogy előnyöket biztosítsanak a potenciális felhasználók számára. [1] [2] Azonban nem léteznek olyan kereskedelmi programok , amelyek interaktív gépi fordítást valósítanának meg, és a munka egyelőre az akadémiai kutatások körébe tartozik .

Történelem

Történelmileg az interaktív gépi fordítás a számítógéppel segített fordítási paradigma továbbfejlesztéseként született meg , ahol a fordító és a gépi fordítórendszerek párhuzamosan működnek . [3] Ezt az első munkát a kanadai kormány által finanszírozott TransType kutatási projekt bővítette ki. Ebben a projektben az ember-számítógép interakció a végleges szöveg megszerzését célozta meg a környezetbe átvitt interaktív fordításon alapuló gépi fordítási technikák bevezetésével, hogy mindkét technika legjobb tulajdonságait: az automatikus rendszer hatékonyságát és a egy emberi fordító.

Később az Európai Bizottság által finanszírozott TransType2 [1] [2] nagyobb kutatási projekt folytatta ezt a munkát egy komplett gépi fordítórendszer megvalósításának folyamatban történő elemzésével , azzal a céllal, hogy olyan teljes fordítási hipotéziseket szerezzenek, amelyekre az emberi felhasználó képes. módosítani vagy elfogadni. Ha a felhasználó úgy dönt, hogy megváltoztatja a hipotézist, a rendszer igyekszik a lehető legjobban kihasználni ezt a visszajelzést , hogy a hipotézisnek olyan új fordítását állítsa elő, amely figyelembe veszi a felhasználó által végrehajtott változtatásokat.

A közelmúltban a szintén az Európai Bizottság által finanszírozott CASMACAT [4] a fordítóknak nyújtott új típusú segítség kifejlesztésére és egy szerkesztőből, szerverből, valamint elemző és vizualizációs eszközökből álló új fejlesztői környezetbe való integrálására helyezte a hangsúlyt. A fejlesztői környezet modulárisan lett kialakítva, és kombinálható a meglévő automatizált fordítóeszközökkel. Ezenkívül a CASMACAT keretrendszer tanulhat a fordítóval való interakcióból, azonnal frissíti és javítja modelljeit a felhasználó által választott fordítás alapján. [5] [6]

A közelmúltban végzett, széles körű felhasználók bevonásával végzett munka [7] rávilágított arra, hogy az interaktív gépi fordítást az eredeti nyelvet nem beszélő felhasználók is használhatják a professzionálishoz közeli fordítási minőség elérése érdekében. Ezenkívül azt is sugallja, hogy az interaktív forgatókönyv előnyösebb, mint a klasszikus megjelenés utáni forgatókönyv.

Folyamat

Az interaktív gépi fordítási folyamat azzal kezdődik, hogy a rendszer felkínálja a fordítási hipotézist a felhasználónak. A felhasználó ezután vagy teljes egészében elfogadhatja az ajánlatot, vagy módosíthatja azt, ha úgy véli, hogy hibák vannak benne. Jellemzően egy adott szó megváltoztatásakor azt feltételezik, hogy az adott szó előtti előtag (mondat) helyes, pl. interakciós séma - balról jobbra. Miután a felhasználó megváltoztatta az általa helytelennek tartott szót, a rendszer új utótagot javasol, azaz a mondat többi részét. Ez a folyamat addig folytatódik, amíg a felhasználó elégedett nem lesz a fordítással.

Bár ez a magyarázat szószintű, az előző folyamat karakterszinten is végrehajtható, így a rendszer mindig megadja az utótagot, amikor a fordító egyetlen karaktert ír be. Emellett folyamatos erőfeszítések folynak a tipikus balról jobbra irányú interakciós minta megváltoztatására, hogy megkönnyítsék az ember-gép interakciót . [8] [9]

Hasonló megközelítést alkalmaz a Caitra fordítóeszköz is .

Értékelés

Az értékelés összetett kérdés az interaktív gépi fordításban. Ideális esetben az értékelést a felhasználókkal végzett kísérletek során kell elvégezni. Ez azonban a magas pénzérték miatt azt jelenti, hogy ez ritkán van így. Sőt, még az interaktív gépi fordítási technológiák fordítók általi valós értékelésekor sem világos, hogy mit kell mérni az ilyen kísérletekben, mivel sok különböző változót kell figyelembe venni, és nem lehet ellenőrizni, például az időigényt. hogy a felhasználó hozzászokjon a folyamathoz. A CASMACAT projektben néhány terepvizsgálatot végeztek e változók némelyikének vizsgálatára. [10] [11] [12]

A laboratóriumi környezetben történő gyors kiértékelés érdekében az interaktív gépi fordítást a rendszer a billentyűleütések vagy a beírt szavak számával értékeli ki . Az ilyen kritériumok azt próbálják mérni, hogy hány billentyűleütést vagy felhasználó által beírt szót kell beírni, mielőtt a dokumentum végleges fordítását megkapják. [2]

Különbségek a klasszikus automatizált fordítástól

Bár az interaktív gépi fordítás a számítógéppel segített fordítás egyik részterülete , az utóbbival kapcsolatban tárgyalt fő vonzó tulajdonság az interaktivitás. A klasszikus automatizált fordításban a fordítórendszer legfeljebb egy fordítási hipotézist javasol, majd a felhasználónak meg kell szerkesztenie ezeket a hipotéziseket. Ezzel szemben az interaktív gépi fordítás során a rendszer egy új hipotézis fordítását állítja elő minden alkalommal, amikor a felhasználó interakcióba lép a rendszerrel, azaz minden beírt szó (vagy betű) után.

Lásd még

Jegyzetek

  1. 1 2 Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Lagarda, Antonio L.; Lapalme, Guy; Macklovitch, Elliot; Vidal, Enrique. Emberi interakció a kiváló minőségű gépi fordításhoz  (angol)  // Az ACM kommunikációja  : folyóirat. - 2009. - 1. évf. 52 , sz. 10 . - 135-138 . o . - doi : 10.1145/1562764.1562798 . Archiválva az eredetiből 2011. július 6-án. Archivált másolat (nem elérhető link) . Letöltve: 2016. augusztus 3. Az eredetiből archiválva : 2011. július 6.. 
  2. 1 2 3 Barrachina, Sergio; Bender, Olivér; Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Khadivi, Shahram; Lagarda, Antonio L.; Ney, Hermann; Tomás, Jesús; Vidal, Enrique. Statisztikai megközelítések a számítógéppel segített fordításhoz  //  Számítógépes nyelvészet: folyóirat. - 2009. - 1. évf. 25 , sz. 1 . - P. 3-28 . — doi : 10.1162/coli.2008.07-055-r2-06-29 .
  3. Foster, George; Isabelle, Pierre; Plamondon, Pierre. Célszöveg által közvetített interaktív gépi fordítás  //  Machine Translation : Journal. - 1997. - 1. évf. 12 , sz. 1 . - P. 175-194 . - doi : 10.1023/a:1007999327580 . Archiválva az eredetiből 2020. január 27-én.
  4. Alabau, Vicent; Buck, Christian; Carl, Michael; Casacuberta, Francisco; Garcia-Martinez, Mercedes; Germann, Ulrich; Gonzalez-Rubio, Jézus; Hill, Robin; Koehn, Philipp; Leiva, Lajos; Mesa-Lao, Barto; Ortiz, Daniel; Saint-Amand, Herve; Sanchis, német; Tsoukala, Chara (2014. április). „CASMACAT: Számítógéppel segített fordítási munkaasztal” (PDF) . A Számítógépes Nyelvészeti Szövetség Európai Fejezetének 14. konferenciájának anyaga . Los Angeles, Kalifornia: Számítógépes Nyelvészeti Szövetség. pp. 25-28. Archivált (PDF) az eredetiből ekkor: 2015-04-13 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  5. Ortiz-Martinez, Daniel; Garcia-Varea, Ismael; Casacuberta, Francisco (2010. június). „Online tanulás az interaktív statisztikai gépi fordításhoz” (PDF) . Human Language Technologies: Az ACL észak-amerikai fejezetének 2010-es éves konferenciája . Számítógépes Nyelvészeti Egyesület. pp. 546-554. Archivált (PDF) az eredetiből ekkor: 2010-07-05 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  6. Martinez-Gomez, Pascual; Sanchis Trilles, német; Casacuberta, Francisco. Online adaptációs stratégiák statisztikai gépi fordításhoz utólagos szerkesztési forgatókönyvekben  //  Pattern Recognition : Journal. - Elsevier, 2012. - szeptember ( 45. kötet ). - P. 3193-3203 . - doi : 10.1016/j.patcog.2012.01.011 .
  7. Koehn, Philipp (2010. június). „Egynyelvű fordítók engedélyezése: utószerkesztés vs. Opciók” (PDF) . Humán nyelvi technológiák: A Számítógépes Nyelvészeti Szövetség (HLT/NAACL) észak-amerikai részlegének 2010-es éves konferenciája . Los Angeles, Kalifornia: Számítógépes Nyelvészeti Szövetség. pp. 537-545. Archivált (PDF) az eredetiből ekkor: 2017-08-10 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  8. Sanchis-Trilles, Germán; Ortiz-Martinez, Daniel; Civera, Jorge; Casacuberta, Francisco; Vidal, Enrique; Hoang, Hieu (2008. október). „Interaktív gépi fordítás javítása egérműveletekkel” (PDF) . A természetes nyelvi feldolgozás empirikus módszerei (EMNLP) 2008-as konferenciájának anyaga . Honolulu, Hawaii: Számítógépes Nyelvészeti Szövetség. pp. 485-494. Archivált (PDF) az eredetiből ekkor: 2010-07-05 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  9. González-Rubio, Jesús; Ortiz-Martinez, Daniel; Casacuberta, Francisco (2010. július). „A felhasználói erőfeszítés és a fordítási hiba kiegyensúlyozása az interaktív gépi fordításban megbízhatósági intézkedésekkel” (PDF) . Az ACL 2010 Conference Short Papers (ACL) anyaga . Uppsala, Svédország: Számítógépes Nyelvészeti Szövetség. pp. 173-177. Archivált (PDF) az eredetiből ekkor: 2011-09-30 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  10. Underwood, Nancy; Mesa-Lao, Bartolomé; García-Martínez, Mercedes; Carl, Michael; Alabau, Vicent; González-Rubio, Jesús; Leiva, Lajos; Sanchis-Trilles, német; Ortiz-Martinez, Daniel; Casacuberta, Francisco (2014. május). „Az interaktivitás hatásainak értékelése utószerkesztési munkaasztalon” (PDF) . A Nyelvi Erőforrások és Értékelési Konferencia (LREC) 29. kiadásának anyaga . Reykjavík, Izland. pp. 553-559. Archivált (PDF) az eredetiből ekkor: 2016-03-04 . Letöltve: 2016-08-03 . Elavult használt paraméter |deadlink=( súgó )
  11. Ortiz-Martinez, Daniel; González-Rubio, Jesús; Alabau, Vicent; Sanchis-Trilles, német; Casacuberta, Francisco. Online és aktív tanulás integrálása számítógéppel segített fordítási munkaasztalon // Új irányok az empirikus fordítási folyamatkutatásban : A CRITT TPR-DB feltárása  . — Springer, 2015. - P. 54-73.
  12. Alabau, Vicent; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Mesa-Lao, Bartolomé; Ortiz-Martinez, Daniel; González-Rubio, Jesús; Sanchis-Trilles, német; Schaeffer, Moritz. Haladó utószerkesztés tanulása // Új irányok az empirikus fordítási folyamatkutatásban : A CRITT TPR-DB feltárása  . — Springer, 2015. - P. 95-111.

Külső linkek