Transzformáció alapú gépi fordítás

Az átalakítás alapú gépi fordítás a gépi fordítás (MT) egyik fajtája . Jelenleg ez az egyik legszélesebb körben használt gépi fordítási módszer. A direkt MT egyszerűbb modelljétől eltérően a transzformáció alapú MT három szakaszra osztja a fordítási folyamatot: a forrásnyelvi szöveg elemzése annak grammatikai szerkezetének meghatározására, az így kapott szerkezet fordítása a célnyelvi szöveg előállítására alkalmas szerkezetté, ill. szöveggenerálás. Így a transzformáció alapú MT rendszerek képesek a forrásnyelv és a célnyelv ismereteit felhasználni [1] .

Eszköz

A transzformáció alapú fordítás és a nyelvközi gépi fordítás ugyanazon az elgondoláson alapul, amely szerint a fordításhoz köztes reprezentáció beszerzése szükséges. Ezzel rögzítheti az eredeti mondat jelentését, hogy aztán a megfelelő fordítást készíthesse. A többnyelvű MT-ben az ilyen köztes reprezentációnak függetlennek kell lennie mind a forrásnyelvtől, mind a célnyelvtől, míg az átvitelen alapuló MT esetében bizonyos fokú függés mutatkozik egy adott nyelvpártól. A transzformációs alapú MT-rendszerek működési módjai jelentősen eltérnek, de általában ugyanazt a mintát követik: nyelvi szabályokat alkalmaznak, amelyeket a forrásnyelv és a célnyelv szerkezete közötti megfelelések határoznak meg. Az első szakasz a bemeneti szöveg morfológiai és szintaxis (néha szemantika ) elemzését foglalja magában, hogy egy köztes reprezentációt hozzon létre. Az így kapott reprezentációból kétnyelvű szótárak és nyelvtani szerkesztési szabályok segítségével fordítás készül. Ez a stratégia lehetővé teszi, hogy kellően jó minőségű fordítást kapjon az eredeti körülbelül 90%-ának megfelelő pontossággal (a pontosság azonban nagymértékben függ egy adott nyelvpártól, és két konkrét nyelv közelségi foka határozza meg).

Fordítási folyamat

A szabályalapú MT-rendszerben a forrásszöveget először morfológiai és szintaxis szempontjából elemzik a szintaktikai reprezentáció elérése érdekében. A jövőben ez a prezentáció kevésbé specifikált, mivel fokozott figyelmet kell fordítani a legjelentősebb fordítási töredékekre, miközben figyelmen kívül kell hagyni az egyéb típusú információkat. Az átalakítási folyamat során a végső (a forrásnyelvben még létező) reprezentáció a célnyelv azonos szintű példányosítási reprezentációjává alakul. Ezt a két nézetet köztes nézetnek nevezzük . A célnyelvi reprezentáció kész szöveggé alakításának folyamata hasonló, fordított sorrendben végrehajtott lépésekből áll.

Elemzés és transzformáció

A végső eredmény megszerzése előtt lehetőség van különféle elemzési és átalakítási módszerekhez folyamodni. A statisztikai megközelítésekkel együtt növelhető a generáló hibrid rendszerek száma. A kiválasztott módszerek és prioritások nagymértékben magától a rendszer kialakításától függenek. A legtöbb létező rendszer azonban legalább a következő lépéseket tartalmazza:

Transzformációk típusai

A transzformációs alapú MT rendszerek egyik fő jellemzője az a szakasz, amelyben a forrásnyelvi szöveg köztes reprezentációja a célnyelvi szöveg köztes reprezentációjává válik. Ez a folyamat a nyelvi elemzés egyik szintjén vagy a közöttük lévő intervallumban mehet végbe. A szintek az alábbiakban láthatók:

Lásd még

Jegyzetek

  1. Jurafsky, Daniel; Martin, James H. (2009). Beszéd- és nyelvfeldolgozás. Pearson. pp. 906-908.