Az automatikus absztrahálás, annotálás vagy összegzés egy szöveges dokumentum rövid változatának ( absztrakt , annotáció ) létrehozása számítógépes program segítségével.
Az automatikus hivatkozással kapcsolatos első munkát G. P. Lun amerikai tudós végezte 1958-ban az angol nyelv anyagán. [1] [2] [3] Az extraktív absztrakció elveit J. Salton fogalmazta meg az 50-es évek végén és a 60-as évek elején. [2] [4]
A Szovjetunióban az automatikus hivatkozások úttörői V. E. Berzon, I. P. Sevbo , E. F. Skorokhodko , D. G. Lakhuti , R. G. Piotrovszkij és mások voltak [5] [2]
Az automatikus hivatkozásnak két fő megközelítése van: kivonás (kivonás, felületes) és generálás (absztrakció, mély). [6] [1] [5] [2]
A forrásszövegből kerülnek kiválasztásra a legfontosabb kifejezések, mondatok vagy bekezdések, amelyek összessége egy bizonyos kivonatot, kvázi absztraktot alkot. [5] Ebben az esetben ezeket a töredékeket nem feldolgozzák, hanem a forrásszövegben megadott sorrendben és formában kivonják. [6]
A megközelítés előnyei: a tantárgyi területtől való függetlenség, a fejlesztés viszonylagos könnyűsége. [1] Hátrányok: inkoherens eredmény. [egy]
A generáló módszerek a természetes nyelvi feldolgozás vagy a mesterséges intelligencia módszerek nyelvi szabályain alapulnak. [6] Lényegesen általánosítják a forrásdokumentumot, olyan szöveget hozva létre, amely nem kifejezetten szerepel benne. [6]
A megközelítés előnyei: az eredmény legjobb minősége. [1] Hátrányok: a gyakorlati megvalósítás bonyolultsága, nagy mennyiségű nyelvi tudás összegyűjtésének szükségessége. [egy]
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |