A strukturális előrejelzés vagy a strukturális tanulás a felügyelt gépi tanulási technikák gyűjtőfogalma , amely magában foglalja a szerkezeti objektumok előrejelzését.
Csakúgy, mint a felügyelt tanulási technikák, a strukturális előrejelzési modellek a megfigyelt adatokon készülnek, ahol a valós előrejelzett értéket használják a modell paramétereinek vizsgálatára. A modell lehetséges összetettsége és az előrejelzett változók kapcsolata miatt a modelltanulást alkalmazó előrejelzési folyamat gyakran számításilag nem kivitelezhető, ezért közelítő következtetéseket alkalmaznak .
Például egy természetes nyelvű mondat szintaktikai reprezentációvá, például elemzőfává való fordításának problémája strukturális előrejelzési problémaként fogható fel, amelyben a strukturális következtetési tartomány az összes lehetséges elemző fa halmaza. A strukturális előrejelzést számos alkalmazásban használják, beleértve a bioinformatikát , a természetes nyelvi feldolgozást , a beszédfelismerést és a számítógépes látást .
A szekvenciajelölés a természetes nyelvi feldolgozásban széles körben elterjedt feladatok osztálya . A bennük lévő bemeneti adatok gyakran sorozatok (például mondatok a szövegben). Egyes verziókban szükségessé válik az ilyen sorozatok jelölése, például a beszédrészek jelölése és a megnevezett entitások felismerése . A részleges jelölésben például a sorozat minden szavának kapnia kell egy " címkét " (címkeosztályt), amely kifejezi a szó " típusát ":
Ez | DT |
van | GL |
a | DT |
megjelölt | IP |
mondat | IP |
A szekvenciák címkézési problémájának fő célja egy fogalom (a sorozat eleme) helyes meghatározása több, megfelelő érték jelenlétében. Például az angol "sentence" szó főnévként és igeként is kezelhető. A helyes előrejelzés érdekében egy szóhoz osztálycímkét ("címke") kell rendelni.
A fent leírt probléma első pillantásra megoldható az egyes elemek egyszerű osztályozásával , de ez a megközelítés nem veszi figyelembe azt az empirikus tényt, hogy a címkék nem keletkeznek önállóan. Éppen ellenkezőleg, mindegyik címke erős feltételes függőséget mutat az előző szavak címkéjétől. Vagyis, hogy melyik címkén található például a "mondat" szó - ige vagy melléknév -, a mondatban lévő többi szó címkéje függ. Ez a tény felhasználható olyan modellekben, amelyek megjósolják a mondat teljes címkéinek sorozatát, mint például egy rejtett Markov-modell vagy egy feltételes véletlenmező [1] . Az egyedi címkéket, például a Viterbi algoritmust használó modelleknél ez a módszer nem megfelelő.
A gráfvalószínűségi modellek a strukturális előrejelzési modellek nagy csoportját alkotják . Különösen a Bayes-hálózatok és a véletlenszerű mezők népszerűek . A szerkezeti előrejelzés egyéb algoritmusai és modelljei közé tartozik az induktív logikai programozás , az esetalapú gondolkodás , a strukturális támogató vektorgépek , a Markov logikai hálózatok és a kényszerített feltételes modellek . Alapvető technikák:
Az általános szerkezeti előrejelző algoritmusok megértésének egyik legegyszerűbb módja a Collins Structural Perceptron [2] . Ez az algoritmus kombinálja a lineáris osztályozók betanítására szolgáló perceptron algoritmust egy következtetési algoritmussal (klasszikusan a Viterbi algoritmussal , ha soros adatokhoz használják), és absztrakt módon a következőképpen írható le:
Definiálunk egy Φ( x , y ) „együttes jellemző függvényt”, amely leképezi az x képzési tételt és a megjósolt y jelöltet egy n hosszúságú vektorba . Ebben az esetben x és y bármilyen szerkezetű lehet, és n értéke a feladattól függ, de minden modellnél fix. Legyen GEN egy függvény, amely prediktorjelöltet generál. Akkor:
Legyen n hosszúságú súlyvektor Előre meghatározott számú iterációhoz: A valódi következtetés képzési halmaz minden egyes példányához : Jóslat készítése Frissítés , tól : ig a tanulási sebesség.A gyakorlatban az Argmax bekapcsolása történhet egy algoritmussal, például a Viterbi algoritmussal vagy a max-sum algoritmussal , nem pedig exponenciálisan nagy jelölthalmazra kiterjedő kereséssel .
A tanulás gondolata hasonló egy perceptronhoz, sok osztályban .
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|