Tanulás tanárral

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. április 12-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A felügyelt tanulás a gépi tanulás egyik módszere , melynek során a vizsgált rendszert inger-válasz példák segítségével tanulásra kényszerítik. A kibernetika szempontjából a kibernetikai kísérletek egyik fajtája . Valamilyen kapcsolat lehet a bemenetek és a referenciakimenetek között (inger-válasz), de ez nem ismert. A precedenseknek csak véges halmaza ismert – „inger-válasz” párok, az úgynevezett képzési minta . Ezen adatok alapján szükséges a függőség helyreállítása (előrejelzésre alkalmas inger-válasz kapcsolatok modelljének felépítése), azaz olyan algoritmus felépítése, amely bármely objektumra elég pontos választ tud adni. A válaszok pontosságának mérésére, valamint a példákon keresztüli tanulás során bevezethető egy minőségi függvény .

A kísérlet felállításának elve

Ez a kísérlet egy speciális esete egy visszacsatolásos kibernetikai kísérletnek. Ennek a kísérletnek a felállítása feltételezi egy kísérleti rendszer, egy betanítási módszer, valamint a rendszer tesztelésére vagy a jellemzők mérésére szolgáló módszer meglétét.

A kísérleti rendszer pedig a tesztelt (használt) rendszerből, a külső környezetből kapott ingerek teréből és az erősítésvezérlő rendszerből (belső paraméterek szabályozója) áll. Erősítésvezérlő rendszerként használható automata vezérlőberendezés (pl. termosztát) vagy emberi kezelő (tanár), amely speciális, állapotváltoztató erősítési szabályok alkalmazásával képes reagálni a vizsgált rendszer reakcióira és a környezeti ingerekre. a rendszer memóriájából.

Két lehetőség van: (1) amikor a vizsgált rendszer reakciója nem változtatja meg a környezet állapotát, és (2) amikor a rendszer válasza megváltoztatja a környezet ingereit. Ezek a sémák egy ilyen általános rendszer alapvető hasonlóságát jelzik a biológiai idegrendszerrel.

A felügyelt tanulási feladatok tipológiája

Bemeneti adattípusok

A tájékoztató jellegű leírás a leggyakoribb eset. Minden objektumot jellemzőinek halmaza ír le, amelyeket jellemzőknek nevezünk . A jellemzők lehetnek numerikusak vagy nem numerikusak.
Az objektumok közötti távolságmátrix . Minden objektumot a betanítási mintában szereplő többi objektumtól mért távolságok írnak le. Kevés módszer működik ilyen típusú bemenettel, különösen a k legközelebbi szomszéd metódus , a Parzen ablak metódus és a potenciálfüggvény metódus .
Az idősor vagy jel mérések sorozata az idő függvényében. Minden dimenzió ábrázolható számmal, vektorral, és általános esetben a vizsgált objektum adott időpontban jelzésértékű leírásával.
Kép vagy videó sorozat .
Vannak bonyolultabb esetek is, amikor a bemeneti adatok grafikonok , szövegek, adatbázislekérdezési eredmények stb. formájában jelennek meg. Általában az adatok előfeldolgozásával és jellemzők kinyerésével az első vagy a második esetre redukálódnak .

Választípusok

Ha a lehetséges válaszok halmaza végtelen (a válaszok valós számok vagy vektorok), akkor regressziós és közelítési problémákról beszélünk ;
Ha a lehetséges válaszok halmaza véges, az osztályozás és a mintafelismerés problémáiról beszélünk ;
Amikor a válaszok egy folyamat vagy jelenség jövőbeli viselkedését jellemzik, előrejelzési feladatokról beszélünk .

A megerősítést irányító rendszerek degenerált típusai ("tanárok")

A reakcióvezérelt megerősítési rendszerre ( R jelentése irányított rendszer ) az a jellemző, hogy a külső környezetből a megerősítési rendszer felé vezető információs csatorna nem működik. Ez a rendszer a vezérlőrendszer jelenléte ellenére spontán tanulásra utal , mivel a tesztelt rendszer autonóm módon tanul, csak a kimenőjeleinek hatására, függetlenül azok „helyességétől”. Ezzel a tanulási módszerrel nincs szükség külső információra a memória állapotváltozásának szabályozásához;
Erősítő rendszer ösztönző vezérléssel ( S - control system ) - az a tény, hogy a vizsgált rendszertől a merevítőrendszer felé vezető információs csatorna nem működik. A tesztelt rendszer kimeneteiből származó nem működő csatorna ellenére felügyelt tanulásra utal, hiszen ebben az esetben a megerősítő rendszer (a tanár) arra kényszeríti a vizsgált rendszert, hogy egy bizonyos szabály szerint reakciókat produkáljon, igaz reakciók jelenléte ellenére. a tesztelt rendszer nem veszi figyelembe.

Ez a megkülönböztetés lehetővé teszi a különböző tanulási módok közötti különbségek mélyebb megtekintését, mivel a felügyelt és a nem felügyelt tanulás közötti határ finomabb. Ezen túlmenően egy ilyen különbség lehetővé tette bizonyos korlátok kimutatását a mesterséges neurális hálózatok számára S és R-vezérelt rendszerek esetén (lásd Perceptron konvergencia tétel ).

Lásd még

Irodalom

Rosenblatt, F. A neurodinamika alapelvei : Perceptronok és az agymechanizmusok elmélete. - M . : Mir, 1965. - 480 p. Archiválva: 2015. május 21. aWayback Machine

Wasserman, F. Neurocomputer Engineering: Theory and Practice = Neural Computing. elmélet és gyakorlat. — M .: Mir, 1992. — 240 p. — ISBN 5-03-002115-9 . Archivált : 2009. június 30. a Wayback Machine -nél

Gépi tanulás és adatbányászat
Feladatok	Osztályozási feladat Tanulás tanár nélkül Tanár által segített tanulás Regresszió analízis AutoML Egyesületi szabályzat Funkció kivonás Tulajdonságok képzése Rangsorképzés Nyelvtani levezetés Online tanulás
Tanulás tanárral	k-legközelebbi szomszéd módszer Naiv Bayes osztályozó döntési fa Támogatja a vektoros gépet Lineáris regresszió Logisztikus regresszió perceptron Modellegyüttesek Zsákolás fellendítése véletlenszerű erdő Releváns vektoros módszer
klaszteranalízis	k-módszer Fuzzy klaszterezési módszer Hierarchikus klaszterezés EM algoritmus NYÍR GYÓGYMÓD DBSCAN OPTIKA Átlageltolás
Dimenziócsökkentés	Faktoranalízis Főkomponens módszer CCA ICA LDA Nem negatív mátrix kiterjesztése t-SNE
Strukturális előrejelzés	Grafikon valószínűségi modell Bayesi hálózat Rejtett Markov-modell CRF
Anomália észlelése	k-legközelebbi szomszéd módszer Helyi kibocsátási szint
Grafikon valószínűségi modellek	Bayesi hálózat Markov hálózat Rejtett Markov-modell
Neurális hálózatok	Limitált Boltzmann gép önszerveződő térkép Aktiválási funkció Szigma alakú softmax Radiális bázisfüggvény Hátsó szaporítási módszer Mély tanulás Többrétegű perceptron Ismétlődő neurális hálózat hosszú távú rövid távú memória Ellenőrzött visszatérő blokk Konvolúciós Neurális Hálózat U-háló Autoencoder
Megerősítő tanulás	Markov folyamat Bellman egyenlet Mohó algoritmus Q-learning SARSA Időbeli különbség (TD)
Elmélet	Vapnik-Chervonenkis elmélet Elfogultság-diszperziós dilemma Számítógépes tanuláselmélet Empirikus kockázatminimalizálás Occam tanul PAC tanulás Statisztikai tanuláselmélet
Folyóiratok és konferenciák	NeurIPS ICML ML JMLR ArXiv:cs.LG