A felügyelt tanulás a gépi tanulás egyik módszere , melynek során a vizsgált rendszert inger-válasz példák segítségével tanulásra kényszerítik. A kibernetika szempontjából a kibernetikai kísérletek egyik fajtája . Valamilyen kapcsolat lehet a bemenetek és a referenciakimenetek között (inger-válasz), de ez nem ismert. A precedenseknek csak véges halmaza ismert – „inger-válasz” párok, az úgynevezett képzési minta. Ezen adatok alapján szükséges a függőség helyreállítása (előrejelzésre alkalmas inger-válasz kapcsolatok modelljének felépítése), azaz olyan algoritmus felépítése, amely bármely objektumra elég pontos választ tud adni. A válaszok pontosságának mérésére, valamint a példákon keresztüli tanulás során bevezethető egy minőségi függvény .
Ez a kísérlet egy speciális esete egy visszacsatolásos kibernetikai kísérletnek. Ennek a kísérletnek a felállítása feltételezi egy kísérleti rendszer, egy betanítási módszer, valamint a rendszer tesztelésére vagy a jellemzők mérésére szolgáló módszer meglétét.
A kísérleti rendszer pedig a tesztelt (használt) rendszerből, a külső környezetből kapott ingerek teréből és az erősítésvezérlő rendszerből (belső paraméterek szabályozója) áll. Erősítésvezérlő rendszerként használható automata vezérlőberendezés (pl. termosztát) vagy emberi kezelő (tanár), amely speciális, állapotváltoztató erősítési szabályok alkalmazásával képes reagálni a vizsgált rendszer reakcióira és a környezeti ingerekre. a rendszer memóriájából.
Két lehetőség van: (1) amikor a vizsgált rendszer reakciója nem változtatja meg a környezet állapotát, és (2) amikor a rendszer válasza megváltoztatja a környezet ingereit. Ezek a sémák egy ilyen általános rendszer alapvető hasonlóságát jelzik a biológiai idegrendszerrel.
Ez a megkülönböztetés lehetővé teszi a különböző tanulási módok közötti különbségek mélyebb megtekintését, mivel a felügyelt és a nem felügyelt tanulás közötti határ finomabb. Ezen túlmenően egy ilyen különbség lehetővé tette bizonyos korlátok kimutatását a mesterséges neurális hálózatok számára S és R-vezérelt rendszerek esetén (lásd Perceptron konvergencia tétel ).
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|