Tanulás tanárral

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. április 12-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A felügyelt tanulás a gépi  tanulás egyik módszere , melynek során a vizsgált rendszert inger-válasz példák segítségével tanulásra kényszerítik. A kibernetika szempontjából a kibernetikai kísérletek egyik fajtája . Valamilyen kapcsolat lehet a bemenetek és a referenciakimenetek között (inger-válasz), de ez nem ismert. A precedenseknek csak véges halmaza  ismert – „inger-válasz” párok, az úgynevezett képzési minta. Ezen adatok alapján szükséges a függőség helyreállítása (előrejelzésre alkalmas inger-válasz kapcsolatok modelljének felépítése), azaz olyan algoritmus felépítése, amely bármely objektumra elég pontos választ tud adni. A válaszok pontosságának mérésére, valamint a példákon keresztüli tanulás során bevezethető egy minőségi függvény .

A kísérlet felállításának elve

Ez a kísérlet egy speciális esete egy visszacsatolásos kibernetikai kísérletnek. Ennek a kísérletnek a felállítása feltételezi egy kísérleti rendszer, egy betanítási módszer, valamint a rendszer tesztelésére vagy a jellemzők mérésére szolgáló módszer meglétét.

A kísérleti rendszer pedig a tesztelt (használt) rendszerből, a külső környezetből kapott ingerek teréből és az erősítésvezérlő rendszerből (belső paraméterek szabályozója) áll. Erősítésvezérlő rendszerként használható automata vezérlőberendezés (pl. termosztát) vagy emberi kezelő (tanár), amely speciális, állapotváltoztató erősítési szabályok alkalmazásával képes reagálni a vizsgált rendszer reakcióira és a környezeti ingerekre. a rendszer memóriájából.

Két lehetőség van: (1) amikor a vizsgált rendszer reakciója nem változtatja meg a környezet állapotát, és (2) amikor a rendszer válasza megváltoztatja a környezet ingereit. Ezek a sémák egy ilyen általános rendszer alapvető hasonlóságát jelzik a biológiai idegrendszerrel.

A felügyelt tanulási feladatok tipológiája

Bemeneti adattípusok

Választípusok

A megerősítést irányító rendszerek degenerált típusai ("tanárok")

Ez a megkülönböztetés lehetővé teszi a különböző tanulási módok közötti különbségek mélyebb megtekintését, mivel a felügyelt és a nem felügyelt tanulás közötti határ finomabb. Ezen túlmenően egy ilyen különbség lehetővé tette bizonyos korlátok kimutatását a mesterséges neurális hálózatok számára S és R-vezérelt rendszerek esetén (lásd Perceptron konvergencia tétel ).

Lásd még

Irodalom