A Q -learning a mesterséges intelligenciában alkalmazott módszer , ágens alapú megközelítéssel . Megerősítő tanulási kísérletekre utal . A környezettől kapott jutalom alapján az ágens egy Q hasznossági függvényt alkot , amely utólag lehetőséget ad arra, hogy ne véletlenszerűen válasszon viselkedési stratégiát, hanem figyelembe vegye a környezettel való korábbi interakció tapasztalatait. A Q-learning egyik előnye, hogy a környezet modellezése nélkül képes összehasonlítani az elérhető tevékenységek várható hasznosságát . Olyan helyzetekre vonatkozik, amelyek Markov-döntési folyamatként ábrázolhatók .
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|