A Vapnik-Chervonenkis dimenzió vagy VC-dimenzió egy két osztályú osztályozási probléma megoldására szolgáló algoritmuscsalád jellemzője, amely a család összetettségét vagy kapacitását jellemzi. Ez a statisztikai gépi tanulás Vapnik-Chervonenkis elméletének egyik kulcsfogalma, és Vladimir Vapnik és Alexey Chervonenkis nevéhez fűződik .
Maguk Vapnik és Chervonenkis inkább kombinatorikus dimenziónak nevezik ezt a mennyiséget , mivel kiderült, hogy az algebraisták már a gépi tanulás elméletének felfedezése előtt ismerték .
Legyen adott egy halmaz és néhány indikátorfüggvénycsalád (osztályozó algoritmusok, döntési szabályok) , ahol a függvények argumentuma, a függvényt meghatározó paraméterek vektora. Minden ilyen függvény a halmaz minden eleméhez rendel egyet a két adott osztály közül. Egy család VC-dimenziója a legnagyobb szám , így a halmaz elemeinek van egy részhalmaza , amely függvények minden lehetséges módon két osztályra oszthatók. Ha léteznek ilyen részhalmazok tetszőlegesen nagy esetén, akkor a VC-dimenziót egyenlőnek tételezzük fel a végtelennel.
A VC-dimenzió általánosítható egy valós értékeket felvevő függvénycsalád esetére is . VC-dimenziója az indikátorfüggvények családjának VC-dimenziója , ahol a függvények tartománya . [egy]
Példaként tekintsük a síkon lévő pontok egyenes vonallal történő két osztályra osztásának problémáját - ez az úgynevezett lineáris osztályozó . Egy tetszőleges három pontból álló halmaz, amely nem egy egyenesen fekszik, minden lehetséges módon felosztható egy egyenessel két osztályra ( az alábbi ábrán látható módok közül hármat mutatnak be), de már nincs négy vagy több pont. Ezért a lineáris osztályozó VC-dimenziója a síkon egyenlő hárommal.
Példák három pont két osztályra osztására |
Ennek a négy pontnak a szétválasztása lehetetlen |
Általános esetben a lineáris osztályozók VC-dimenziója a -dimenziós térben .
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|