Vapnik-Chervonenkis dimenzió

A Vapnik-Chervonenkis dimenzió vagy VC-dimenzió egy két osztályú osztályozási probléma  megoldására szolgáló algoritmuscsalád jellemzője, amely a család összetettségét vagy kapacitását jellemzi. Ez a statisztikai gépi tanulás Vapnik-Chervonenkis elméletének egyik kulcsfogalma, és Vladimir Vapnik és Alexey Chervonenkis nevéhez fűződik .

Maguk Vapnik és Chervonenkis inkább kombinatorikus dimenziónak nevezik ezt a mennyiséget , mivel kiderült, hogy az algebraisták már a gépi tanulás elméletének felfedezése előtt ismerték .

Definíció

Legyen adott egy halmaz és néhány indikátorfüggvénycsalád (osztályozó algoritmusok, döntési szabályok) , ahol  a függvények argumentuma, a függvényt  meghatározó paraméterek vektora. Minden ilyen függvény a halmaz minden eleméhez rendel egyet a két adott osztály közül. Egy család VC-dimenziója a legnagyobb szám , így a halmaz elemeinek van egy részhalmaza , amely függvények minden lehetséges módon két osztályra oszthatók. Ha léteznek ilyen részhalmazok tetszőlegesen nagy esetén, akkor a VC-dimenziót egyenlőnek tételezzük fel a végtelennel.

A VC-dimenzió általánosítható egy valós értékeket felvevő függvénycsalád esetére is . VC-dimenziója az indikátorfüggvények családjának VC-dimenziója , ahol a függvények tartománya . [egy]

Példák

Példaként tekintsük a síkon lévő pontok egyenes vonallal történő két osztályra osztásának problémáját - ez az úgynevezett lineáris osztályozó . Egy tetszőleges három pontból álló halmaz, amely nem egy egyenesen fekszik, minden lehetséges módon felosztható egy egyenessel két osztályra ( az alábbi ábrán látható módok közül hármat mutatnak be), de már nincs négy vagy több pont. Ezért a lineáris osztályozó VC-dimenziója a síkon egyenlő hárommal.

Példák három
pont két osztályra osztására

Ennek a négy pontnak a szétválasztása lehetetlen

Általános esetben a lineáris osztályozók VC-dimenziója a -dimenziós térben .

Lásd még

Linkek

Jegyzetek

  1. Hastie, T., Tibshirani R., Friedman J. 7.9. fejezet. Vapnik–Chervonenkis dimenzió // A statisztikai tanulás elemei: adatbányászat, következtetés és előrejelzés . — 2. kiadás. - Springer-Verlag, 2009. - 746 p. - ISBN 978-0-387-84857-0 . .