ROC-görbe ( angolul a vevő működési karakterisztikája , a vevő működési karakterisztikája) - egy grafikon, amely lehetővé teszi a bináris osztályozás minőségének értékelését , megjeleníti az objektumok arányát a jellemző vivőinek teljes számához viszonyítva, helyesen besorolva a hordozók közé. a jellemzőt ( angol valódi pozitív arány , TPR, érzékenységi osztályozási algoritmusnak nevezik), és azon objektumok arányát az összes objektumhoz képest, amelyek nem hordoznak jellemzőt, és tévesen jellemzőt hordozónak minősítettek ( angol false pozitív arány , FPR, az 1-FPR értékét az osztályozási algoritmus specifitásának nevezzük) a döntési szabály küszöbének változtatásakor.
Más néven hibagörbe . Az osztályozások ROC görbék segítségével történő elemzését ROC elemzésnek nevezzük .
A ROC kvantitatív értelmezése megadja az AUC -t ( eng. Area Under Curve , area under the curve ) - a ROC-görbe által határolt területet és a hamis pozitív besorolások arányának tengelyét. Minél nagyobb az AUC, annál jobb az osztályozó, míg a 0,5 érték a kiválasztott osztályozási módszer alkalmatlanságát jelzi (ami a véletlenszerű találgatásnak felel meg). A 0,5-nél kisebb érték azt jelenti, hogy az osztályozó pont fordítva működik: ha a pozitívakat negatívnak nevezzük, és fordítva, az osztályozó jobban fog működni.
A rosszindulatú daganatok az osztályozási problémák klasszikus alkalmazása: a tünetek gyakran akkor jelentkeznek, amikor a betegség már gyógyíthatatlanná lépett, és a megbízható vizsgálatok rendkívül költségesek. Ezért az olcsó, bár nem olyan megbízható tesztekre van szükség - és ezt egészséges és beteg emberek példáján magyarázzuk el.
Az osztályozás feladata, hogy korábban ismeretlen objektumokat rendeljen egy adott osztályhoz. Ilyen feladat lehet például egy betegség diagnosztizálása – függetlenül attól, hogy a beteg megbetegedett ( pozitív eredmény ) vagy sem ( negatív eredmény ). Ezután az osztályozás eredményeként négy különböző helyzet figyelhető meg:
A négy lehetséges kimenet 2×2-es kontingenciatáblázatként is megfogalmazható és formázható .
Ekkor a Sen=TP/(TP+FN) értéket, vagyis az algoritmus azon képességét, hogy „látja” a betegeket, a valódi pozitívumok érzékenységének vagy gyakoriságának nevezzük , Spe=TN/(TN+FP) az igaz specifitása vagy gyakorisága. negatívumok , az algoritmus azon képessége, hogy ne vegye egészséges embereket betegnek. Ezeknek a hibáknak a gazdasági hatása eltérő: az álnegatív beteg elhanyagolt betegséggel érkezik, az álpozitív kiegészítő vizsgálatára fordítanak erőforrásokat. Az 1−Spe=FP/(TN+FP) értéket hamis pozitív aránynak nevezzük .
Az osztályozó gyakran nem az egészséges-beteg bitet adja vissza, hanem egy folyamatos skálán lévő számot: például 0="nyilvánvalóan egészséges", 25="valószínűleg egészséges", 50="határozatlan", 75="valószínűleg beteg ", 100="egyértelműen beteg". De mindazonáltal a meghozott döntések halmaza általában véges, sőt bináris: kell-e a beteget további vizsgálatra küldeni? Működnie kell a tolónak, beleejteni az alkatrészt a konténerbe a házassággal ? A válaszküszöb változtatásával megváltoztatjuk az érzékenység és a specificitás jellemzőit: minél magasabb, annál alacsonyabb a másik.
A küszöb −∞-ről ∞-ra való változtatása és az X=1−Spe és Y=Sen pontok X,Y koordinátatérben történő ábrázolása eredményeként egy grafikont kapunk, amelyet ROC görbének nevezünk. A −∞ küszöbnél az osztályozó minden beteget betegnek minősít (1−Spe=1, Sen=1). A +∞ küszöbnél mindenki egészségesnek minősül (1−Spe=0, Sen=0). Ezért a ROC görbe mindig (0.0)-tól (1.1)-ig megy.
Az osztályozás gyakran folytonos valószínűségi változókon alapul . Ebben az esetben célszerű egy adott osztályhoz való tartozás valószínűségét valószínűségi eloszlásfüggvényként felírni a paraméter egy bizonyos küszöbértékétől (határértékétől) függően az alakban , és a nem tartozás valószínűségét -ként . Ekkor az álpozitív (fals-pozitív arány, FPR) megoldások száma a következővel fejezhető ki . Ugyanakkor az igaz-pozitív döntések száma (igaz-pozitív arány, TPR) a következővel fejezhető ki . Amikor a ROC - görbét a tengely mentén és a tengely mentén készítjük , a paraméter különböző értékeinél kapjuk meg .
Például képzeljük el, hogy egyes fehérjék szintje a vérben normálisan 1 g / dl , illetve 2 g / dl centrumokkal oszlik meg egészséges és beteg emberekben . Egy orvosi vizsgálat jelezheti bármely fehérje szintjét a vérplazmában . Egy bizonyos határ feletti fehérjeszint betegség jelének tekinthető . A kutató elmozdíthatja a szegélyt (fekete függőleges vonal az ábrán), ami megváltoztatja a hamis pozitív eredmények számát. A ROC görbe eredményül kapott alakja a két eloszlás metszéspontjától függ .
Ha az általános sokaság véges (ami általában valós adathalmazokon történik), akkor amikor a t küszöb −∞-ről ∞-re mozog, a következő helyzetek lehetségesek:
Mivel a negyedik esemény valószínűsége kicsi, ezért a végső általános sokaság ROC-görbéje lépcsőzetes, kis számú lejtős szegmenssel, ahol az adatgyűjtés és -feldolgozás hibái ugyanazt az eredményt adták különböző osztályú objektumok esetén.
Ennek megfelelően egy véges általános sokaság ROC-görbéjének felépítésének algoritmusa a következő. Rendezzük az objektumokat a kritérium értéke szerint. Vegyünk egy azonos feltételértékű objektumkészletet, újraszámoljuk a Sen és Spe értékeket, és rajzolunk egy szakaszt. Addig folytatjuk, amíg a tárgyak el nem fogynak.
Egy 0-t vagy 1-et adó bináris osztályozó (például egy döntési fa ) ROC görbéje úgy néz ki, mint két szegmens (0,0) → (1−Spe,Sen) → (1,1).
Ideális esetben, amikor az osztályozó teljesen elválasztja az általános sokaság pozitív és negatív tagjait, először minden hamis pozitív lesz igaz negatív ((1,1) - (0,1) szegmens), majd minden igaz pozitív hamis negatív lesz ( szegmens (0,1)–(0,0)). Azaz egy ideális osztályozó ROC-görbéje, függetlenül attól, hogy a kritérium milyen számokat hoz létre, és hogy az általános sokaság véges-e, két szegmensnek (0,0) - (0,1) - (1,1) néz ki.
Azoknál a t küszöbértékeknél , ahol a ROC-görbe az 1−Spe = Sen átló alatt van , a kritérium megfordítható (minden t -nél kisebbet pozitívnak nyilváníthatunk), és az osztályozó jobban fog teljesíteni, mint eredetileg: mind az érzékenység, mind a specificitás nő. .
A ROC-görbéket először a jelfeldolgozás elméletében használták az Egyesült Államokban a második világháború idején , hogy javítsák az ellenséges objektumok radarjelből való felismerésének minőségét [1] . A Pearl Harbor elleni 1941 - es támadás után az amerikai hadsereg új kutatásba kezdett , amelynek célja a japán repülőgépek radarjelek alapján történő azonosításának pontosabbá tétele volt.
Ezt követően a ROC-görbéket széles körben alkalmazták az orvosi diagnosztikában [2] [3] [4] . A ROC-görbéket az epidemiológiában és az orvosi kutatásokban használják, és gyakran hivatkoznak rájuk a bizonyítékokon alapuló gyógyászattal azonos összefüggésben . A radiológiában a ROC görbéket új technikák validálására és tesztelésére használják [5] . A társadalomtudományokban a ROC-görbéket a valószínűségi modellek minőségével kapcsolatos ítéletek meghozatalára használják. A görbéket a termékminőség -menedzsmentben és a hitelminősítésben is használják .
Mint már említettük, a ROC-görbéket széles körben használják a gépi tanulásban . Ebben az összefüggésben először Spakman munkájában használták őket, aki bemutatta a ROC görbék használatát számos osztályozási algoritmus összehasonlításakor . [6]
Normalizált térben a görbe alatti terület ( AUC - görbe alatti terület, AUROC - vevő működési jellemzője alatti terület ) megegyezik annak valószínűségével , hogy az osztályozó nagyobb súlyt rendel egy véletlenszerűen kiválasztott pozitív entitáshoz, mint egy véletlenszerűen kiválasztott negatívhoz. . [7] Ez a következőképpen ábrázolható: a görbe alatti területet az integrál adja meg (a tengelyt mínusz előjellel forgatjuk - a koordináta nagyobb értéke a paraméter kisebb értékének felel meg ): . A szögzárójelek az átlagfelvétel műveletét jelölik.
Kimutatták, hogy az AUC szoros kapcsolatban áll a Mann-Whitney U-teszttel [8] [9] , amely azt méri, hogy a pozitív tételek nagyobb súlyt kapnak-e, mint a negatívak. Az AUC érték a Wilcoxon-teszthez [9] és a Gini-együtthatóhoz ( ) is kapcsolódik a következőképpen: , ahol:
[10] .
Az AUC -t gyakran használják modellek összehasonlítására is a tréningkészlet alapján [11] . Bizonyos esetekben azonban ennek a mutatónak a használata nehézkes, mert az AUC érzékeny a zajra [12] . Ezenkívül egyes dokumentumokban további problémák merülnek fel, amelyek akkor merülnek fel, ha az AUC -értéket modellek összehasonlítására használják [13] [14] . Amint azt korábban megjegyeztük, a görbe alatti terület értéke annak a valószínűségének az értékeként használható, amellyel egy véletlenszerűen kiválasztott pozitív entitás nagyobb súlyt kap, mint egy véletlenszerűen kiválasztott negatív entitás. Számos munka [12] [13] azonban feltételezéseket fogalmazott meg az AUC -értékek megbízható becslésének nehézségével kapcsolatban . Így az AUC mutató gyakorlati értéke megkérdőjeleződött [14] , ami azt jelzi, hogy az érték gyakran több bizonytalanságot jelent, mint egyértelműséget.
A ROC-görbék kiterjesztése kettőnél több osztályú osztályozási problémák esetére mindig is nehézségekkel járt, mivel a szabadsági fokok száma az osztályok számával négyzetesen növekszik, és a ROC-tér dimenziókkal rendelkezik , ahol a osztályok száma. [15] Néhány gyakorlati megközelítést is kidolgoztak arra az esetre, amikor az osztályok száma három. [16] A ROC-felület alatti térfogat ( VUS – Volume Under Surface ) a nem bináris osztályozási problémák osztályozóinak minőségi mérőszáma . [17] A VUS változó elemzésének összetettsége miatt azonban a VUS koncepció kiterjesztése alapján más megközelítéseket [18] is kidolgoztak .
A ROC görbék sikeres alkalmazása miatt az osztályozók minőségének elemzésére, a ROC görbék kiterjesztését más felügyelt tanulási problémákra is tanulmányozták . A munkák közül érdemes megemlíteni az úgynevezett REC-görbék ( regressziós hiba karakterisztikája - REC-görbe ) [19] és RROC-görbék ( Regression ROC curves ) [20] munkáit . Érdemes megjegyezni, hogy az RROC görbe alatti terület arányos a regressziós modell hibavarianciájával .
Szótárak és enciklopédiák | |
---|---|
Bibliográfiai katalógusokban |