Túlélési elemzés

A túlélési elemzés a statisztikai modellek egy  osztálya , amely lehetővé teszi egy esemény bekövetkezésének valószínűségének becslését .

Leírás

A statisztikai módszerek ezen csoportja a megfelelő elnevezést kapta, mivel kezdetben széles körben elterjedt az orvosi kutatásokban a várható élettartam becslésére a kezelési módszerek hatékonyságának vizsgálatában. Később ezeket a módszereket kezdték alkalmazni a biztosítási ágazatban, valamint a társadalomtudományokban. [egy]

A túlélési elemzés a végső (kritikus) események kezdeti folyamatainak modellezésével foglalkozik egy adott populáció elemei esetében (eleinte a „halál” az élőlények populációjának elemei esetében). Így az orvosi kutatás keretein belül a túlélési elemzés olyan kérdésekre adhat választ, mint „mekkora lesz a túlélők aránya a betegek között egy idő után az alkalmazott kezelési technikák után?”, „milyen arányban lesz megfigyelhető a túlélők mortalitása?”, „ milyen tényezők befolyásolják a túlélési esélyek növekedését vagy csökkenését? stb.

A releváns kérdések megválaszolásához világosan meg kell tudni határozni az elem "élettartamát" (az elem aggregátumban való tartózkodásának időtartamát a terminális esemény kezdete előtt). Biológiai túlélés esetén a „halál” egyértelmû, más esetekben azonban a terminális esemény kezdetét nem mindig lehet külön idõpontban lokalizálni.

Általánosságban elmondható, hogy a túlélési elemzés olyan modellek felépítése, amelyek egy esemény bekövetkezésének időpontjára vonatkozó adatokat írják le. Mivel egy élő szervezet csak egyszer pusztulhat el, hagyományosan csak az egyszeri és egyszeri terminális eseményeket veszik figyelembe e megközelítés keretei között.

Változó cenzúra

Az adatok túlélési elemzési módszerekkel történő elemzése csak cenzúrázott adatok esetén végezhető el. A megfigyeléseket cenzúrázottnak mondjuk, ha az érdeklődésre számot tartó függő változó a végső esemény bekövetkezésének pillanatát reprezentálja, és a vizsgálat időtartama időben korlátozott.

Cenzúra mechanizmusai

Javítva a cenzúra

Rögzített cenzúra esetén a rendszer meghatározott ideig megfigyeli az objektumok mintáját . Azon objektumok száma, amelyeknél terminális esemény történik, vagy a halálozások száma véletlenszerű, de a vizsgálat teljes időtartama rögzített. Minden objektumnak van egy maximális lehetséges megfigyelési periódusa , amely objektumról a másikra változhat, de előre rögzített. Annak a valószínűsége, hogy egy objektum a megfigyelési periódusa végén életben lesz , , és a halálozások teljes száma véletlenszerű.

Véletlenszerű cenzúra

A véletlenszerű cenzúra során egy objektummintát figyelnek meg, ameddig szükséges ahhoz, hogy az objektumok átéljék az eseményt. Ebben a sémában a halálozások száma , amely meghatározza a vizsgálat pontosságát, előre rögzített, és paraméterként használható. Ennek a megközelítésnek az a hátránya, hogy ebben az esetben a vizsgálat teljes időtartama véletlenszerű, és nem tudható előre pontosan.

Útmutató a cenzúrához

A cenzúra során megadhatja, hogy a cenzúra milyen irányban történjen.

Jobb kéz cenzúra

A helyes cenzúra akkor következik be, ha a kutató tudja, hogy a kísérletet mikor kezdték, és hogy az a kísérlet kezdőpontjától jobbra eső időpontban ér véget.

Balkezes cenzúra

Ha a kutatónak nincs információja a kísérlet megkezdésének időpontjáról (pl. orvosbiológiai kutatások során lehet tudni, hogy a beteg mikor került a kórházba, és hogy egy bizonyos ideig túlélte, de előfordulhat, hogy nincs információ, hogy mikor jelentkeztek a tünetek betegsége először jelent meg). jelent meg), majd baloldali cenzúra történik.

Egyszeri és többszörös cenzúra

Az egyszeri cenzúra egy adott időpontban történik (a kísérlet bizonyos meghatározott idő után véget ér). Másrészt a többszörös cenzúra természetesen előfordul az orvosbiológiai kutatásokban , például amikor a betegeket különböző mennyiségű (vagy időtartamú) kezelés után hazaengedik a kórházból, és a kutató tudja, hogy a páciens éppen a cenzúra megfelelő szintjét élte meg.

Élettáblázatok elemzése

Ezek a táblázatok "bővített" gyakorisági táblázatoknak tekinthetők. A kritikus események (halálesetek, meghibásodások stb.) lehetséges előfordulási idejének területe bizonyos számú időintervallumra (időpontra) van felosztva. Egy ideig azoknak az objektumoknak a száma és aránya, amelyek a vizsgált intervallum elején a vizsgált populáció elemeinek részét képezték ("éltek"), azon elemek száma és aránya, amelyeket a populáció elhagyott ("meghaltak") ), valamint az egyes intervallumokban visszavont vagy cenzúrázott elemek száma és aránya.

Számított paraméterek

Túlélési funkció

Az elemzett objektumot a túlélési függvényben hagyományosan jelöljük ; a következő függvény írja le :

ahol  az az idő, amely alatt a populációt megfigyelték, egy valószínűségi változó , amely a „halál” pillanatát jelöli (az objektum elhagyja a populációt), és a „halál” valószínűségét jelenti egy adott időintervallumban. Vagyis a túlélési függvény a „halál” valószínűségét írja le valamivel a pillanat után .

Általában feltételezik, hogy bár ez az érték 1-nél kisebb is lehet, ha fennáll az azonnali halál vagy kudarc lehetősége.

Ha , akkor a túlélési függvénynek így kell kinéznie . Ez a tulajdonság abból következik, hogy a feltétel azt jelenti, hogy . Lényegében itt azt értjük, hogy a későbbi időszak túlélése csak a korábbi időszak túlélése után lehetséges.

Általában azt feltételezik, hogy a túlélési függvény az időváltozó végtelen növekedésével nullára hajlik: at .

A túlélés elemzésekor a kumulatív eloszlásfüggvényt és annak deriváltját, az eloszlássűrűség-függvényt is használjuk .

A kumulatív eloszlásfüggvény alakja

és leírja annak valószínűségét, hogy a terminális esemény időben bekövetkezett .

Az eloszlási sűrűségfüggvény (PDF) alakja

ez a funkció a terminális esemény előfordulási gyakoriságát mutatja az adott időpontban .

Valószínűségi sűrűség

Ez a populációból való kiesés ("halál") valószínűségének becslése a megfelelő intervallumban, az alábbiak szerint:

ahol  a meghibásodás valószínűségének becslése a th intervallumban,  a túlélő objektumok halmozott hányada (túlélési függvény) a th intervallum elejére, a th intervallum  szélessége .

Kockázati függvény (meghibásodási arány)

A kockázati függvényt annak a valószínűségeként határozzuk meg, hogy a megfelelő intervallum elején a sokaságban maradó elem elhagyja a sokaságot („meghal”) ez alatt az intervallum alatt. Az intenzitásfüggvény becslését a következőképpen számítjuk ki:

Ennek a kifejezésnek a számlálója annak a feltételes valószínűsége , hogy az esemény bekövetkezik az intervallumban , ha korábban nem történt meg, nevezője pedig az intervallum szélessége.

Medián várható élettartam

Ez az a pont az időtengelyen, ahol a kumulatív túlélési függvény 0,5. A kumulatív túlélési függvény többi százalékát (például a 25. és 75. percentiliseket vagy kvartiliseket) a rendszer ugyanígy számítja ki.

Modell illesztés

A túlélési modellek értelmesen ábrázolhatók lineáris regressziós modellként , mivel az összes fent felsorolt ​​eloszláscsalád megfelelő transzformációkkal lineárisra redukálható. Ebben az esetben az élettartam lesz a függő változó.

Az eloszlások parametrikus családjának ismeretében a rendelkezésre álló adatokból kiszámítható a likelihood függvény , és megkereshető annak maximuma. Az ilyen becsléseket maximális valószínűségi becsléseknek nevezzük. Nagyon általános feltételezések szerint ezek a becslések egybeesnek a legkisebb négyzetek becsléseivel. Hasonlóképpen a likelihood függvény maximumát a nullhipotézis alatt találjuk meg, vagyis egy olyan modell esetében, amely különböző időközönként eltérő intenzitást tesz lehetővé. A megfogalmazott hipotézis tesztelhető például a likelihood ratio teszttel, amelynek statisztikái aszimptotikus khi-négyzet eloszlásúak .

Használt elosztási családok

Általánosságban elmondható, hogy az élettartam táblázat jó képet ad az objektumok meghibásodásának vagy halálának időbeli eloszlásáról. A jóslat készítéséhez azonban gyakran szükséges ismerni a vizsgált túlélési függvény alakját.

A túlélési elemzéssel összefüggésben a következő eloszlási családokat használják leggyakrabban a modellek felépítéséhez:

Szorzó Kaplan-Meier becslések

A cenzúrázott, de csoportosítatlan élettartam-megfigyelések esetén a túlélési függvény közvetlenül (élettartam táblázat nélkül) becsülhető. Tegyük fel, hogy van egy adatbázis, ahol minden megfigyelés pontosan egy időintervallumot tartalmaz. Az egyes intervallumokban a túlélési valószínűségeket megszorozva a következő képletet kapjuk a túlélési függvényre:

Ebben a kifejezésben  a túlélési függvény becslése, az  események teljes száma (végi idők),  egyetlen esemény sorszáma (időrendileg), amely egyenlő 1-gyel, ha a -edik esemény kudarcot jelent (halál), és 0, ha a -edik esemény a megfigyelés elvesztését jelenti (cenzúra), akkor a szorzatot jelenti az időre befejezett összes megfigyeléshez .

A túlélési függvénynek ezt a becslését, amelyet szorzóbecslésnek neveznek, először Kaplan és Meyer (1958) javasolta.

Jegyzetek

  1. Túlélési elemzés. StatSoft elektronikus oktatóanyag . Letöltve: 2012. november 25. Az eredetiből archiválva : 2013. január 23..

Irodalom