A túlélési elemzés a statisztikai modellek egy osztálya , amely lehetővé teszi egy esemény bekövetkezésének valószínűségének becslését .
A statisztikai módszerek ezen csoportja a megfelelő elnevezést kapta, mivel kezdetben széles körben elterjedt az orvosi kutatásokban a várható élettartam becslésére a kezelési módszerek hatékonyságának vizsgálatában. Később ezeket a módszereket kezdték alkalmazni a biztosítási ágazatban, valamint a társadalomtudományokban. [egy]
A túlélési elemzés a végső (kritikus) események kezdeti folyamatainak modellezésével foglalkozik egy adott populáció elemei esetében (eleinte a „halál” az élőlények populációjának elemei esetében). Így az orvosi kutatás keretein belül a túlélési elemzés olyan kérdésekre adhat választ, mint „mekkora lesz a túlélők aránya a betegek között egy idő után az alkalmazott kezelési technikák után?”, „milyen arányban lesz megfigyelhető a túlélők mortalitása?”, „ milyen tényezők befolyásolják a túlélési esélyek növekedését vagy csökkenését? stb.
A releváns kérdések megválaszolásához világosan meg kell tudni határozni az elem "élettartamát" (az elem aggregátumban való tartózkodásának időtartamát a terminális esemény kezdete előtt). Biológiai túlélés esetén a „halál” egyértelmû, más esetekben azonban a terminális esemény kezdetét nem mindig lehet külön idõpontban lokalizálni.
Általánosságban elmondható, hogy a túlélési elemzés olyan modellek felépítése, amelyek egy esemény bekövetkezésének időpontjára vonatkozó adatokat írják le. Mivel egy élő szervezet csak egyszer pusztulhat el, hagyományosan csak az egyszeri és egyszeri terminális eseményeket veszik figyelembe e megközelítés keretei között.
Az adatok túlélési elemzési módszerekkel történő elemzése csak cenzúrázott adatok esetén végezhető el. A megfigyeléseket cenzúrázottnak mondjuk, ha az érdeklődésre számot tartó függő változó a végső esemény bekövetkezésének pillanatát reprezentálja, és a vizsgálat időtartama időben korlátozott.
Rögzített cenzúra esetén a rendszer meghatározott ideig megfigyeli az objektumok mintáját . Azon objektumok száma, amelyeknél terminális esemény történik, vagy a halálozások száma véletlenszerű, de a vizsgálat teljes időtartama rögzített. Minden objektumnak van egy maximális lehetséges megfigyelési periódusa , amely objektumról a másikra változhat, de előre rögzített. Annak a valószínűsége, hogy egy objektum a megfigyelési periódusa végén életben lesz , , és a halálozások teljes száma véletlenszerű.
Véletlenszerű cenzúraA véletlenszerű cenzúra során egy objektummintát figyelnek meg, ameddig szükséges ahhoz, hogy az objektumok átéljék az eseményt. Ebben a sémában a halálozások száma , amely meghatározza a vizsgálat pontosságát, előre rögzített, és paraméterként használható. Ennek a megközelítésnek az a hátránya, hogy ebben az esetben a vizsgálat teljes időtartama véletlenszerű, és nem tudható előre pontosan.
A cenzúra során megadhatja, hogy a cenzúra milyen irányban történjen.
Jobb kéz cenzúraA helyes cenzúra akkor következik be, ha a kutató tudja, hogy a kísérletet mikor kezdték, és hogy az a kísérlet kezdőpontjától jobbra eső időpontban ér véget.
Balkezes cenzúraHa a kutatónak nincs információja a kísérlet megkezdésének időpontjáról (pl. orvosbiológiai kutatások során lehet tudni, hogy a beteg mikor került a kórházba, és hogy egy bizonyos ideig túlélte, de előfordulhat, hogy nincs információ, hogy mikor jelentkeztek a tünetek betegsége először jelent meg). jelent meg), majd baloldali cenzúra történik.
Az egyszeri cenzúra egy adott időpontban történik (a kísérlet bizonyos meghatározott idő után véget ér). Másrészt a többszörös cenzúra természetesen előfordul az orvosbiológiai kutatásokban , például amikor a betegeket különböző mennyiségű (vagy időtartamú) kezelés után hazaengedik a kórházból, és a kutató tudja, hogy a páciens éppen a cenzúra megfelelő szintjét élte meg.
Ezek a táblázatok "bővített" gyakorisági táblázatoknak tekinthetők. A kritikus események (halálesetek, meghibásodások stb.) lehetséges előfordulási idejének területe bizonyos számú időintervallumra (időpontra) van felosztva. Egy ideig azoknak az objektumoknak a száma és aránya, amelyek a vizsgált intervallum elején a vizsgált populáció elemeinek részét képezték ("éltek"), azon elemek száma és aránya, amelyeket a populáció elhagyott ("meghaltak") ), valamint az egyes intervallumokban visszavont vagy cenzúrázott elemek száma és aránya.
Az elemzett objektumot a túlélési függvényben hagyományosan jelöljük ; a következő függvény írja le :
ahol az az idő, amely alatt a populációt megfigyelték, egy valószínűségi változó , amely a „halál” pillanatát jelöli (az objektum elhagyja a populációt), és a „halál” valószínűségét jelenti egy adott időintervallumban. Vagyis a túlélési függvény a „halál” valószínűségét írja le valamivel a pillanat után .
Általában feltételezik, hogy bár ez az érték 1-nél kisebb is lehet, ha fennáll az azonnali halál vagy kudarc lehetősége.
Ha , akkor a túlélési függvénynek így kell kinéznie . Ez a tulajdonság abból következik, hogy a feltétel azt jelenti, hogy . Lényegében itt azt értjük, hogy a későbbi időszak túlélése csak a korábbi időszak túlélése után lehetséges.
Általában azt feltételezik, hogy a túlélési függvény az időváltozó végtelen növekedésével nullára hajlik: at .
A túlélés elemzésekor a kumulatív eloszlásfüggvényt és annak deriváltját, az eloszlássűrűség-függvényt is használjuk .
A kumulatív eloszlásfüggvény alakja
és leírja annak valószínűségét, hogy a terminális esemény időben bekövetkezett .
Az eloszlási sűrűségfüggvény (PDF) alakja
ez a funkció a terminális esemény előfordulási gyakoriságát mutatja az adott időpontban .
Ez a populációból való kiesés ("halál") valószínűségének becslése a megfelelő intervallumban, az alábbiak szerint:
ahol a meghibásodás valószínűségének becslése a th intervallumban, a túlélő objektumok halmozott hányada (túlélési függvény) a th intervallum elejére, a th intervallum szélessége .
A kockázati függvényt annak a valószínűségeként határozzuk meg, hogy a megfelelő intervallum elején a sokaságban maradó elem elhagyja a sokaságot („meghal”) ez alatt az intervallum alatt. Az intenzitásfüggvény becslését a következőképpen számítjuk ki:
Ennek a kifejezésnek a számlálója annak a feltételes valószínűsége , hogy az esemény bekövetkezik az intervallumban , ha korábban nem történt meg, nevezője pedig az intervallum szélessége.
Ez az a pont az időtengelyen, ahol a kumulatív túlélési függvény 0,5. A kumulatív túlélési függvény többi százalékát (például a 25. és 75. percentiliseket vagy kvartiliseket) a rendszer ugyanígy számítja ki.
A túlélési modellek értelmesen ábrázolhatók lineáris regressziós modellként , mivel az összes fent felsorolt eloszláscsalád megfelelő transzformációkkal lineárisra redukálható. Ebben az esetben az élettartam lesz a függő változó.
Az eloszlások parametrikus családjának ismeretében a rendelkezésre álló adatokból kiszámítható a likelihood függvény , és megkereshető annak maximuma. Az ilyen becsléseket maximális valószínűségi becsléseknek nevezzük. Nagyon általános feltételezések szerint ezek a becslések egybeesnek a legkisebb négyzetek becsléseivel. Hasonlóképpen a likelihood függvény maximumát a nullhipotézis alatt találjuk meg, vagyis egy olyan modell esetében, amely különböző időközönként eltérő intenzitást tesz lehetővé. A megfogalmazott hipotézis tesztelhető például a likelihood ratio teszttel, amelynek statisztikái aszimptotikus khi-négyzet eloszlásúak .
Általánosságban elmondható, hogy az élettartam táblázat jó képet ad az objektumok meghibásodásának vagy halálának időbeli eloszlásáról. A jóslat készítéséhez azonban gyakran szükséges ismerni a vizsgált túlélési függvény alakját.
A túlélési elemzéssel összefüggésben a következő eloszlási családokat használják leggyakrabban a modellek felépítéséhez:
A cenzúrázott, de csoportosítatlan élettartam-megfigyelések esetén a túlélési függvény közvetlenül (élettartam táblázat nélkül) becsülhető. Tegyük fel, hogy van egy adatbázis, ahol minden megfigyelés pontosan egy időintervallumot tartalmaz. Az egyes intervallumokban a túlélési valószínűségeket megszorozva a következő képletet kapjuk a túlélési függvényre:
Ebben a kifejezésben a túlélési függvény becslése, az események teljes száma (végi idők), egyetlen esemény sorszáma (időrendileg), amely egyenlő 1-gyel, ha a -edik esemény kudarcot jelent (halál), és 0, ha a -edik esemény a megfigyelés elvesztését jelenti (cenzúra), akkor a szorzatot jelenti az időre befejezett összes megfigyeléshez .
A túlélési függvénynek ezt a becslését, amelyet szorzóbecslésnek neveznek, először Kaplan és Meyer (1958) javasolta.