Eloonjäämisanalyysi on tilastollisten mallien luokka , jonka avulla voidaan arvioida tapahtuman todennäköisyys .
Tämä tilastollisten menetelmien ryhmä sai sopivan nimen, koska niitä käytettiin alun perin laajalti lääketieteellisessä tutkimuksessa eliniän arvioimiseksi hoitomenetelmien tehokkuuden tutkimuksessa. Myöhemmin näitä menetelmiä alettiin soveltaa vakuutusalalla sekä yhteiskuntatieteissä. [yksi]
Selviytymiskykyanalyysi koskee tietyn populaation elementtien (alkuperäisesti "kuolema" elävien olentojen populaation elementtien) terminaalisten (kriittisten) tapahtumien alkamisprosessien mallintamista. Lääketieteellisen tutkimuksen puitteissa eloonjäämisanalyysi voi siis vastata kysymyksiin, kuten "mikä on eloonjääneiden osuus potilaista jonkin aikaa sovellettujen hoitotekniikoiden jälkeen?", "Mitä kuolleisuutta havaitaan selviytyneiden keskuudessa?", " mitkä tekijät vaikuttavat selviytymismahdollisuuksien lisääntymiseen tai heikkenemiseen? jne.
Asiaankuuluviin kysymyksiin vastaamiseksi on pystyttävä selkeästi määrittämään elementin "elinikä" (jakso, jonka elementti viipyy aggregaatissa ennen päätetapahtuman alkamista). Biologisen selviytymisen tapauksessa "kuolema" on yksiselitteinen, mutta muissa tapauksissa terminaalin tapahtuman alkamista ei aina ole mahdollista paikantaa eri ajankohtana.
Yleensä selviytymisanalyysi on sellaisten mallien rakentamista, jotka kuvaavat tietoja tapahtuman tapahtumisajasta. Koska elävä organismi voi kuolla vain kerran, perinteisesti tämän lähestymistavan puitteissa otetaan huomioon vain yksittäiset ja kertaluonteiset päätetapahtumat.
Tietojen analysointi selviytymisanalyysimenetelmillä voidaan suorittaa vain sensuroiduille tiedoille. Havainnot sanotaan sensuroiduiksi, jos kiinnostuksen kohteena oleva riippuvainen muuttuja edustaa päätetapahtuman tapahtumahetkeä ja tutkimuksen kesto on ajallisesti rajoitettu.
Kiinteällä sensuroinnilla näytettä kohteista tarkkaillaan tietyn ajan. Kohteiden määrä, joille päätetapahtuma tapahtuu, tai kuolemien määrä on satunnainen, mutta tutkimuksen kokonaiskesto on kiinteä. Jokaisella kohteella on maksimi mahdollinen havaintojakso , joka voi vaihdella objekteittain, mutta se on vahvistettu etukäteen. Todennäköisyys, että esine on elossa havaintojaksonsa lopussa, on , ja kuolleiden kokonaismäärä on satunnainen.
Satunnainen sensurointiSatunnaisessa sensuroinnissa otosta kohteista tarkkaillaan niin kauan kuin on tarpeen, jotta esineet kokevat tapahtuman. Tässä kaaviossa tutkimuksen tarkkuuden määräävä kuolemantapausten määrä on vahvistettu etukäteen ja sitä voidaan käyttää parametrina. Tämän lähestymistavan haittana on, että tässä tapauksessa tutkimuksen kokonaiskesto on satunnainen, eikä sitä voida tietää tarkasti etukäteen.
Sensuroinnin yhteydessä voit määrittää suunnan, johon sensurointi tapahtuu.
Oikean käden sensurointiOikea sensurointi tapahtuu, jos tutkija tietää, missä vaiheessa koe aloitettiin ja että se päättyy kokeen aloituspisteen oikealla puolella olevaan ajankohtaan.
Vasenkätinen sensurointiJos tutkijalla ei ole tietoa siitä, milloin koe aloitettiin (esimerkiksi biolääketieteellisessä tutkimuksessa voi olla tiedossa, milloin potilas joutui sairaalaan ja että hän selvisi tietyn ajan, mutta oireiden alkamisesta ei välttämättä ole tietoa hänen sairautensa ilmestyi ensimmäisen kerran).
Kertaluonteinen sensurointi tapahtuu tiettynä ajankohtana (koe päättyy tietyn ajan kuluttua). Toisaalta moninkertaista sensurointia esiintyy luonnollisesti biolääketieteellisessä tutkimuksessa esimerkiksi silloin, kun potilaat kotiutetaan sairaalasta vaihtelevan määrän (tai pituuden) hoidon jälkeen ja tutkija tietää, että potilas on juuri elänyt sensuurikohtaan.
Näitä taulukoita voidaan pitää "laajennettuina" taajuustaulukoina. Kriittisten tapahtumien (kuolemat, viat jne.) mahdollisten esiintymisaikojen alue on jaettu tiettyyn määrään aikavälejä (aikapisteitä). Hetken ajan niiden esineiden lukumäärä ja osuus, jotka tarkastellun ajanjakson alussa olivat osa tutkitun populaation elementtejä (olivat "elossa"), niiden elementtien lukumäärä ja osuus, jotka populaatio jätti ("kuoli") ), sekä niiden elementtien lukumäärä ja osuus, jotka poistettiin tai sensuroitiin kullakin aikavälillä.
Analysoitu kohde selviytymisfunktiossa on perinteisesti merkitty ; sitä kuvaa seuraava toiminto :
missä on aika, jonka aikana populaatiota havainnoitiin, on satunnaismuuttuja , joka ilmaisee "kuoleman" hetken (populaatio lähtee kohteen ohi) ja tarkoittaa "kuoleman" todennäköisyyttä tietyllä aikavälillä. Eli selviytymisfunktio kuvaa "kuoleman" todennäköisyyttä jonkin ajan kuluttua hetkestä .
Yleensä oletetaan, että vaikka tämä arvo voi olla pienempi kuin 1, välittömän kuoleman tai epäonnistumisen mahdollisuus on olemassa.
Jos , selviytymisfunktion pitäisi näyttää tältä . Tämä ominaisuus johtuu siitä tosiasiasta, että ehto tarkoittaa, että . Pohjimmiltaan tässä tarkoitetaan sitä, että myöhemmän ajanjakson selviytyminen on mahdollista vasta aikaisemman ajanjakson selviytymisen jälkeen.
Yleensä oletetaan, että selviytymisfunktio pyrkii nollaan aikamuuttujan äärettömän kasvaessa: klo .
Myös selviytymistä analysoitaessa käytetään kumulatiivista jakaumafunktiota ja sen derivaatta, jakautumistiheysfunktiota .
Kumulatiivisella jakaumafunktiolla on muoto
ja kuvaa todennäköisyyttä, että päätetapahtuma on tapahtunut ajan myötä .
Jakauman tiheysfunktiolla (PDF) on muoto
tämä toiminto näyttää päätetapahtuman esiintymistiheyden ajanhetkellä .
Tämä on arvio todennäköisyydestä putoaa väestöstä ("kuolema") vastaavalla aikavälillä, joka määritellään seuraavasti:
missä on arvio epäonnistumistodennäköisyydestä : nnen välin aikana, on selviytyneiden kohteiden kumulatiivinen murto-osa (selviytymisfunktio) : nnen välin alkuun mennessä, on :nnen välin leveys .
Riskifunktio määritellään todennäköisyydeksi, että vastaavan ajanjakson alussa perusjoukossa jäljellä oleva elementti poistuu populaatiosta ("kuole") tämän ajanjakson aikana. Intensiteettifunktion arvio lasketaan seuraavasti:
Tämän lausekkeen osoittaja on ehdollinen todennäköisyys sille , että tapahtuma tapahtuu välissä, jos sitä ei ole tapahtunut aiemmin, ja nimittäjä on välin leveys.
Tämä on aika-akselin piste, jossa kumulatiivinen eloonjäämisfunktio on 0,5. Muut kumulatiivisen eloonjäämisfunktion prosenttipisteet (kuten 25. ja 75. prosenttipiste tai kvartiilit) lasketaan samalla tavalla.
Selviytymismallit voidaan mielekkäästi esittää lineaarisina regressiomalleina , koska kaikki yllä luetellut jakaumien perheet voidaan pelkistää lineaarisiksi sopivilla muunnoksilla. Tässä tapauksessa elinikä on riippuvainen muuttuja.
Jakaumien parametriperheen tuntemalla voidaan laskea todennäköisyysfunktio saatavilla olevista tiedoista ja löytää sen maksimi. Tällaisia arvioita kutsutaan maksimitodennäköisyyden arvioiksi. Hyvin yleisillä olettamuksilla nämä arviot ovat yhtäpitäviä pienimmän neliösumman arvioiden kanssa. Vastaavasti todennäköisyysfunktion maksimi löytyy nollahypoteesista, eli mallista, joka sallii eri intensiteetit eri aikavälein. Muotoiltua hypoteesia voidaan testata esimerkiksi todennäköisyyssuhdetestillä, jonka tilastoissa on asymptoottinen khin neliöjakauma .
Yleisesti ottaen elinkaaritaulukko antaa hyvän käsityksen esineiden vikojen tai kuolemien jakautumisesta ajan kuluessa. Ennusteen tekemiseksi on kuitenkin usein tarpeen tietää tarkasteltavan eloonjäämisfunktion muoto.
Eloonjäämisanalyysin yhteydessä mallien rakentamiseen käytetään useimmiten seuraavia jakaumaperheitä:
Sensuroitujen mutta ryhmittämättömien elinikäisten havaintojen osalta selviytymisfunktio voidaan arvioida suoraan (ilman elinikätaulukkoa). Oletetaan, että on tietokanta, jossa jokainen havainto sisältää täsmälleen yhden aikavälin. Kerrotaan eloonjäämistodennäköisyydet kussakin välissä, saadaan seuraava kaava eloonjäämisfunktiolle:
Tässä lausekkeessa , on selviytymisfunktion arvio, on tapahtumien kokonaismäärä (loppuajat), on yksittäisen tapahtuman järjestysluku (kronologisesti), joka on yhtä suuri kuin 1, jos -. tapahtuma tarkoittaa epäonnistumista (kuolemaa) ja 0, jos -. tapahtuma tarkoittaa havainnon menetystä (sensurointia), tarkoittaa tuloa kaikista aikaan mennessä suoritetuista havainnoista .
Kaplan ja Meyer (1958) ehdottivat ensimmäisen kerran tämän selviytymisfunktion arvion, jota kutsutaan kertojaestimaatiksi.