Todennäköisyyssuhde on matemaattisissa tilastoissa käytetty ominaisuus (venäjäksi se on lyhenne "ОШ", englanniksi "OR" odds ratiosta) kuvaamaan kvantitatiivisesti piirteen A ja piirteen B välisen suhteen läheisyyttä joissakin tilastoväestössä.
Harkitse tämän indikaattorin laskemisen periaatetta hypoteettisessa esimerkissä. Oletetaan, että useilta vapaaehtoisilta kysytään kaksi kysymystä:
Lisäksi jokaiselle osallistujalle on mahdollista määrittää, onko hänellä ominaisuus "A" (esimerkiksi "korkea verenpaine (BP)") ja ominaisuus "B" (esimerkiksi "kuluttaa kohtalaisesti alkoholia"). Koko osallistujaryhmän tutkimuksen tuloksena on rakennettava sellainen kiinteä indikaattori, joka luonnehtisi kvantitatiivisesti ominaisuuden "A" ja "B":n esiintymisen välistä suhdetta väestössä. Tällaisia ominaisuuksia on kolme, ja yksi niistä on kerroinsuhde (OR), joka lasketaan kolmessa vaiheessa:
Termi "osallistuja" ei välttämättä tarkoita henkilöä, populaatio voi sisältää mitä tahansa esineitä, sekä elävää että elotonta luontoa.
Jos TAI on suurempi kuin 1, ominaisuuden "A" läsnäolo liittyy ominaisuuteen "B" siinä mielessä, että "B":n läsnäolo lisää (suhteessa "B":n puuttumiseen) todennäköisyyttä saada "A" .
Tärkeä huomautus : lisääntynyt OR (OR> 1) ei ole todiste syy-yhteydestä "B":n ja "A:n" välillä. Vaikka joissakin tapauksissa ominaisuus "B" voi olla syynä ominaisuuteen "A" (esimerkiksi sateen määrä ja vedenkorkeus säiliössä), TAI määrittää vain piirteiden välisen suhteen läheisyyden.
On täysin mahdollista, että on olemassa väärä yhteys, jonka välittää jokin muu ominaisuus "C", joka saa aikaan sekä "A" että "B" ominaisuudet ( väärä korrelaatio ). Esimerkissämme väärä korrelaatio voi ilmetä seuraavasti: vapaaehtoisten tutkimusryhmässä alkoholia maltillisesti juovilla ihmisillä on taipumus alentaa verenpainetta, mutta vapaaehtoisia yrittäessään pakottaa alkoholia (tietenkin kohtuudella) jotka eivät olleet aiemmin käyttäneet alkoholia, havaitsimme, että heidän verenpaineensa ei muutu keskimäärin. Tällaisia ristiriitaisia tuloksia voidaan hypoteettisesti selittää ulkoisen tekijän vaikutuksella: esimerkiksi tutkimusryhmässä on pääasiassa ihmisiä, jotka ovat juoneet alkoholia pitkään ja säännöllisesti kohtuudella, joilla on voimakkaat sopeutumismekanismit, jotka hypoteettisesti voivat ilmenee verenpaineen laskuna.. Näin ollen tekijä "sopeutuminen" on tässä ulkopuolinen.
Kaksi muuta tapaa kvantifioida kahden laadullisen ominaisuuden yhteyttä ovat suhteellinen riski ("RR") ja absoluuttinen riskin vähentäminen ("ARR"). Kliinisissä kokeissa ja monissa muissa tapauksissa kiinnostavin ominaisuus on RR, joka lasketaan samalla tavalla, paitsi että kertoimien sijaan käytetään todennäköisyyksiä. Valitettavasti tutkijat joutuvat usein tilanteeseen, jossa käytettävissä olevien tietojen perusteella voidaan laskea vain OR, erityisesti tapaus-verrokkitutkimuksissa . Kuitenkin, kun jokin ominaisuuksista, esimerkiksi A, on riittävän harvinainen (" harvinaisen tapauksen oletus "), niin "A":n TAI, jos osallistujalla on "B", on hyvä RR:n likiarvo (edellyttää "A:ta, kun ehto B" on pakollinen, koska OR ottaa molemmat ominaisuudet huomioon symmetrisesti, kun taas OR ja muut ominaisuudet eivät).
Teknisesti sanottuna todennäköisyyssuhde on vaikutuksen koon mitta, joka kuvaa kahden kaksiarvoisen (binäärisen) suuren välisen suhteen tai suhteen vahvuutta. Sitä käytetään kuvaavana tilastona ja sillä on tärkeä rooli logistisessa regressiossa .
Kuvitellaanpa joku harvinainen sairaus, jota sairastaa esimerkiksi vain yksi monista tuhansista aikuisista maassa. Oletetaan, että on olemassa jokin tekijä (esimerkiksi tietty lapsuudessa saatu trauma), joka lisää todennäköisyyttä, että aikuinen sairastuu tiettyyn sairauteen tulevaisuudessa. Tässä tapauksessa informatiivisin olisi riskisuhde (RR). Mutta sen laskemiseksi meidän pitäisi kysyä kaikilta väestön aikuisilta a) onko heillä vamma lapsuudessa ja b) onko heillä sairaus nyt. Sen jälkeen saamme tietoa lapsuudessa trauman saaneiden kokonaismäärästä (altistuneen ryhmän määrä) , joista he sairastuivat jatkossa ja pysyivät terveinä; sekä niiden ihmisten kokonaismäärä, joilla ei ollut lapsuudessa traumaa (valottumattoman ryhmän volyymi), joista sairastui ja pysyi terveenä. Koska samanlainen summa on myös "NE"-indekseille, meillä on neljä itsenäistä numeroa, jotka voimme kirjoittaa taulukkoon :
sairas | Terve | |
Tekijä läsnä (vaikutettu) | ||
Ei tekijää (ei vaikuta) |
Väärinkäsitysten välttämiseksi jatkossa korostamme, että kaikki nämä luvut on saatu yleisestä perusjoukosta, ei otoksesta.
Nyt riski sairastua vamman yhteydessä on (missä ) ja sairauden kehittymisen riski ilman vammaa . Suhteellinen riski (RR) on kahden luvun suhde:
joka voidaan kirjoittaa uudelleen näin
Harkitse mahdollisuuksia kehittyä sairaus, joka on vamman sattuessa ja jos vahinkoa ei ole . Todennäköisyyssuhde (OR) on kahden luvun suhde:
joka voidaan kirjoittaa uudelleen näin
Koska sairaus on harvinainen TAI≈OR. Todellakin, harvinaisen sairauden kohdalla meillä on siis , mutta , eli toisin sanoen altistuneella ryhmällä, riski sairastua on suunnilleen sama kuin todennäköisyys. Samanlainen päättely saa meidät ymmärtämään, että riski on suunnilleen yhtä suuri kuin mahdollisuus altistumattomalle ryhmälle; mutta silloin vaarasuhde, joka on OR, on suunnilleen yhtä suuri kuin todennäköisyyssuhde, joka on OR . Voidaan myös nähdä, että olettamus harvinaisesta sairaudesta osoittaa, mitä siitä seuraa, eli toisin sanoen OR- ja OR-lausekkeiden nimittäjät ovat suunnilleen samat. Osoittajat ovat täsmälleen samat, ja siksi päätämme jälleen, että OSH≈OR.
Palatakseni hypoteettiseen tutkimukseemme, hyvin yleinen ongelma on, että meillä ei ehkä ole tietoja, joita tarvitsemme arvioidaksemme kaikkia näitä neljää numeroa. Meillä ei esimerkiksi välttämättä ole koko väestöä koskevia tietoja lapsuuden trauman olemassaolosta tai puuttumisesta.
Voimme usein kiertää tämän ongelman ottamalla satunnaisia otantoja yleisestä väestöstä: eli jos sairaudet tai altistuminen vammoihin lapsuudessa ei ole harvinaista väestössä, voimme valita satunnaisesti esimerkiksi sata ihmistä ja löytää nämä neljä numeroa annettu näyte; olettaen, että tämä otos on riittävän edustava, tässä otoksessa laskettu RR on hyvä likiarvo koko populaation RR:lle.
Samaan aikaan jotkut sairaudet voivat olla niin harvinaisia, että suuressakaan otoksessa ei kaiketi voi olla yhtään tapausta (tai niitä voi olla niin vähän, ettei tilastollisesta merkityksestä voi olla kysymys). Tästä syystä RR:n laskeminen tulee mahdottomaksi. Mutta voimme kuitenkin saada arvion RR:stä näissä olosuhteissa, koska toisin kuin sairaus, lapsuuden traumalle altistuminen ei ole harvinainen tapahtuma. Sairauden harvinaisuuden vuoksi tämä olisi tietysti myös vain arvio RR:stä.
Katsotaanpa viimeistä lauseketta RR:lle: voimme arvioida osoittajan murto-osuuden keräämällä kaikki tunnetut sairaustapaukset (olettaen, että tällaisia tapauksia on, muuten emme aloittaisi tutkimusta ollenkaan) ja katsomalla kuinka monet sairaat ihmiset paljastuivat ja kuinka monet eivät. Ja nimittäjässä oleva murto-osa on todennäköisyys, että väestön terve henkilö loukkaantui lapsuudessa. Huomaa nyt, että nämä mahdollisuudet voidaan itse asiassa arvioida satunnaisotannalla väestöstä, kuten aiemmin todettiin, että traumaaltistumisen esiintyvyys lapsuudessa on riittävän korkea, jotta riittävän kokoinen satunnaisotos sisältää hyvin todennäköisesti huomattavan määrän altistuneita. ihmiset. Siksi täällä sairaus on hyvin harvinainen, mutta sen aiheuttava tekijä ei ole enää niin harvinainen; Vastaavat tilanteet ovat käytännössä yleisiä.
Näin ollen voimme arvioida OR:n ja sitten taudin harvinaisuutta käyttäen todeta, että tämä arvio on myös hyvä RR:n likiarvo. Muuten, tarkasteltu tapaus on yleinen tapauskontrolli-tutkimusongelma. [yksi]
Samanlainen päättely voidaan suorittaa turvautumatta OR-käsitteen käyttöön esimerkiksi seuraavasti: koska meillä on suhteita ja siksi saamme . Siksi, jos satunnaisotannalla pyrimme arvioimaan suhdetta , niin sairauden harvinaisuuden olettamukseen turvautumalla saadaan, että sen hyvä arvio on arvo , jota tarvitsimme (ja tiedämme jo tutkittuamme useita sairaustapaukset) saadakseen OR:n laskemista varten. Hyvänä käytäntönä pidetään kuitenkin OR-arvon ilmoittamista tuloksia julkaistaessa, mutta sillä edellytyksellä, että OR on suunnilleen sama.
Todennäköisyyssuhde on murto-osa, jonka osoittajassa on jonkin tapahtuman todennäköisyys yhdelle ryhmälle ja nimittäjässä saman tapahtuman todennäköisyydet, mutta toiselle ryhmälle. Tätä lauseketta käytetään myös otossuhdeestimaattien laskemiseen. Ryhmät voivat olla miehiä ja naisia, kokeellisia ja kontrolliryhmiä sekä mikä tahansa kaksijakoisuus . Jos tapahtuman todennäköisyys kussakin ryhmässä on merkitty p 1 :llä (ensimmäinen ryhmä) ja p 2 :lla (toinen ryhmä), niin kerroinsuhde on yhtä suuri:
missä q x = 1 − p x . Todennäköisyyssuhde 1 tarkoittaa, että tutkittavalla tapahtumalla on yhtä suuri mahdollisuus molemmissa ryhmissä. Todennäköisyyssuhde, joka on suurempi kuin 1, tarkoittaa, että tapahtuma tapahtuu todennäköisemmin ensimmäisessä ryhmässä. Ja kerroinsuhde, joka ei ylitä yhtä, osoittaa, että tapahtumalla on pienempi mahdollisuus ensimmäisessä ryhmässä. Kerroinsuhde on aina ei-negatiivinen arvo (jos sen arvo on määritelty). Arvosta tulee määrittelemätön, jos p 2 q 1 on nolla, eli jos p 2 on nolla tai q 1 on nolla.
Todennäköisyyssuhde voidaan määrittää kahden binaarisen satunnaismuuttujan yhteisellä todennäköisyysjakaumalla . Binääristen satunnaismuuttujien X ja Y yhteinen jakauma on annettu taulukosta
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
jossa p 11 , p 10 , p 01 ja p 00 ovat ei-negatiivisia yhteistodennäköisyyksiä, joiden summa on 1. Y :n kertoimet kahdessa ryhmässä, jotka määritellään ehdoilla X = 1 ja X = 0, lasketaan käyttämällä X :lle annettuja ehdollisia todennäköisyyksiä , eli P ( Y | X ):
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
Todennäköisyyssuhde tulee siis olemaan
Yllä olevan lausekkeen oikealla puolella oleva murto-osa on helppo muistaa yhteensopivien solujen todennäköisyyksien tulona ( X = Y ) jaettuna yhteensopimattomien solujen todennäköisyyksien tulolla ( X ≠ Y ). Vaikka luokkien määrittäminen 0:lla ja 1:llä on mielivaltaista, sääntö täsmäävistä ja ei-sovittavista soluista pysyy voimassa.
Jos laskemme kerroinsuhteen käyttämällä ehdollisia todennäköisyyksiä, jotka on annettu Y ,
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
saamme saman tuloksen
Muilla binääritietovaikutuksen koon mittareilla, kuten suhteellisella riskillä , ei ole tätä symmetriaominaisuutta.
Jos X ja Y ovat riippumattomia, niiden yhteistodennäköisyydet voidaan ilmaista marginaalisilla todennäköisyyksillä p x = P ( X = 1) ja p y = P ( Y = 1) seuraavasti:
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
Tässä tapauksessa kerroinsuhde on yhtä suuri kuin yksi ja päinvastoin, jos kerroinsuhde on yksi, yhteistodennäköisyydet voidaan esittää tällaisina tuloina. Todennäköisyyssuhde on siis yhtä suuri kuin yksi, jos ja vain jos X ja Y ovat riippumattomia .
Todennäköisyyssuhde on yhteistodennäköisyyksien funktio, ja päinvastoin yhteistodennäköisyydet voidaan rekonstruoida, jos kerroinsuhde ja marginaalitodennäköisyydet tunnetaan.
P ( X = 1) = p 11 + p 10 ja P ( Y = 1) = p 11 + p 01 . Jos kerroinsuhde R on eri kuin 1, niin:
jossa p 1• = p 11 + p 10 , p •1 = p 11 + p 01 ja
Yhtälön R = 1 tapauksessa meillä on riippumattomuus, joten p 11 = p 1• p •1 .
Koska tunnemme p 11 , loput kolme todennäköisyyttä määritetään helposti marginaalisista todennäköisyyksistä.
Oletetaan, että 100 miehen otoksesta 90 joi viiniä viimeisen viikon aikana, kun taas 100 naisen näytteessä vain 20 joi viiniä samana ajanjaksona. Todennäköisyys, että mies juo viiniä, on 90-10 eli 9:1, kun taas naisten samat mahdollisuudet ovat vain 20-80 eli 1:4 = 0,25:1. Todennäköisyyssuhde on 9/0,25 eli 36, mikä osoittaa, että paljon suurempi määrä miehiä juo viiniä. Tarkemmat laskelmat:
Tämä esimerkki osoittaa, kuinka paljon kerroinsuhteet eroavat eri laskentajärjestelmissä: viininjuojien otoksessa miehiä on 90/20 = 4,5 kertaa enemmän kuin naisia, mutta samalla heillä on 36 kertaa suuremmat mahdollisuudet. Todennäköisyyssuhteen logaritmi, todennäköisyyksien logit - ero , lieventää tätä vaikutusta ja antaa symmetriaominaisuuden suhteessa ryhmien järjestykseen. Esimerkiksi soveltamalla luonnollista logaritmia kerroinsuhteeseen 36/1 saadaan 3,584, ja jos sama tehdään suhteella 1/36, saadaan −3,584.
Todennäköisyyssuhteita koskevien tilastollisten hypoteesien testaamiseen on kehitetty useita lähestymistapoja.
Yksi lähestymistapa perustuu kerroinsuhteen logaritmin otosjakauman approksimoimiseen (eli kerroinsuhteen luonnolliseen logaritmiin ). Jos käytämme merkintää yhteistodennäköisyyksien suhteen, yleisen todennäköisyyssuhteen logaritmi on yhtä suuri kuin
Jos esitämme kokeen tulokset ehdollisuustaulukon muodossa
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
yhteisjakauman todennäköisyysarviot voidaan määritellä seuraavasti:
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
missä p ̂ ij = n ij / n ja n = n 11 + n 10 + n 01 + n 00 on taulukon kaikkien neljän solun arvojen summa. Otoskerroinsuhteen logaritmi on:
.Todennäköisyyssuhteen logaritmin jakauma on hyvin approksimoitu normaalijakaumalla parametrien kanssa:
Todennäköisyyssuhteen logaritmin keskivirhe arvioidaan kaavalla
.Tämä approksimaatio on asymptoottinen ja voi siksi antaa merkityksettömän tuloksen, jos jokin solu sisältää liian pienen luvun. Jos merkitsemme L : llä otoskerroinsuhteen logaritmia, likimääräinen arvio 95 % :n luottamusvälistä yleisen todennäköisyyssuhteen logaritmille määritetään normaalimallin puitteissa seuraavasti: L ± 1,96 SE . [2] Voit päästä eroon logaritmista käyttämällä muunnoksia exp( L − 1.96SE), exp( L + 1.96SE) ja saat 95 %:n luottamusvälin kertoimelle. Jos haluat testata hypoteesia, että yleinen kerroinsuhde on yhtä suuri kuin yksi, voit määrittää p-tilaston kaksisuuntaiseksi arvoksi 2 P ( Z < −| L |/SE), jossa P on todennäköisyys ja Z on normaali normaalijakauma .
Toinen lähestymistapa mahdollistaa otoskerroinsuhteen alkuperäisen jakauman palauttamisen jossain määrin. Tätä varten piirteiden X ja Y marginaalitaajuudet ovat kiinteät ja arvot taulukon soluissa muuttuvat peräkkäin tai satunnaisesti. On helppo ymmärtää, että vain yksi taulukon soluista voi muuttua, koska kaikki muut määräytyvät vakioiden marginaalitaajuuksien ehdon perusteella.
Logistinen regressio on yksi tapa määrittää kahden binäärimuuttujan todennäköisyyssuhde. Oletetaan, että on yksi riippuvainen binäärimuuttuja Y , yksi riippumaton binäärimuuttuja X (ennustaja) ja joukko muita ennustajia Z 1 , …, Z p , jotka voivat ottaa mitä tahansa arvoja. Jos käytämme Y:n moninkertaista logistista regressiota X , Z 1 , … , Z p :lle, kerroinestimaatti X :lle liittyy ehdolliseen kerroinsuhteeseen. Nimittäin yleisen väestön tasolla
niin on myös arvio annetusta ehdollista kerroinsuhdetta. Arvo tulkitaan tässä tapauksessa estimaatiksi Y :n ja X :n välisestä todennäköisyyssuhteesta muuttujien Z 1 , …, Z p kiinteille arvoille .
Kun data on edustava otos, taulukon p ̂ij solujen todennäköisyydet tulkitaan populaation kunkin neljän ryhmän frekvensseiksi X- ja Y -arvojen yhdistelmien mukaisesti . Monissa tapauksissa edustavan näytteen käyttö on epäkäytännöllistä, joten valikoivaa näytteenottoa käytetään usein. Esimerkiksi objektit, joilla on X = 1 tietyllä todennäköisyydellä f , valitaan otoksesta huolimatta niiden todellisesta esiintymistiheydestä yleisessä populaatiossa (tämän seurauksena objektit, joiden ominaisuus on X = 0, valitaan väistämättä todennäköisyydellä 1 − f ) . Tässä tapauksessa saamme seuraavat yhteistodennäköisyydet:
Y = 1 | Y = 0 | |
X = 1 | ||
x = 0 |
Tietyn jakauman todennäköisyyssuhde p 11 p 00 / p 01 p 10 ei riipu f :stä . Tämä esimerkki osoittaa, että todennäköisyyssuhde (ja vastaavasti kerroinsuhteen logaritmi) on invariantti ei-satunnaisille näytteille yhden tutkittavan muuttujan suhteen. On kuitenkin syytä huomata, että kerroinsuhteen logaritmin keskivirhe riippuu f :stä .
Invarianssiominaisuutta käytetään kahdessa erittäin tärkeässä tilanteessa:
Molemmissa tilanteissa todennäköisyyssuhde voidaan arvioida ilman harhaa valikoivasta otantadatasta.
Logistisen regression laajan käytön vuoksi kerroinsuhdetta käytetään usein lääketieteellisessä ja yhteiskunnallisessa tutkimuksessa. Todennäköisyyssuhdetta käytetään yleisesti kyselylomakkeissa, epidemiologiassa ja kliinisten tutkimusten , kuten tapauskontrollien , tulosten raportoinnissa . Raporteissa se on useimmiten lyhennetty "OR". Siinä tapauksessa, että useiden tutkimusten tulokset yhdistetään, käytetään nimeä "yhdistetty TAI".
Kliinisissä ja muissa tutkimuksissa suhteellinen riskiominaisuus on kiinnostavampi kuin todennäköisyyssuhde. Suhteellinen riski määritetään parhaiten populaatiosta, mutta jos harvinaisen sairauden oletus pitää paikkansa, todennäköisyyssuhde on hyvä likiarvo suhteellisen riskin arvioimiseksi - kertoimet ovat murto-osa muotoa p / (1 - p ), joten p lähestyessä nolla, 1 - p lähestyy yhtä, mikä tarkoittaa, että kertoimet ovat lähempänä riskiarvoa ja näin ollen kerroinsuhde on lähempänä suhteellista riskiä. [3] Kun oletusta harvinaisesta sairaudesta ei voida perustella, todennäköisyyssuhde voi yliarvioida suhteellisen riskin. [4] [5] [6]
Jos absoluuttisen riskin arvo tunnetaan kontrolliryhmässä, siirtyminen arvosta toiseen suoritetaan lausekkeella: [4]
missä:
Lääketieteellisessä kirjallisuudessa todennäköisyyssuhde sekoitetaan usein suhteelliseen riskiin. Muiden kuin tilastotieteilijöiden yleisölle kerroinsuhteen käsite on vaikea ymmärtää, ja siksi sillä on vaikuttavampi vaikutus lukijaan. [7] Useimmat kirjoittajat uskovat kuitenkin, että suhteellinen riski on helppo ymmärtää. [8] Eräässä tutkimuksessa havaittiin, että kansallisen sairauden torjuntasäätiön jäsenet tiesivät 3,5 kertaa todennäköisemmin kuin kukaan muu tietyn sairauden hoidon yleisistä periaatteista, mutta todennäköisyyssuhde oli 24, ja tämä esitettiin artikkelin mukaan tämän järjestön jäsenet "yli 20 kertaa todennäköisemmin tietävät hoidosta". [9] Kahden lehden artikkelien tutkimus osoitti, että 26 %:ssa artikkeleista todennäköisyyssuhde tulkittiin riskisuhteeksi. [kymmenen]
Tämä saattaa viitata siihen, että kirjoittajat, joilla ei ole aavistustakaan tämän arvon olemuksesta, pitävät sitä ilmaisuvoimaisimpana julkaisussaan. [8] Mutta sen käyttö voi joissain tapauksissa olla harhaanjohtavaa. [11] Aikaisemmin sanottiin, että todennäköisyyssuhteen tulisi kuvata vaikutuksen mitta, kun riskisuhdetta ei voida arvioida suoraan. [7]
Toinen kerroinsuhteen ainutlaatuinen piirre on suoran matemaattisen palautuvuuden ominaisuus, esimerkiksi ongelman lauseesta riippuen: tutkiaksesi vapautumista jostain taudista tai tämän taudin esiintymistä, sairaudesta vapauden TAI on käänteinen ( tai 1/OR) OR:sta sairauden esiintymisen vuoksi. Tämä on "todennäköisyyssuhteen invarianssi"-ominaisuus, jota suhteellisella riskiarvolla ei ole. Tarkastellaanpa sitä esimerkillä:
Oletetaan, että kliinisen tutkimuksen tapahtumariski on 4/100 lääkeryhmässä ja 2/100 lumeryhmässä, eli tapahtuman RR = 2 ja OR = 2,04166, kun verrataan lääke-plaseboryhmiä. Toisaalta, jos käännämme analyysin päinvastaiseksi ja tarkastelemme riskiä siitä, ettei tapahtumaa tapahdu, lääkkeellä hoidetulla ryhmällä on 94/100 riskiä, ettei tapahtumaa saa ja 98/100 lumeryhmässä, eli RR = 0,9796 ei-tapahtuma, kun verrataan lääke-plaseboryhmiä, mutta TAI = 0,48979. Kuten voidaan nähdä, TAI = 0,9796 ei ole TAI = 2:n käänteisluku. Päinvastoin, OR = 0,48979 on itse asiassa TAI = 2,04166:n käänteisluku.
Tämä on "todennäköisyyssuhteen invarianssin" ominaisuus, jonka vuoksi tapahtumasta vapautumisen OR ei ole sama kuin tapahtuman riskin OR, kun taas OR:lla on tämä symmetriaominaisuus vapauden tai riskin analyysissä. Vaara OR:n kliiniselle tulkinnalle syntyy, kun tapauksen todennäköisyys on korkea, ja erot liioittuvat, jos oletus harvinaisesta sairaudesta ei täyty. Toisaalta, kun sairaus on todella harvinainen, RR:n käyttäminen vapauden kuvaamiseen (esimerkiksi RR = 0,9796 yllä olevasta esimerkistä) voi hämärtää lääkkeeseen tai altistumiseen liittyvän tapahtuman riskin kaksinkertaistamisen kliinisen vaikutuksen.
Otoskerroinsuhde n 11 n 00 / n 10 n 01 on helppo laskea, ja se antaa keskisuurille ja suurille näytteille hyvän arvion kokonaiskertoimesta. Kun yksi tai useampi ehdollisuustaulukon solu sisältää pienen arvon, todennäköisyyssuhde voi vääristyä ja saada suuren varianssin . Todennäköisyyssuhteelle on ehdotettu useita vaihtoehtoisia arvioita, joilla on paremmat ominaisuudet tällaisissa olosuhteissa. Yksi vaihtoehto on ehdollinen maksimitodennäköisyyden estimointi, joka perustuu rivien ja sarakkeiden summaan määrittämään maksimoitava todennäköisyysfunktio (samanlainen kuin Fisherin tarkka testi ). [12] Vaihtoehtona on Mantel-Haenszelin arvio .
Seuraavat neljä ristiintaulukkoa sisältävät yhteiset absoluuttiset taajuudet sekä vastaavat otoskertoimet ( OR ) ja logaritmit otoskerroinsuhteista ( LOR ):
TAI =1, LOR =0 | TAI =1, LOR =0 | TAI = 4, LOR = 1,39 | TAI = 0,25, LOR = -1,39 | |||||
---|---|---|---|---|---|---|---|---|
Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | |
X = 1 | kymmenen | kymmenen | 100 | 100 | kaksikymmentä | kymmenen | kymmenen | kaksikymmentä |
x = 0 | 5 | 5 | viisikymmentä | viisikymmentä | kymmenen | kaksikymmentä | kaksikymmentä | kymmenen |
Seuraavat yhteisjakaumien taulukot sisältävät yleiset yhteistodennäköisyydet sekä vastaavat yleiset kerroinsuhteet ( OR ) ja logaritmit yleisistä kerroinsuhteista ( LOR ):
TAI =1, LOR =0 | TAI =1, LOR =0 | TAI = 16, LOR = 2,77 | TAI = 0,67, LOR = -0,41 | |||||
---|---|---|---|---|---|---|---|---|
Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | |
X = 1 | 0.2 | 0.2 | 0.4 | 0.4 | 0.4 | 0.1 | 0.1 | 0.3 |
x = 0 | 0.3 | 0.3 | 0.1 | 0.1 | 0.1 | 0.4 | 0.2 | 0.4 |
Esimerkki 1: riskin vähentäminen | Esimerkki 2: riskin lisääminen | |||||
---|---|---|---|---|---|---|
Kokeellinen ryhmä (E) | Kontrolliryhmä (C) | Tulokset | (E) | (C) | Tulokset | |
Tapaukset (E) | EE = 15 | CE=100 | 115 | EE = 75 | CE=100 | 175 |
Ei-satunnainen (N) | FI = 135 | CN = 150 | 285 | FI = 75 | CN = 150 | 225 |
Yhteensä (S) | ES = EE + EN = 150 | CS=CE+CN=250 | 400 | ES = 150 | CS = 250 | 400 |
Ilmaantuvuusprosentti (ER) | EER = EE / ES = 0,1 tai 10 % | CER = CE / CS = 0,4 tai 40 % | EER = 0,5 (50 %) | CER = 0,4 (40 %) |
Kaava | Indeksi | Lyh. | Esimerkki 1 | Esimerkki 2 |
---|---|---|---|---|
EER − CER | < 0: absoluuttisen riskin väheneminen | ARR | (−)0,3 tai (−)30 % | Ei käytössä |
> 0: absoluuttisen riskin kasvu | ARI | Ei käytössä | 0,1 tai 10 % | |
(EER − CER) / CER | < 0: Suhteellisen riskin vähennys | RRR | (−)0,75 tai (−)75 % | Ei käytössä |
> 0: lisääntynyt suhteellinen riski | RRI | Ei käytössä | 0,25 tai 25 % | |
1/(EER − CER) | < 0: hoitoon tarvittava numero | NNT | (−)3.33 | Ei käytössä |
> 0: riskitekijän vaadittu luku | NNH | Ei käytössä | kymmenen | |
EER/CER | Suhteellinen riski | RR | 0,25 | 1.25 |
(EE / FI) / (CE / CN) | kerroinsuhde | TAI | 0,167 | 1.5 |
EER − CER | Ominaisuuden riski | AR | (−)0,30 tai (−)30 % | 0,1 tai 10 % |
(RR − 1) / RR | Suhteellinen katsottava riski | ARP | Ei käytössä | kaksikymmentä% |
1 - RR (tai 1 - TAI) | Ennaltaehkäisevä ryhmä | PF | 0,75 tai 75 % | Ei käytössä |