Dempster-Schaferin teoria

Dempster-Schaferin teoria on matemaattinen todisteiden teoria ([SH76]) , joka perustuu uskomusfunktioihin ja uskottavaan päättelyyn , jota käytetään yhdistämään erillisiä tietoja (todisteita) tapahtuman todennäköisyyden laskemiseksi. Teorian kehittivät Arthur P. Dempster ja Glenn Schafer .

Harkitse kahta mahdollista pelaajaa

Ensimmäinen peli on kolikonheitto, jossa lyödään vetoa siitä, nouseeko se päätä vai häntää. Kuvittele nyt toinen peli, jossa vedot asetetaan maailman parhaan nyrkkeilijän ja maailman parhaan painijan välisen taistelun lopputulokseen. Oletetaan, että olemme tietämättömiä kamppailulajeista, ja meidän on hyvin vaikea päättää, kenelle panostaa.

Monet ihmiset ovat vähemmän luottavaisia toisen pelin tilanteessa, jossa todennäköisyyksiä ei tunneta, kuin ensimmäisessä pelissä, jossa on helppo nähdä, että kunkin tuloksen todennäköisyys on puolet. Toisen pelin tapauksessa Bayesin teoria antaa puolet todennäköisyydestä kullekin tulokselle riippumatta tiedoista, jotka tekevät toisesta lopputuloksesta todennäköisemmän. Dempster-Schaferin teorian avulla voit määrittää pelaajan luottamuksen asteen eri tulosten todennäköisyyksien suhteen.

Formalisointi

Antaa olla universaali joukko , Joukko kaikki lausunnot huomioon. Eksponentiaalinen joukko , on joukon kaikkien osajoukkojen kokoelma , mukaan lukien tyhjä joukko . Esimerkiksi jos: $X$ $P(X)$ $X$ $\emptyset$

$X=\left\{a,b\right\}$

sitten

${\displaystyle P(X)=\left\{\emptyset ,\left\{a\right\},\left\{b\right\},X\right\))$

Määritelmän mukaan tyhjän joukon massa on nolla:

$m(\emptyset )=0$

Eksponentiaalijoukon muiden elementtien massat normalisoidaan yksikkösummaksi:

$1=\sum _{A\in P(X)} m(A)$

Eksponentiaalisen joukon elementin massa ilmaisee kaikkien asiaankuuluvien ja saatavilla olevien todisteiden suhdetta, joka tukee väitettä, että tietty elementti kuuluu , mutta ei kuulu mihinkään :n osajoukkoon . Määrä viittaa vain joukkoon eikä luo lisälauseita muista osajoukoista , joilla jokaisella on määritelmän mukaan oma massansa. $m(A)$ $A$ $X$ $A$ $A$ $m(A)$ $A$ $A$

Annettujen massojen perusteella on mahdollista määrittää mahdollisuuksien alueen ylä- ja alarajat. Tämä väli sisältää tarkasteltavan osajoukon todennäköisyyden tarkan arvon (klassisessa merkityksessä), ja sitä rajoittaa kaksi ei-additiivista jatkuvaa mittaa, joita kutsutaan uskomukseksi ( tai tueksi ) ja uskottavuudeksi ( uskotettavuus ) :

$bel(A)\leq P(A)\leq pl(A)$

Joukon luottamus määritellään tarkasteltavan joukon oikeiden osajoukkojen kaikkien massojen summana: $bel(A)$ $A$

$bel(A)=\sum _{B\mid B\subseteq A}m(B)$

Todennäköisyys on kaikkien tarkasteltavan joukon kanssa leikkaavien joukkojen massojen summa : $pl(A)$ $B$ $A$

$pl(A)=\sum _{B\mid B\cap A\neq \emptyset }m(B)$

Nämä kaksi toimenpidettä liittyvät toisiinsa seuraavasti:

$pl(A)=1-bel({\overline {A)))$

Yllä olevasta seuraa, että riittää, että tietää ainakin yksi mittareista (massa, luottamus tai todennäköisyys) jäljellä olevien kahden laskemiseksi.

Harkitse kahden riippumattoman määritettyjen massojen yhdistämisen ongelmaa. Alkuperäinen liitossääntö, joka tunnetaan nimellä Dempsterin yhdistelmäsääntö , on yleistys Bayesin säännöstä. Tämä sääntö korostaa useiden lähteiden välistä sopimusta ja jättää huomioimatta kaikki ristiriitaiset todisteet normalisoinnin kautta. Tämän säännön käytön laillisuus kyseenalaistetaan vakavasti, jos tietolähteiden välillä on merkittäviä epäjohdonmukaisuuksia.

Itse asiassa liitto (kutsutaan lisätyksi massaksi ) lasketaan kahdesta massajoukosta seuraavasti : $m_1$ $m_2$

$m_{1,2}(\emptyset )=0$

$m_{1,2}(A)={\frac {1}{1-K}}\sum _{B\cap C=A\neq \emptyset }m_{1}(B)m_{2 }(C)$

missä:

$K=\sum _{B\cap C=\emptyset }m_{1}(B)m_{2}(C)$

$K$ on kahden massan välisen konfliktin mitta. Normalisointitekijä , vastaa epäjohdonmukaisuuksien jättämistä kokonaan huomiotta ja tyhjän joukon osoittamista mille tahansa konfliktia vastaavalle massalle. Siksi tämä operaatio johtaa ristiriitaisiin tuloksiin merkittävissä konflikteissa tietyissä olosuhteissa. $1-K$

Keskustelu

Uskottavuus ja uskottavuus

Shaferin lähestymistapa antaa meille mahdollisuuden tulkita luottamusta ja todennäköisyyttä hypoteesin mahdollisen totuuden välin rajoihin:

luottamus ≤ jokin totuuden mitta ≤ uskottavuus .

Oletetaan, että:

Luottamus hypoteesiin = {hypoteesia yksiselitteisesti tukevien todisteiden summa}. Todennäköisyys = 1 − {kaikkien hypoteesin kanssa ristiriitaisten todisteiden massojen summa}.

Oletetaan esimerkiksi, että meillä on hypoteesi "laatikossa oleva kissa on kuollut". Jos hänen luottamus on 0,5 ja todennäköisyys on 0,8, tämä tarkoittaa, että meillä on todisteita (kokonaispainolla 0,5), jotka osoittavat yksiselitteisesti, että kissa on kuollut; mutta on myös todisteita (kokonaispaino 0,2), jotka osoittavat yksiselitteisesti, että kissa on elossa (todennäköisyys "kissa on kuollut" = 1 - 0,2 = 0,8). Jäljelle jäävä massa (täydentää 0,5 ja 0,2 - 1,0), joka on myös ero todennäköisyyden 0,8 ja luotettavuuden välillä 0,5, vastaa "epävarmuutta" ("universaali" hypoteesi), todisteiden olemassaoloa siitä, että on ehdottomasti olemassa kissa laatikossa, mutta ei sano mitään siitä, onko hän elossa vai kuollut.

Kaiken kaikkiaan aikaväli [0,5; 0,8] luonnehtii alkuperäisen hypoteesin totuuden epävarmuutta käytettävissä olevan näytön perusteella.

Hypoteesi	Paino	Luottamus	Uskottavuus
Nolla (ei kissaa)	0	0	0
Elossa	0.2	0.2	0.5
Kuollut	0.5	0.5	0.8
Universaali (joko elävä tai kuollut)	0.3	1.0	1.0

"Nolla"-hypoteesin painoarvoksi on asetettu määritelmän mukaan 0 (se vastaa tapauksia, joissa "ei päätöstä" tai todisteiden välillä on ratkaisematonta ristiriitaa). Tämä johtaa siihen, että luottamus "nolla"-hypoteesiin on 0 ja "universaalin" hypoteesin todennäköisyys on 1. Koska "universaalin" hypoteesin massa lasketaan "elävien" ja " kuollut" hypoteesi, sen luottamus on automaattisesti yhtä suuri kuin 1 ja nollahypoteesin todennäköisyys on 0.

Otetaan hieman monimutkaisempi esimerkki, joka osoittaa luottamuksen ja uskottavuuden piirteet. Oletetaan, että käytämme ilmaisimia rekisteröimään yhden etäisen signaalipalon, joka voi olla yksi kolmesta väristä (punainen, keltainen tai vihreä):

Hypoteesi	Paino	Luottamus	Uskottavuus
Nolla	0	0	0
Punainen	0,35	0,35	0,56
Keltainen	0,25	0,25	0,45
Vihreä	0,15	0,15	0,34
Punainen tai Keltainen	0,06	0,66	0,85
Punainen tai Vihreä	0,05	0,55	0,75
Keltainen tai Vihreä	0,04	0,44	0,65
Universaali	0.10	1.00	1.00

missä esimerkiksi:

Luottamus (punainen tai keltainen) = massa (nollahypoteesi) + massa (punainen) + massa (keltainen) + massa (punainen tai keltainen) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Todennäköisyys (punainen tai keltainen) = 1 − itseluottamus (punainen tai keltainen kieltäminen) = 1 − luottamus (vihreä) = 1 − massa (nollahypoteesi) − massa (vihreä) = 1 − 0 − 0,15 = 0,85

Tämän joukon tapahtumia ei tule pitää tapahtumien leikkauspisteenä todennäköisyysavaruudessa, koska ne on annettu massaavaruudessa. On oikein pitää tapahtumaa "Punainen tai keltainen" tapahtumien "Punainen" ja "Keltainen" liittona ja (katso todennäköisyysteorian aksioomat) P(Punainen tai keltainen) ≥ P(keltainen) ja P (Universaali) = 1, jossa "Universaali" hypoteesi vastaa 'punaista', 'keltaista' tai 'vihreää'. TDS:ssä "universaalin" hypoteesin massa vastaa todistetta, jota ei voida liittää mihinkään muuhun hypoteesiin; eli todisteita, jotka väittävät jonkinlaisen signaalin olleen, mutta eivät puhu ollenkaan sen väristä.

Tässä esimerkissä "punaisen tai vihreän" todisteen massa on 0,05. Tällaisia todisteita voitaisiin saada esimerkiksi ihmisiltä, joilla on punainen/vihreä sokeus. TDS antaa meille mahdollisuuden tarkastella tällaisia todisteita tasapainoisella tavalla.

Kirjallisuus

[DE68] Dempster, Arthur P.; Bayesilaisen päätelmän yleistys , Journal of the Royal Statistical Society, Series B, Voi. 30, s. 205–247, 1968
[SH76] Shafer, Glenn; A Mathematical Theory of Evidence , Princeton University Press, 1976
[SH02] Shafer, Glenn; Dempster-Shaferin teoria , 2002
Dempster, AP Moniarvoisen kartoituksen indusoimat ylemmät ja pienemmät todennäköisyydet // The Annals of Mathematical Statistics. - 1967. - Voi. 38 , ei. 2 . — s. 325–339 . doi : 10.1214 / aoms/1177698950 .
Fine, Terrence L. Katsaus: Glenn Shafer, A matemaattinen todisteiden teoria // Bull . amer. Matematiikka. Soc.. - 1977. - Voi. 83 , no. 4 . — s. 667–672 . - doi : 10.1090/s0002-9904-1977-14338-3 .
Jøsang, A. ja Simon, P. Dempsterin sääntö pienten värillisten pallojen näkemyksenä // Computational Intelligence. - 2012. - Vol. 28 , ei. 4 . - s. 453-474 . - doi : 10.1111/j.1467-8640.2012.00421.x .
Jøsang, A., Diaz, J. ja Rifqi, M. Kumulatiivinen ja keskiarvoinen uskomusten fuusio // Information Fusion. - 2010. - Vol. 11 , ei. 2 . — s. 192–200 . - doi : 10.1016/j.inffus.2009.05.005 .
Pearl, J. Todennäköisyysintervalleista // International Journal of Approximate Reasoning. - 1988. - Voi. 2 , ei. 3 . — s. 211–216 . - doi : 10.1016/0888-613X(88)90117-X .
Pearl, J. Päättely uskomusfunktioilla: Yhteensopivuuden analyysi // The International Journal of Approximate Reasoning. - 1990. - Voi. 4 , ei. 5/6 . — s. 363–389 . - doi : 10.1016/0888-613X(90)90013-R .