Kahden kirjekuoren ongelma

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 2.5.2021 tarkistetusta versiosta . tarkastukset vaativat 8 muokkausta .

Kahden kirjekuoren ongelma ( The paradox of two envelopes ) on hyvin tunnettu paradoksi, joka osoittaa sekä todennäköisyysteorian subjektiivisen käsityksen piirteet että sen sovellettavuuden rajat . Kahden kirjekuoren varjossa tämä paradoksi ilmestyi 1980-luvun lopulla , vaikka matemaatikot ovat tunteneet sen eri muotoiluissa 1900-luvun ensimmäisestä puoliskosta lähtien .

Sanamuoto

Siinä on kaksi erottumatonta kirjekuorta, joissa on rahaa. Yhdessä on kaksi kertaa suurempi määrä kuin toisessa. Tämän summan arvoa ei tiedetä. Kirjekuoret annetaan kahdelle pelaajalle. Jokainen heistä voi avata oman kirjekuorensa ja laskea siinä olevat rahat. Sen jälkeen pelaajien on päätettävä: kannattaako vaihtaa kirjekuorensa jonkun muun?

Molemmat pelaajat väittelevät seuraavasti. Näen summan kirjekuoressani . Jonkun toisen kirjekuoressa on yhtä todennäköistä, että tai löytyy . Siksi, jos vaihdan kirjekuorta, minulla on keskimäärin , eli enemmän kuin nyt. Vaihto on siis hyvä. Vaihdosta ei kuitenkaan voi olla hyötyä molemmille pelaajille. Missä on virhe heidän perusteluissaan?

Historia

Vuonna 1953 belgialainen matemaatikko Maurice Krajczyk ehdotti samanlaista ongelmaa käyttämällä esimerkkinä kahta sidettä [1] :

Molemmat kasvot väittävät, että hänen solmionsa on kauniimpi. Riidan ratkaisemiseksi he kääntyvät välimiehen puoleen. Voittajan on annettava häviäjälle tasapeli lohdutukseksi. Jokainen kiistan osapuoli väittää seuraavasti: ”Tiedän, kuinka paljon solmioni maksaa. Voin hävitä sen, mutta voin myös voittaa paremman tasapelin, joten minulla on etu tässä kiistassa. Kuinka yhdessä pelissä, jossa on kaksi osallistujaa, etu voi olla kummankin puolella?

Krajczyk väittää, että pelissä on symmetriaa, mutta ehdottaa, että on väärin käyttää todennäköisyyttä 1/2 keskimääräistä tuloa laskettaessa [2] :

Molempien riidan osanottajien näkökulmasta peli on symmetrinen ja kummallakin on yhtä suuri todennäköisyys voittaa. Todennäköisyys ei kuitenkaan ole objektiivisesti annettu tosiasia, ja se riippuu ongelman ehtojen tuntemisesta. Tässä tapauksessa on järkevää olla yrittämättä arvioida todennäköisyyttä.

Alkuperäinen teksti  (englanniksi)[ näytäpiilottaa] Kilpailijoiden kannalta peliolosuhteet ovat symmetriset, joten kullakin on puolet voiton todennäköisyydestä. Todellisuudessa todennäköisyys ei kuitenkaan ole objektiivisesti annettu tosiasia, vaan riippuu olosuhteiden tiedosta. Tässä tapauksessa on viisasta olla yrittämättä arvioida todennäköisyyttä.

Ongelmasta tuli suosittu Martin Gardnerin ansiosta , joka kuvaili sitä vuonna 1982 otsikolla "Kenen lompakko on lihavampi?" [3] . Gardner on Krajczykin kanssa samaa mieltä siitä, että peli on "reilu" (symmetrinen) ja että peli ei voi olla hyödyllinen molemmille osapuolille samanaikaisesti, ja myös siitä, että pelaajien päättely vaikuttaa kyseenalaiselta:

Voiko sama peli "olla kannattavampi" kummallekin kumppanille? On selvää, että ei voi. Eikö paradoksi johdu siitä, että jokainen pelaaja uskoo virheellisesti, että hänen mahdollisuutensa voittaa ja hävitä ovat samat?

Gardner kuitenkin huomauttaa myös, että Krajczyk ei toimittanut yksityiskohtaista matemaattista analyysiä ongelmasta:

valitettavasti tämä ei kerro meille mitään siitä, missä tarkalleen on virhe kahden pelaajan päättelyssä. Yritimme kuinka tahansa, emme ole koskaan löytäneet yksinkertaista ja tyydyttävää ratkaisua Krajczykin paradoksiin.

Tulevaisuudessa ongelmaa kutsuttiin "kahden arkun paradoksiksi", "kahden taskun paradoksiksi", "vaihdon paradoksiksi" jne.

Uusi kiinnostus paradoksiin nousi sen jälkeen, kun Barry Nailbuff julkaisi Journal of Economic Perspectives -lehdessä artikkelin, jossa luetellaan useita paradokseja todennäköisyysteoriassa [4] . Saatuaan monia vastauksia tähän julkaisuun hän valmisteli toisen artikkelin "The Other Person's Envelope on Always Greener" ( eng. The Other Person's Envelope on Always Greener ), joka oli omistettu suoraan kirjekuoriongelmalle [2] . Hänen ehdotuksessaan on kaksi kirjekuorta [2] :  

Yhteen kirjekuoreen laitetaan tietty määrä rahaa, jota muut eivät tiedä, ja tämä kirjekuori annetaan Alille. Sitten heitetään salaa kolikkoa. Jos se tulee esiin, toinen kirjekuori kaksinkertaistuu ensimmäisen kirjekuoren määrällä. Muussa tapauksessa puolet määrästä laitetaan toiseen kirjekuoreen. Tämä kirjekuori annetaan Baballe. Ali ja Baba voivat avata kirjekuorensa kertomatta toisilleen siellä näkemänsä summat. Sen jälkeen he voivat (yhteisestä sopimuksesta) vaihtaa kirjekuoria.

Oletetaan, että Ali näkee kirjekuoressaan 10 dollaria. Ali ehdottaa, että Baballa on yhtä todennäköisesti 5 tai 20 dollaria kirjekuoressa. Tässä tapauksessa kirjekuorien vaihto tuo Alille 2,5 dollaria (tai 25 %). Samoin Baba uskoo, että Alin kirjekuori sisältää yhtä todennäköisesti kaksi kertaa pienemmän tai suuremman määrän kuin mitä hänellä on. Siksi kirjekuoria vaihtaessaan hän saa keskimäärin . Siten Baba odottaa myös saavansa keskimäärin 25 % tuloistaan ​​verrattuna kirjekuorensa määrään.

Tämä on kuitenkin paradoksaalista. Kirjekuorien vaihtamisesta ei voi olla hyötyä molemmille osallistujille. Missä on virhe heidän perusteluissaan?

Alkuperäinen teksti  (englanniksi)[ näytäpiilottaa] Sinulla on kaksi kirjekuorta. Asetat yhteen piilotetun summan rahaa ja annat kirjekuoren Alille. Heität sitten piilotetun kolikon. Jos se tulee mieleen, asetat toiseen kirjekuoreen kaksi kertaa alkuperäisen rahasumman. Jos se tulee esiin, laitat vain puolet alkuperäisestä määrästä toiseen kirjekuoreen. Annat tämän toisen kirjekuoren Baballe. Toistaiseksi molempien kirjekuorien sisältö on piilotettu, samoin kuin kolikonheiton tulos. Ali ja Baba saavat tarkastella yksityisesti omissa kirjekuorissaan olevia rahamääriä. Sitten heille annetaan mahdollisuus vaihtaa kirjekuoria, jos molemmat ovat samaa mieltä. Oletetaan väittelyn vuoksi, että Ali löytää kirjekuorestaan ​​10,00 dollaria. Ali perustelee, että Baballa on yhtä todennäköisesti $5.00 tai $20.00. Kaupankäynti kirjekuorilla antaa hänelle 2,50 dollarin (tai 25 prosentin) odotetun voiton. Toimiessaan riskineutraalisti, hän haluaisi vaihtaa. Nyt Baba katsoo kirjekuorensa sisään. Riippumatta siitä, minkä summan hän löytää (joko $ 5,00 tai $ 20,00), hän myös perustelee, että Alilla on yhtä todennäköisesti puolet tai kaksinkertainen summa. Odotus on 0,5[0,5X + 2X] = 1,25X, joten hänkin odottaa 25 prosentin voittoa kirjekuorten vaihtamisesta. Mutta tämä on paradoksaalista. Molempien kirjekuorien summa on mikä tahansa. Kaupankäyntikirjekuoret eivät voi parantaa molempia osallistujia. Silti he molemmat odottavat saavansa 25 prosentin voittoa. Missä he menivät pieleen?

Nailbufin muunnos ongelman olosuhteisiin ja hänen ehdottamansa ratkaisut mahdollistivat paljon selvennyksen paradoksien olemuksesta . Kuitenkin kolikon heittäminen ensimmäisen kirjekuoren täyttämisen jälkeen rikkoi huomattavasti pelaajien pääosien alkuperäistä symmetriaa. Päätettäessä painopiste siirtyi Baban lähtöolosuhteiden epätasaisuuden osoittamiseen Aliin verrattuna. Siksi jatkokehityksen seurauksena [5] kolikko katosi ongelman tilasta, jonka avulla Nailbuf määritti toisen kirjekuoren sisällön.

Toistaiseksi tunnetuin ja matemaatikoille eniten kiinnostava ympäristö on täysin symmetrinen ympäristö, jossa ulkoisesti erottumattomat kirjekuoret sisältävät vähemmän ja kaksi kertaa enemmän, ja toinen kirjekuorista voidaan avata ennen keskustelun aloittamista pörssin kannattavuudesta.

Paradoksin ratkaisu

Nailbufin [2] näkökulmasta ensimmäisen tyydyttävän selityksen hänen ongelmastaan ​​antaa Sandi Zabell artikkelissa "Tappiot ja voitot: vaihdon paradoksi" [6] . Nailbuf kirjoittaa jonkin verran parfrasoimalla:

Baba katsoo, että näkemällään summalla ei ole väliä, kun otetaan huomioon mahdollisuus, että myöhemmin hänen kirjekuorensa sisältää suuremman määrän. Tämä tarkoittaa, että Baba ajattelee, että todennäköisyys, että hänen kirjekuorensa määrä on suurempi, on 1/2, riippumatta näkemästä määrästä. Tämä on totta vain, jos jokainen arvo nollasta äärettömyyteen on tasatodennäköinen. Mutta jos kaikki äärettömät mahdollisuudet ovat yhtä todennäköisiä, jokaisen arvon mahdollisuus on nolla todennäköisyydellä. Silloin jokaisen tuloksen mahdollisuus on nolla. Ja tämä on hölynpölyä.

Alkuperäinen teksti  (englanniksi)[ näytäpiilottaa] Baba uskoo, että hänen näkemänsä määrä on epätietoinen suhteessa sen posterioriseen todennäköisyyteen, että hänen kirjekuorensa sisältää suuremman määrän. Tämä tarkoittaa, että Baba uskoo, että todennäköisyys, että hänen kirjekuorensa sisältää suuremman määrän, on ½ riippumatta siitä, minkä määrän hän näkee kirjekuoressa. Tämä on totta vain, jos jokainen arvo nollasta äärettömään on yhtä todennäköinen. Mutta jos ääretön määrä mahdollisuuksia ovat kaikki yhtä todennäköisiä, minkä tahansa tuloksen mahdollisuuden on oltava nolla. Silloin jokaisella tuloksella on nolla mahdollisuus, ja tämä on hölynpölyä. Muodollinen argumentointi

Merkitään todennäköisyydellä, että Alin kirjekuori sisältää summan x . Kun Baba tarkkailee X -määrää kirjekuoressaan , ehdollinen todennäköisyys , että Alilla on kirjekuoressaan 2 X

Ongelman muotoilussa Baba pitää tätä todennäköisyyttä 1/2 riippumatta siitä, minkä määrän X hän näkee kirjekuoressaan. Siksi kaikille . Vastaavasti sen on oltava vakio välillä 0 ja ääretön. Tällainen oletus on kuitenkin virheellinen: jos todennäköisyys on positiivinen ja vakio koko positiivisella puoliakselilla, niin sen integraali on yhtä suuri kuin ääretön, mikä on mahdotonta. Paradoksin alkuperäinen oletus ( Х /2 ja 2 Х yhtäläisyys ) on siis mahdoton toteuttaa.

Paradoksin ratkaisu alkuperäisessä muotoilussa.

Merkitään ensimmäisen pelaajan kirjekuoressa oleva summa merkillä , toisen pelaajan kirjekuoren määrä merkillä ja niiden suhde . Tehtävän ehdon mukaan se ottaa arvot 2 ja 1/2 todennäköisyyksillä 1/2 ja siten . Sama voidaan sanoa käänteisluvun jakautumisesta (ja siten odotuksesta) . Satunnaismuuttujien jakautumisesta ei ole tietoa , paitsi että niiden suhde jakautuu kuvatun lain mukaan. Pelaajat tarkkailevat kirjekuorissaan yhden testin tuloksia "omien" satunnaismuuttujiensa yli, mutta eivät tiedä tätä tulosta toisen pelaajan kohdalla ja kirjekuorissa olevien summien suhdetta. Merkitse - ensimmäisen pelaajan voitto (vaihdon tapauksessa) ja vastaavasti - toisen pelaajan voitto. Silloin kokonaisvoitto on ja erityisesti . Samaan aikaan:

,

missä yhtäläisyys kysymyksen kanssa on tosi, jos suuret ja eivät ole korreloineet (erityisesti jos ne ovat riippumattomia). Samoin

,

missä yhtäläisyys kysymyksen kanssa on totta, jos suuret ja eivät korreloi (erityisesti jos ja ovat riippumattomia).

"Naiivin" havainnon tapauksessa pelaaja pitää arvoa ja "omaa" arvoa ( tai ) riippumattomina, eli testistä huolimatta hän pitää a posteriori -jakaumaa samana kuin a priori. Ehkä yksi niistä on oikeassa, sitten yksi yhtäläisyyksistä kysymyksen kanssa on totta. Mutta kumpikaan yhtäläisyys ei voi olla totta, koska tässä tapauksessa se osoittautuisi .

Näin ollen on mahdollista, että joku pelaajista on oikeassa pitäessään vaihtoa hyödyllisenä itselleen - tämä on esimerkiksi totta, jos hänen kirjekuorensa summa ja kirjekuorissa olevien määrien suhde ovat riippumattomia (tai ei ainakaan korreloivat). Mutta molemmille kerralla se on mahdotonta, joten ei ole ristiriitaa.

Esimerkiksi Nailbufin formulaatiossa määrät ja ovat vain riippumattomia (ja siksi eivät korreloi), koska kolikkoa heitetään ja pudotetaan riippumatta Alin kirjekuoren määrästä. Näin ollen vaihto on hänelle hyödyllistä. Mutta se on aivan yhtä epäedullista Baballe. Jos Baba suostuu vaihtoon, se johtuu joko siitä, että hän ei voi ymmärtää tällaisen skenaarion kannattamattomuutta hänelle tai siitä, että pelin järjestäjät johdattivat hänet harhaan.

Koko tämän tilanteen näennäinen paradoksi (ei-ilmeisyys) voidaan eliminoida ymmärtämällä, että raha ei kierrä vain kahden pelaajan kirjekuorissa, vaan myös pelin järjestäjien (sponsoreiden) kanssa. Eli pelaajia on itse asiassa kolme. Edellä mainitut äärettömyyden tasa-arvoa koskevat pohdinnat (kaikkien tulosten yhtäläisen todennäköisyyden mahdottomuus) muotoillaan sitten sen mukaan, ovatko sponsorit äärettömän rikkaita vai ovatko heidän pääomansa rajalliset. Ensimmäisessä tapauksessa ei ole ristiriitaa, ja pelaajien intuitio vaihdon kannattavuudesta on jokseenkin oikea - heidän kokonaistulonsa on otettu äärettömän rikkaalta sponsorilta. Toisessa tapauksessa kaikkien summien tasatodennäköisyys kirjekuorissa on mahdotonta, koska integraalin täytyy konvergoida. Tämä tarkoittaa, että tietyn määrän havainnointi kirjekuoressa yleisesti ottaen vaikuttaa jotenkin kirjekuorissa olevien määrien suhteen todennäköisyyteen.

Muistiinpanot

  1. Maurice Kraitchik. La mathematique des jeux! – 1953.
  2. 1 2 3 4 Nalebuff B. Palapelit. Toisen henkilön kirjekuori on aina vihreämpää  //  Journal of Economic Perspectives. - 1989. - Voi. 3 , ei. 1 . - s. 171-181.  (linkki ei saatavilla)
  3. Gardner M. Arvaa! - M .: Mir, 1984. - S. 139. - 214 s. - 100 000 kappaletta.
  4. Nalebuff B. Palapelit: Siideri korvassa, jatkuva dilemma, viimeinen tulee ensin ja paljon muuta  //  Journal of Economic Perspectives. - 1988. - Voi. 2 , ei. 2 . - s. 149-156.
  5. Mark D. McDonnell, Derek Abbott. Satunnaistettu vaihto kahden verhokäyrän ongelmassa  // Proc . R. Soc. A. - 2009.  
  6. Zabell S. Kolmannen Valencian kansainvälisen kokouksen julkaisu  //  Clarendon Press, Oxford. - 1988. - s. 233-236.