Játékos tönkremeneteli probléma

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. február 13-án felülvizsgált verziótól ; az ellenőrzések 5 szerkesztést igényelnek .

A játékos tönkretételének  problémája a valószínűségszámítás területéről származik . Ezt részletesen megvizsgálta A. N. Shiryaev orosz matematikus a "Valószínűség" [1] monográfiájában .

Megfogalmazás

Két játékos ül az asztalnál . Az elsőnek rubel, a másodiknak rubel áll a rendelkezésére . Előttük az asztalon egy aszimmetrikus érme fekszik (az előlap kiesésének valószínűsége 0-tól 1-ig tetszőleges számmal egyenlő lehet). Ha az érme előlapja esik az érmére, akkor az első játékos nyeri a rubelt (a második játékos fizet az elsőnek 1 rubelt), ha pedig a fordítottja esik, az első játékos fizet a másodiknak. Meg kell találni annak valószínűségét, hogy az egyik játékos lépésenként nullára veszít , és minden játékos elvesztésének valószínűségét. Ki kell számítani a játék átlagos hosszát is.

Ezt a helyzetet hasonló módon lehet modellezni: van egy vándorrészecske és egy folyosó . Azt a valószínűséget vesszük figyelembe, hogy a részecske lépésenként hagyja el a folyosót (átcsúszik a felső vagy az alsó falon).

Bernoulli-séma

Tekintsük a Bernoulli-sémát kísérletekkel .

Legyen  egy valószínűségi tér, ahol

A fenti kifejezésben a kiesett egységek száma a következőképpen található: .

Bemutatjuk a Bernoulli valószínűségi változók sorozatát:

Valószínűség normalizálási részprobléma

Bizonyítsd


Megoldás

Ez annak köszönhető, hogy

, hiszen feltétel szerint .

A valószínűségi változók függetlenségének részproblémája ξ i

Bizonyítsd be, és függetlenek.


Megoldás

A valószínűségi változók függetlensége azt jelenti

mutassuk meg:

Véletlenszerű séta

A Bernoulli-séma esetében egyetértünk a ξ valószínűségi változó következő jelentésével: azt jelenti, hogy a második játékos fizeti az elsőt, az első játékos pedig a másodikat.

Vezessünk be egy új jelölést:

, .

A szám  megegyezik a játék időtartamával, és a sorozat felfogható valamely részecske nulláról induló véletlenszerű sétájának pályájának, miközben az egyenlőség nyilvánvaló , és ez azt jelenti, hogy az első játékos nyer a második felett (ami negatív lehet).


Legyen ,  két egész szám, , . Meg kell találni, hogy mekkora valószínűséggel valósul meg lépésenként a részecske kilépése a és által határolt folyosóból .

Továbbá  legyen egy egész szám, . Legyen ezért is ( ami azt jelenti, hogy a játékosok nem nulla tőkével kezdtek el játszani). Hadd . Tegyük fel, hogy ha . Ha a részecske soha nem lépte át a határokat, akkor meghatározatlan.

Mindegyiknél a pillanatot leállási pillanatnak nevezzük , amely az elemi események terén meghatározott valószínűségi változó .  az az esemény, hogy a ponttól induló véletlenszerű séta az adott időpontban elhagyja az intervallumot . Vezessünk be új jelölést: , for . Legyen ,  annak a valószínűsége, hogy a részecske időben kilép az intervallumból a és pontokban .

Legyen ; nyilvánvaló, hogy (amíg a játék el nem indul, a részecske az 1-es valószínűségű intervallumon belül van). Most engedd . Majd a teljes valószínűségi képlet szerint

Ismétlődő részprobléma

Bizonyítsd

(1 )

(2) .

Bizonyíték.

(1) Bizonyítsuk be, hogy .

, ahol  a forma pályáinak halmaza , amely először hagyja el az intervallumot a pontban (az ábrán látható). Ha egy véletlen vektor egy megfelelő pályára esik, akkor beleesik a halmazba . A halmazt ábrázoljuk . A diszjunkt unió legitim, mert a pályán haladó bármely részecske rendelkezik .  azok a pályák , amelyekről .  azok a pályák , amelyekről . Ne feledje, hogy a -tól induló pályák mindegyike egy az egyhez egyezik a -tól induló pályával . Az egy-egy levelezést ellentmondás bizonyítja . Tegyük fel, hogy (kétértelmű levelezés); akkor ez a pálya nem lesz képes lépésenként (de csak a folyosó felső falától való kezdeti távolság miatt) kivinni a részecskét a folyosóból. Ellenkező irányban a megfelelés is egy az egyhez a definíciótól: . Ebből az következik, hogy (mivel ezek független azonos eloszlású valószínűségi változók ).

Van egy másik módszer is a bizonyításra:

.

Ez igaz, mert a valószínűségek függetlenek (ezt korábban bebizonyították).


(2) Hasonló módon bebizonyítjuk, hogy .

Minden -tól induló pálya egytől egyig megfelel a -tól induló pályával . Innen

Az ismétlődési reláció származtatása

Az és igaz egyenletből következik :

, for .


A teljes valószínűségi képlet szintén a következő eredményt adja: .


Vegye figyelembe azt is, hogy , és ezért a . Ez az állítás igaz, hiszen minden olyan pályához, amely kevesebb lépésben viszi ki a részecskét, az elejéhez hozzá lehet adni egy lépést ( ), amelynél a részecske a (for )-ból és a ( ) felől is eljuthat a pontba.

Valószínűségek keresése

Megfelelően nagy esetén a valószínűség közel van  - az egyenlet megoldásához olyan feltételek mellett, hogy (a kilépés a pontból azonnal megtörtént  - a játék vége, az első játékos nyert), (az első játékos soha nem fog nyerni, ha a kilépés azonnal megtörténik pontban ). Ezek a feltételek abból a tényből következnek, hogy . Ez ebben a részben is bebizonyosodik.

Először megkapjuk az egyenlet megoldását . Legyen a játék igazságtalan ( ). Ebben az esetben megtaláljuk az egyenlet gyökereit, azaz . Egy adott megoldás azonnal látható: . Egy másik megoldást találunk  a függvény tényének felhasználásával. Célszerű relációval rendelkező kifejezést használni , tekintettel arra, hogy : . Ezért ésszerű azt feltételezni, hogy . Egy állandó hozzáadása nem változtat semmit, mert .

Most nézzük meg az általános megoldást: . Ugyanazokat a feltételeket használjuk, mint és , és ezt kapjuk

Részprobléma a megoldás egyediségével kapcsolatban

Bizonyítsuk be e probléma megoldásának egyediségét. Ehhez megmutatjuk, hogy a probléma bármely peremfeltételes megoldása ábrázolható .


Megoldás

Tekintsen valamilyen megoldást az alábbi feltételek mellett : . Ekkor mindig lehet olyan konstansokat választani , hogy , . Ekkor a feltett probléma egyenletéből az következik, hogy . Akkor általános esetben . Ezért a megoldás egyedülálló. Pontosan ugyanez a gondolatmenet alkalmazható a .

Konvergencia korlátozása

Vegyük fontolóra a és -hoz és -hez való konvergenciát korlátozó sebesség kérdését . A séta az origóból induljon ( ). Az egyszerűség kedvéért , , . Más szóval,  egy mínusz a folyosót elhagyó részecske valószínűségeinek összege – annak a valószínűsége, hogy a részecske a folyosón vándorolni fog: . eseményt képvisel . Vegyünk egy számot , ahol és egy valószínűségi változók láncát . Ha a teljes vagyont jelöljük -re , akkor . Ennek ésszerű magyarázata van: ha a részecske kimegy a nullából, és nem lépi át a határokat, akkor a darabok összege határozottan kisebb, mint a teljes készlet.

A valószínűségi változók függetlenségének részproblémája ζ i

Bizonyítsuk be, hogy függetlenek és egyenlő eloszlásúak . Elég annak bizonyítása, hogy függetlenek, mivel mindegyiküknek binomiális eloszlása ​​van .


Megoldás

Bizonyítsuk be

.


Térjünk vissza a konvergencia mérlegeléséhez.

Az imént bebizonyítottakból az következik, hogy .

Tekintsük a : szórást (ami teljesen jogos, hiszen , és  egy módosított Bernoulli valószínűségi változó ), ezért kellően nagy és esetén igaz: , ahol , mivel ha , akkor . Ha vagy , akkor kellően nagyra igaz, hogy így az egyenlőtlenség igaz . A fentiekből következik, hogy ahol . Azóta akkor ; óta és , akkor ; at . Hasonló becslések érvényesek a különbségekre is , és mivel ezek a különbségek redukálhatók a különbségekre és a , -ra .

Térjünk vissza a mérlegelésre . Az egyenlet megoldásával analóg módon azt mondhatjuk, hogy a peremfeltételek közötti egyenletnek egyedi megoldása van.

Bármelyiknél könnyen belátható . Ha a játék tisztességes (az előlap valószínűsége egyenlő a fordított valószínűséggel), akkor a megoldások így fognak kinézni: , .

Válasz a tönkremenetel valószínűségére

A mennyiségek és az első és második játékos tönkremeneteli valószínűségének nevezhető a kezdőtőkével és a végtelenbe hajló lépésszámmal, és a valószínűségi változót az első játékos nyereségeként, illetve az  első játékos veszteségeként jellemzi. A következőkben bemutatjuk, miért is lehet ilyen sorozatot felépíteni.

Ha , akkor a függvény intuitív jelentése annak  a valószínűsége, hogy a pozíciót elhagyó részecske nullánál korábban éri el a felső falat ( ). A képletekből látható, hogy

.

A kedvezőtlen játékra tett fogadás növelésének paradoxona

Mit tegyen az első játékos, ha számára kedvezőtlen a játék?

A veszteség valószínűségét a képlet adja meg .


Most döntse el az első tőkével rendelkező játékos, hogy megduplázza a tétet, és játsszon két rubelért, azaz , , . Ekkor a következőképpen jelöljük az első játékos tönkremenetelének limitáló valószínűségét: .

Ezért , mivel megszorozzuk egy törttel, amely nagyobb, mint egy -nél .


Ezért, ha az első játékos számára annyira kívánatos előlap megszerzésének valószínűsége kisebb, mint , akkor számára előnyös, ha 1-szeresére növeli a tétet: ez csökkenti a végső tönkremenetelének valószínűségét a tény, hogy a folyosóról való kiugrás valószínűsége a ponton nő . Ez a döntés paradoxnak tűnik, hiszen úgy tűnik, hogy egy kedvezőtlen helyzetben csökkenteni kell a tétet és csökkenteni a veszteséget, de a valóságban végtelen számú játék és alacsony tét esetén a vesztes játékos végül nullára veszít, a játékos pedig nagy tét esetén nagyobb eséllyel találja el a játék pontban történő befejezéséhez elegendő számú előlapot .

Egy véletlenszerű séta időtartama

Tekintsük részecskénk járásának átlagos időtartamát. Bemutatjuk a játék leállásának pillanatának matematikai elvárását: for . Vezessünk le egy ismétlődési relációt a játék időtartamára vonatkozó matematikai elvárásra:

For és a függvény rekurzív relációját kaptuk : for .


Vezessünk be peremfeltételeket: ha a játék a vagy ponton kezdődik , akkor azonnal véget ér - az időtartama 0: .


Az ismétlődési relációból és a peremfeltételekből ki lehet számítani . Mivel tehát van egy határ , amely kielégíti a relációt : végrehajtáskor . Ezek az átmenetek hasonlóak azokhoz, amelyeket figyelembe vettünk a veszteség valószínűségi egyenletben való átlépéskor. Ennek az egyenletnek a megoldásához még egy feltételt kell bevezetni: a mozdulatok számára vonatkozó elvárásnak végesnek kell lennie, azaz , , .


Oldjuk meg ezt az egyenletet. A veszteség valószínűségi egyenletében ( ) adott megoldásokat és már megkaptuk . Itt még egy versenyző jelenik meg egy adott megoldás szerepére: , tehát . A peremfeltételt figyelembe véve az előzőleg kapott összefüggések segítségével találjuk meg : . Ideális érme esetén a következő kifejezést kapjuk: . A peremfeltétel alkalmazása a következőt adja: . Ebből az következik, hogy egyenlő induló tőkék esetén . Például, ha minden játékosnak 5 rubelje van, és a tét 1 rubel, akkor a játékosok átlagosan 25 lépés után tönkremennek.

A fenti képletek figyelembevételekor azt feltételeztük, hogy a mozdulatok számának matematikai elvárása véges: . Most ennek a ténynek a bizonyítását javasoljuk.

A várható mozgásszám végességének problémája

Bizonyítsd be .


Megoldás

Elegendő ezt az esetre igazolni (mivel korábban már kiderült, hogy az esetek redukálhatók és változatára ) , majd megvizsgáljuk az esetet .

Tehát vegye figyelembe a sorozatot , és vezessen be egy valószínűségi változót , ahol  a leállási idő.

Hadd . Az értelmezés a következő:  a véletlenszerű séta értéke pillanatnyilag . Ha , akkor ; ha , akkor . Emlékezzünk vissza , és bizonyítsuk be , hogy .


Az első egyenlőség bizonyítására ezt írjuk: . Teljesen nyilvánvaló , hogy mivel , at . Ezt kell bebizonyítani .

Mert igaz, hogy . Az utolsó eseményt úgy ábrázolhatjuk, mint ahol  a halmaz valamely részhalmaza . Ez a készlet csak a következőhöz van meghatározva . Nagy értékek esetén nem befolyásolja . A nézetkészletet úgy is ábrázolhatjuk, mint . A függetlenség miatt (a 2. részfeladatban bizonyított ) ebből következik, hogy a és a valószínűségi változók függetlenek. Ezért annak a ténynek köszönhető, hogy az első tényező nulla.

Megállapítást nyert, hogy egy ideális érméhez .

Ebben az esetben vannak relációk (mert ) és , mivel . Most ezt mutassuk meg .

Tisztességes játék esetén a reláció alapján igaz, hogy . Akkor tehát . Az egyenlőtlenségből következik, hogy a matematikai elvárás a határértékhez konvergál . Tisztességtelen játék esetén . Mivel a részecskének a folyosóból való első kirepülésének pillanatát jelzővel jelöltük, matematikai elvárása kisebb bizonyos számoknál, tehát kisebb a végtelennél. Ilyen feltételek mellett .

Számítógépes szimuláció (Monte Carlo módszer)

A játék szimulálásához a MATLAB programot fogjuk használni .

Először generálunk egy sorozatot , majd némi kezdeti gazdagsággal létrehozunk egy láncot :

A sorozat ξ (getXI)

n = 100_ _ % A \xi_i sorozat hossza U = rand ( n , 1 ); % 100 véletlenszerű egyenletes [0;1] értéket generál XI = nullák ( n , 1 ); % Tartalék memória 100 módosított Bernoulli számára q = 0,55 ; % fordított valószínűség p = 1 - q ; % Averz valószínűség % A következő ciklus Bernoulli-eloszlást hoz létre egyenletes [0;1] alapján ha i = 1 : n % Ez a ciklus a [0;1] tömböt 2 részre osztja: q és p hosszúságok, q+p=1 if ( U ( i , 1 ) < q ) XI ( i , 1 ) = - 1 ; % Ha egyenletes véletlenszerű érték esik q-ba, akkor \xi=-1 különben XI ( i , 1 ) = 1 ; % Ha egy egyenletes véletlen érték p-be esik, akkor \xi=+1 vége vége x = 10 ; % Kezdeti 1. játékos költségvetési eltolása S = nullák ( n , 1 ); % Tartalék memória 100 S_1...S_100 számára i = 1 esetén : n % Készítsen S_k sorozatot az S_{k+1} szabály szerint = S_k + \xi_{k+1} S ( i , 1 ) = x + összeg ( XI ( 1 : i , 1 )); %, figyelembe véve a kezdeti jóléti ellentételezést x vége

Ezután bevezetjük a getS(n, q, x) függvényt , amely a fenti listához hasonlóan nem csak egy sorozatot generálna azonnal és azonnal, hanem lehetővé teszi a beírt értékek alapján általánosított sorozat felépítését anélkül, hogy bonyolítja a számításokat. Ez leegyszerűsíti a munkaterületet.

Sorozatgenerálás (getS függvény)

függvény [S] = getS ( n, q, x ) % Ez a függvény n, q és x függvénye --- 3 változó U = rand ( n , 1 ); XI = nullák ( n , 1 ); i = 2 esetén : n % Uniform->Bernoulli eloszlás transzformáció if ( U ( i , 1 ) < q ) XI ( i , 1 ) = - 1 ; különben XI ( i , 1 ) = 1 ; vége vége S = nullák ( n , 1 ); % Tartalék memória n S_1...S_n számára ha i = 2 : n % Számítsa ki az S_1...S_n sorozatot S ( i , 1 ) = összeg ( XI ( 1 : i , 1 )); % Összegezi a \xi-t vége S = x + S ; % A kezdeti jólétet hozzáadja a teljes mátrix minden S_k-jához

Felmerül egy ésszerű kérdés: miért csak a második értéktől kezdjük a számolást ( i = 2:n esetén )? A helyzet az, hogy ez kizárólag a vizualizáció céljából történik. A gráf ábrázolásakor a következő kódban trajektóriák épülnek fel , és ha i = 1:n -re írnánk , akkor a legelső értéktől kezdve néhány trajektóriából jönne ki , néhány -ból . Mivel ebben a programban az optimálisság okán jobb, ha nem nulla értéket használunk (a részecske elhagyja, de nem rajzolódik ki, mivel az összeadás azonnal megtörténik), egyszerűen eltoljuk az abszcissza tengelyen a számozást eggyel a jobb. Most végezzünk el egy tesztsorozatot, és vizuálisan vegyük figyelembe a lehetséges pályákat bizonyos valószínűségekre, játékhosszokra és játékok számára.

Vizualizáció (graphS)

N = 3 ; % Lejátszott játékok száma n = 10_ _ % Feldobások száma q = 0,45 ; % Esély Az 1. játékos 1 rubelt veszít x = 0_ _ % Kezdeti jóléti ellentételezés matrS = nullák ( N , n ); % Memóriatartalék N soros n cols mátrix számára i = 1 esetén : N % Ez a hurok kitölti az S mátrixot S_k-val, N pályát adva matrS ( i ,:) = getS ( n , q , x ) ' ; telek ( matrS ( i ,:)); % Képet ad kapaszkodj ; _ % Megtartja a tengelyeket a következő pályafedéshez vége tartsd meg ; % Törli az új telek tengelyeit

Most jöjjön a szoftver rész legfontosabb összetevője - egy algoritmus, amely lehetővé teszi számunkra, hogy kiszámítsuk az átlagos játékhosszt adott paraméterek esetén . Ha az elmélet helyes, akkor a következő kísérlet csak megerősíti azt. Hozzáadunk egy sort a programhoz, amely kiszámítja az első játékos ( ) tönkremenetelének valószínűségét adott induló tőkére vonatkozóan, és összehasonlítja azt az elméletivel.

Teljes játékmodell (Monte_Carlo)

N = 3000_ _ % Lejátszott játékok száma n = 3000_ _ % Feldobások száma q = 0,5 ; % Esély Az 1. játékos 1 rubelt veszít p = 1 - q ; % Esély, hogy az 1. játékos 1 rubelt nyer A = -10 ; _ %1. játékos költségvetés B = 10 ; % 2. játékos költségvetés x = 0_ _ % Költségvetési eltolás az 1. játékos felé Bs = 0 ; Az esetek százalékos aránya a részecske eltalálja a B-t (hamarosan megváltozik) As = 0 ; Az esetek százalékos aránya a részecske eléri az A-t (hamarosan megváltozik) matrS = nullák ( N , n ); % Memóriatartalék N soros n cols mátrix számára TAU1 = n * egyes ( N , n ) ; % Töltsön ki egy másik N sort, n cols mátrixot n-ekkel i = 1 esetén : N % Ez a hurok S_k N trajektóriáját alkotja a q, x, n bemenetre támaszkodva matrS ( i ,:) = getS ( n , q , x ) ' ; j = 1 esetén : n if ( matrS ( i , j ) == A ) || ( matrS ( i , j ) == B ) % Ha egy részecske meghaladja A-t vagy B-t, akkor TAU1 ( i , j ) = j ; % írja be a lépések számát a táblázatba vége vége telek ( matrS ( i ,:)); % Egy számot jelenít meg rács be ; kapaszkodj ; _ % Egyidejű ábrázolások ugyanazon tengelyeken belül vége tartsd meg ; % Törli az új telek tengelyeit TAU = ( min ( TAU1 ' )) ' ; % TAU = az [A;B] folyosó túllépésének legkorábbi lépése % Mivel a [min] hatással van az oszlopokra és sort ad, akkor transzponáljuk a TAU1-et, % soronként minimalizálja és ismét oszlopmá alakítja i = 1 esetén : N % Az S_n sorozatunk készen áll; matrS-ban fészkelnek j = 1 esetén : TAU ( i ) % Csak addig keressen, amíg nem találkozunk a escape lépéssel! if ( matrS ( i , j ) == A ); % Ha egy részecske kiszabadult az A-n keresztül (1. játékos lebukott) As = As + 1 ; %-ot, majd adjunk hozzá +1-et az 1. játékos hibáihoz elseif ( matrS ( i , j ) == B ) % Egyébként ha az első küszöbértéke B Bs = Bs + 1 ; %-ot, majd adjunk hozzá +1-et az 1. játékos győzelméhez vége % Ha n nem elég nagy, akkor vége % As + Bs nem teheti N-t vége ALPHA = As / ( As + Bs ) % Párosítsa az alfakat az elméleti értékükkel ha ( q == p ) THEORALFA = ( B - x ) / ( B - A ) különben THEORALPHA = (( q / p ) ^ B - ( q / p ) ^ x ) / ( ( q / p ) ^ B - ( q / p ) ^ A ) vége BÉTA = 1 ALFA % Ugyanez a béta verziókhoz ha ( q == p ) ELMÉLET = ( x - A ) / ( B - A ) más THEORBETA = 1 - THEORALFA vége meanTAU = átlag ( TAU ) % A nagy számok törvénye nagy N- ekre ha ( q == p ) THEORTAU = ( B - x ) * ( x - A ) különben THEORTAU = 1 / ( p - q ) * ( B * THEORBETA + A * THEORALPHA - x ) vége

Megjegyzendő, hogy kis értékeknél nem minden részecske kerül ki a folyosóból, ezért itt hangsúlyozni kell, hogy az elmélet azt mondja: „elég nagy esetén a valószínűség közel van a ”.

Tesztelés

A következő adatok , .

teszt sz. ALPHA BÉTA jelent TAU
egy
2
3
négy
5
6

A 2. és 3. kísérlet a következő tulajdonságot demonstrálja: ha a játék veszít az első játékos számára, akkor a tét növelése a modellben megegyezik a csökkentésével , és ugyanannyiszor nullához képest. Az arány megháromszorozódott - 11-szeresére nőtt annak a valószínűsége, hogy az értékkel kiugrunk a folyosóról !

Lásd még

Jegyzetek

  1. Shiryaev A. N. Probability-1, Probability-2 // Moszkva, MTsNMO. – 2007.