A születésnapi paradoxon

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. február 22-én felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .

A születésnapi paradoxon  egy olyan állítás, amely szerint egy 23 vagy több fős csoportban a születésnapok (nap és hónap) egybeesésének valószínűsége legalább két ember esetében meghaladja az 50 %-ot . Például, ha egy osztályban 23 vagy több diák van , akkor valószínűbb, hogy egy pár osztálytársnak ugyanazon a napon lesz születésnapja, mint hogy mindegyiknek egyedi születésnapja lesz [1] . Ezzel a problémával először Richard Mises foglalkozott 1939-ben [2] [3] .

57 vagy több ember esetében az ilyen egybeesés valószínűsége meghaladja a 99%-ot , bár a Dirichlet-elv (józan ész) szerint csak akkor éri el a 100%-ot , ha legalább 367 ember van a csoportban (pontosan 1-gyel több, mint a szám szökőévben ; a szökőévek figyelembevételével ).

Egy ilyen állítás nem tűnik nyilvánvalónak, mivel annak valószínűsége, hogy két ember születésnapja egybeesik az év bármely napjával , szorozva a csoport létszámával (23), csak . Ez az érvelés helytelen, mivel a lehetséges párok száma jelentősen meghaladja a csoportba tartozók számát ( 253 > 23 ). Az állítás tehát nem a szigorú tudományos értelemben vett paradoxon : nincs benne logikai ellentmondás, és a paradoxon csupán az egyén általi intuitív helyzetfelfogás és a matematikai számítás eredményei közötti különbségekben rejlik.

Intuitív észlelés

Egy 23 fős csoportban olyan nagy a valószínűsége, hogy két embernek azonos születésnapja van, mivel a csoportban bármely két embernek azonos születésnapja van. Ezt a valószínűséget a 23 főből álló emberpárok száma határozza meg . Mivel az emberek páros sorrendje nem számít, az ilyen párok teljes száma megegyezik a 23 x 2 kombinációk számával , azaz (23 × 22) / 2 = 253 pár .

A paradoxon megfogalmazásában a csoport bármely két tagjának születésnapjának egybeeséséről beszélünk . Az egyik gyakori tévhit az, hogy ezt az esetet összekeverik egy másik, hasonlónak tűnő esettel, amikor egy személyt kiválasztanak egy csoportból, és megbecsülik annak valószínűségét, hogy a csoport bármely más tagjának születésnapja egybeesik a kiválasztott személy születésnapjával. Ez utóbbi esetben sokkal kisebb az egyezés valószínűsége.

Valószínűségszámítás

Meg kell határozni annak valószínűségét, hogy egy n fős csoportban legalább kettőnek azonos a születésnapja.

Legyen a születésnapok egyenletesen elosztva , vagyis feltételezzük, hogy:

A valóságban ez nem teljesen igaz – különösen egyes országokban a kórházak jellege miatt a hét bizonyos napjain több gyermek születik. Az egyenetlen eloszlás azonban csak növelheti a születésnapok egybeesésének valószínűségét, de nem csökkentheti: ha minden ember csak 3 napon születne a 365-ből, akkor a születésnapok egybeesésének valószínűsége nagyon magas lenne.

Először is számítsuk ki annak a  valószínűségét, hogy egy embercsoportban minden ember születésnapja eltérő lesz. Ha , akkor a Dirichlet-elv értelmében a valószínűség nulla. Ha , akkor a következőképpen vitatkozunk. Vegyünk véletlenszerűen egy személyt a csoportból, és emlékezzünk a születésnapjára. Ekkor véletlenszerűen vesszük a második személyt, miközben annak a valószínűsége, hogy a születésnapja nem esik egybe az első személy születésnapjával, egyenlő . Akkor vegyük a harmadik személyt; annak a valószínűsége, hogy a születésnapja nem esik egybe az első kettő közül az egyik születésnapjával, egyenlő . A hasonlattal érvelve elérjük az utolsó személyt, akinél annak a valószínűsége, hogy születésnapja nem egyezik az összes előzővel egyenlő lesz . Mindezeket a valószínűségeket megszorozva azt a valószínűséget kapjuk, hogy a csoport összes születésnapja eltérő lesz:

Ekkor annak a valószínűsége, hogy n -ből legalább két embernek ugyanaz a születésnapja, egyenlő

Ennek a függvénynek az értéke meghaladja az 1/2-t , míg az egybeesés valószínűsége megközelítőleg 50,73%, és . Az n értékek és a hozzájuk tartozó valószínűségek listája a következő táblázatban található.

n p ( n )
tíz 12 %
húsz 41%
harminc 70%
ötven 97%
100 99,99996%
200 99,99999999999999999999999999998%
300 (1–7× 10–73 ) × 100%
350 (1–3× 10–131 ) × 100%
367 100 %

Ez a probléma újrafogalmazható a klasszikus „koincidencia-probléma”-ként. Legyen:

Ki kell számítani egy esemény valószínűségét, amely abból áll, hogy a mintában nem fordul elő ismétlődés. Minden számítás megegyezik a fentiekkel .

Alternatív módszer

Kombinatorikai képletekkel [4] is kiszámítható annak valószínűsége, hogy egy n csoportban két embernek azonos a születésnapja . Képzelje el, hogy az év minden napján egy betű van az ábécében, és az ábécé 365 betűből áll. n ember születésnapja ábrázolható ennek az ábécének n betűjéből álló karakterlánccal. A Hartley-képlet szerint a lehetséges sorok száma a következő

Azon lehetséges karakterláncok száma, amelyekben a betűk nem ismétlődnek ( 365 helye n -nel )

Ha a sorokat véletlenszerűen választjuk ki ( egyenletes eloszlással ), akkor annak a valószínűsége, hogy olyan sort választunk, amelyben legalább két betű egyezik

és _ at .

Ily módon

és ez a kifejezés megegyezik a fent bemutatottal .

Ezenkívül a lehetséges sorok teljes száma kiszámítható az A (ismétlések)  n /365 = 365 n ismétlődésű elhelyezések számának kombinatorikai képletével .

Közelítések

Exponenciális függvény

Az exponenciális függvény Taylor - soros kiterjesztésének használata

A fenti kifejezés a következőképpen közelíthető :

Következésképpen:

Vegye figyelembe, hogy az egyszerűsített közelítés

ahogy a grafikonon is látszik, még kellő pontosságot ad.

Adjunk még egy közelítést .

Annak a valószínűsége, hogy két embernek azonos születésnapja van, 364/365. Emberek  , párok csoportjában . Ezért a valószínűség , feltéve, hogy ezek az események függetlenek , a számmal közelíthető

Ezért közelítést kapunk a szükséges p ( n ) valószínűségre :

Poisson-közelítés

A binomiális Poisson -közelítést használva , az előző közelítés alapján , valamivel több, mint 50%-ot kapunk :

Azon emberek számának kiszámítása, akiknél a valószínűség 50%

Fejezzük ki n -t a fenti képletből . Ekkor p ( n ) helyett 50%-ot (0,5) helyettesítünk. Ennek eredményeként a következőket kapjuk:

Van egy másik módszer is n becslésére 50%-os valószínűséggel . A fentiek szerint :

Keresse meg a legkisebb n -t, amelyhez

vagy ami ugyanaz,

Használjuk a függvény  fenti közelítését az exponenciális függvénnyel :

Helyettesítve a kifejezésben , azt kapjuk

Megoldva n -re , azt kapjuk

Innen megtaláljuk n -t és egész számra kerekítjük :

n =23 .

Ugyanazon a napon született egy adott személlyel

Hasonlítsuk össze a p ( n ) valószínűséget azzal a valószínűséggel, hogy egy n fős csoportban a csoportból valamelyik személy születésnapja egybeesik valamelyik előre kiválasztott személy születésnapjával, aki nem tartozik a csoportba. Ez a valószínűség az

Ha n = 23 - at behelyettesítünk , q ( n ) ≈ 6,12%-ot kapunk . Ahhoz, hogy a q ( n ) valószínűség meghaladja az 50%-ot , legalább 253 főnek kell lennie a csoportban ( q (252) ≈ 49,91% ; q (253) ≈ 50,05% . Ez a szám az év napjainak több mint fele ( 365/2 = 182,5 ); ez annak a ténynek köszönhető, hogy a csoport többi tagjának születésnapja azonos lehet, és ez csökkenti a q ( n ) valószínűséget . Pontosabban ez abból adódik, hogy az egybeesések valószínűségeinek összeadásakor minden alkalommal kivonjuk ezen események együttes előfordulásának valószínűségét, mivel az események együttesek, és az összeadásnál ezek együttes előfordulásának valószínűségét veszik figyelembe. kétszer. P ( A  +  B ) = P ( A ) + P ( B ) − P ( AB ) és így tovább minden új tag hozzáadásával.

Általánosítások

Diszkrét valószínűségi változók egybeesése

A leírt probléma általános formában megfogalmazható:

Ha a fent leírtak szerint érvel, általános megoldásokat kaphat:

Inverz probléma:

Megoldás:

Többféle ember

Fentebb bemutattuk a születésnapi paradoxont ​​egy „típusú” ember számára. A probléma általánosítása több „típus” bevezetésével lehetséges, például az embereket férfiakra ( m ) és nőkre ( n ) osztva. Számítsuk ki annak a valószínűségét, hogy legalább egy nőnek és egy férfinak ugyanaz a születésnapja (két nő vagy két férfi születésnapjának egybeesését nem vesszük figyelembe):

ahol d \u003d 365 és S 2 () a második típusú Stirling-számok . Érdekes módon nincs egyértelmű válasz arra a kérdésre, hogy adott valószínűség esetén mekkora n + m érték. Például a 0,5-ös valószínűség egy 16 férfiból és 16 nőből álló halmazt, valamint egy 43 férfiból és 6 nőből álló halmazt ad.

Közeli születésnapok

A születésnapi paradoxon egy másik általánosítása annak a problémának a megfogalmazása, hogy hány ember kell ahhoz, hogy egy olyan embercsoportba kerüljön, amelynek születésnapja legfeljebb egy nappal (vagy két, három nappal stb.) tér el egymástól, és meghaladja az 50%-ot . . A probléma megoldása során a befogadás-kizárás elvét alkalmazzuk . Az eredmény (ismét feltételezve, hogy a születésnapok egyenletesen oszlanak el ) a következő:

Maximális különbség születésnapokban, napok számában Szükséges létszám
egy 23
2 tizennégy
3 tizenegy
négy 9
5 nyolc
6 nyolc
7 7
nyolc 7

Így annak a valószínűsége, hogy egy 7 fős csoportban is legalább kettő születésnapja legfeljebb egy héttel tér el, meghaladja az 50%-ot .

Alkalmazás

A születésnapi paradoxon általánosságban vonatkozik a hash függvényekre : ha egy hash függvény N bites értéket generál , akkor azon véletlenszerű bemenetek száma, amelyeknél a hash kódok nagy valószínűséggel ütköznek (vagyis a különböző bemeneti adatokon azonos hash kódokat kapunk ) nem 2 N , hanem csak körülbelül 2 N /2 . Ezt a megfigyelést használják ki a kriptográfiai hash függvények elleni támadásban, amelyet születésnapi támadásnak neveznek .

N Különböző kimeneti láncok száma (2 N ) Legalább egy ütközés valószínűsége ( p )
10 −18 10-15 _ 10 −12 10 −9 10 −6 0,1% egy % 25% ötven % 75%
32 4,3 × 109 2 2 2 2.9 93 2,9×10³ 9,3×10³ 5,0 × 10⁴ 7,7×10⁴ 1,1×10⁵
64 1,8 × 10 19 6.1 1,9×10² 6,1×10³ 1,9×10⁵ 6,1×10⁶ 1,9×10⁸ 6,1×10⁸ 3,3×10⁹ 5,1×10⁹ 7,2×10⁹
128 3,4 × 10 38 2,6 × 10 10 8,2 × 10 11 2,6 × 10 13 8,2 × 10 14 2,6 × 10 16 8,3 × 10 17 2,6 × 10 18 1,4 × 10 19 2,2 × 10 19 3,1 × 10 19
256 1,2 × 10 77 4,8 × 10 29 1,5 × 10 31 4,8 × 10 32 1,5×10 34 4,8 × 10 35 1,5 × 10 37 4,8 × 10 37 2,6 × 10 38 4,0 × 10 38 5,7 × 10 38
384 3,9 × 10 115 8,9 × 10 48 2,8 × 10 50 8,9 × 1051 2,8 × 1053 8,9 × 1054 2,8 × 1056 8,9 × 1056 4,8 × 1057 7,4 × 1057 1,0 × 10 58
512 1,3 × 10154 1,6×10 68 5,2 × 10 69 1,6 × 10 71 5,2 × 1072 1,6 × 1074 5,2 × 1075 1,6 × 10 76 8,8 × 1076 1,4 × 10 77 1,9 × 10 77

A fehér cellák azt jelzik, hogy a csoportban hány embernél fog bekövetkezni az ütközés adott valószínűséggel (a paradoxonnal analóg módon a kimeneti láncok száma 365).

Hasonló matematikai berendezést használnak a tavakban élő halak populációjának becslésére . A módszer az úgynevezett "elfog-visszafogás" ("elkapni - elkapni újra"). Valójában, ha minden kifogott halat megjelölnek és elengednek, akkor a megjelölt hal fogásának valószínűsége nem lineárisan nő (a fenti grafikonnak megfelelően) a kísérletek számának növekedésével. A populáció mérete durván megbecsülhető az első megjelölt hal kifogása előtti próbálkozások számának négyzetében.

A probléma általános megoldása a matematika számos ágában alkalmazható , például a nem determinisztikus faktorizációs algoritmusokban . Tehát a Pollard-féle ρ-módszer egyik legegyszerűbb magyarázata hasonló a születésnapi paradoxon magyarázatához: elég, ha megközelítőleg véletlenszerű számok vannak 0-tól -ig , ahol  prímek, hogy legalább az egyik számpárhoz nagy valószínűséggel van , ami osztója lesz az n számnak .

Inverz problémák

  1. A legkisebb n szám megtalálása, amelynek p ( n ) valószínűsége nagyobb, mint egy adott p szám .
  1. A legnagyobb n szám megtalálása, amelynek p ( n ) valószínűsége kisebb, mint egy adott p szám .

A fenti képlet segítségével a következőket kapjuk:

p n n ↓ p ( n ↓) n ↑ p ( n ↑)
0,01 0,14178√365 = 2,70864 2 0,00274 3 0,00820
0,05 0,32029√365 = 6,11916 6 0,04046 7 0,05624
0.1 0,45904√365 = 8,77002 nyolc 0,07434 9 0,09462
0.2 0,66805√365 = 12,76302 12 0,16702 13 0,19441
0.3 0,84460√365 = 16,13607 16 0,28360 17 0,31501
0.5 1,17741√365 = 22,49439 22 0,47570 23 0,50730
0.7 1,55176√365 = 29,64625 29 0,68097 harminc 0,70632
0.8 1,79412√365 = 34,27666 34 0,79532 35 0,81438
0.9 2,14597√365 = 40,99862 40 0,89123 41 0,90315
0,95 2,44775√365 = 46,76414 46 0,94825 47 0,95477
0,99 3,03485√365 = 57,98081 57 0,99012 58 0,99166

A legjobb pozíció

Legyen n - 1 ember a szobában, és más a születésnapjuk. Legyen g ( n )  annak a valószínűsége, hogy a belépő születésnapja megegyezik a szobában tartózkodó személy születésnapjával. Meg kell találni n azon értékét, amelynél a g ( n ) függvény értéke maximális.

A megoldás a kifejezés maximális értékének megtalálásában rejlik

p ( n ) -p ( n - 1) .

A fenti képletet használva p ( n ) -re n = 20 -at kapunk .

Átlagos létszám

Nézzünk egy másik problémát. Átlagosan hány ember kell ahhoz, hogy legalább ketten ugyanazon a születésnapon éljenek?

Ez a probléma a kivonatolási algoritmusokkal kapcsolatos, és Donald Knuth vizsgálta . Kiderült, hogy a számunkra érdekes valószínűségi változó matematikai elvárása egyenlő

ahol

Funkció

Ramanujan fedezte fel . Ehhez a függvényhez a következő aszimptotikus kiterjesztést is megkapta :

M = 365 esetén az átlagos létszám

Ez a szám valamivel nagyobb, mint az 50%-os esélyt biztosító emberek száma . Meglepő módon a szükséges létszám M + 1 = 366 (365 ember születésnapja átfedés nélkül osztható el az év 365 napján), bár átlagosan csak 25-re van szükség.

Lásd még

Jegyzetek

  1. Mazur, 2017 , p. 116.
  2. Mazur, 2017 , p. 119.
  3. Mironkin V. O., Chukhno A. B. A „születésnapok” paradoxonának egy általánosításáról . Letöltve: 2020. március 30. Az eredetiből archiválva : 2020. július 9.
  4. Mazur, 2017 , p. 117.

Irodalom

Linkek