A születésnapi paradoxon egy olyan állítás, amely szerint egy 23 vagy több fős csoportban a születésnapok (nap és hónap) egybeesésének valószínűsége legalább két ember esetében meghaladja az 50 %-ot . Például, ha egy osztályban 23 vagy több diák van , akkor valószínűbb, hogy egy pár osztálytársnak ugyanazon a napon lesz születésnapja, mint hogy mindegyiknek egyedi születésnapja lesz [1] . Ezzel a problémával először Richard Mises foglalkozott 1939-ben [2] [3] .
57 vagy több ember esetében az ilyen egybeesés valószínűsége meghaladja a 99%-ot , bár a Dirichlet-elv (józan ész) szerint csak akkor éri el a 100%-ot , ha legalább 367 ember van a csoportban (pontosan 1-gyel több, mint a szám szökőévben ; a szökőévek figyelembevételével ).
Egy ilyen állítás nem tűnik nyilvánvalónak, mivel annak valószínűsége, hogy két ember születésnapja egybeesik az év bármely napjával , szorozva a csoport létszámával (23), csak . Ez az érvelés helytelen, mivel a lehetséges párok száma jelentősen meghaladja a csoportba tartozók számát ( 253 > 23 ). Az állítás tehát nem a szigorú tudományos értelemben vett paradoxon : nincs benne logikai ellentmondás, és a paradoxon csupán az egyén általi intuitív helyzetfelfogás és a matematikai számítás eredményei közötti különbségekben rejlik.
Egy 23 fős csoportban olyan nagy a valószínűsége, hogy két embernek azonos születésnapja van, mivel a csoportban bármely két embernek azonos születésnapja van. Ezt a valószínűséget a 23 főből álló emberpárok száma határozza meg . Mivel az emberek páros sorrendje nem számít, az ilyen párok teljes száma megegyezik a 23 x 2 kombinációk számával , azaz (23 × 22) / 2 = 253 pár .
A paradoxon megfogalmazásában a csoport bármely két tagjának születésnapjának egybeeséséről beszélünk . Az egyik gyakori tévhit az, hogy ezt az esetet összekeverik egy másik, hasonlónak tűnő esettel, amikor egy személyt kiválasztanak egy csoportból, és megbecsülik annak valószínűségét, hogy a csoport bármely más tagjának születésnapja egybeesik a kiválasztott személy születésnapjával. Ez utóbbi esetben sokkal kisebb az egyezés valószínűsége.
Meg kell határozni annak valószínűségét, hogy egy n fős csoportban legalább kettőnek azonos a születésnapja.
Legyen a születésnapok egyenletesen elosztva , vagyis feltételezzük, hogy:
A valóságban ez nem teljesen igaz – különösen egyes országokban a kórházak jellege miatt a hét bizonyos napjain több gyermek születik. Az egyenetlen eloszlás azonban csak növelheti a születésnapok egybeesésének valószínűségét, de nem csökkentheti: ha minden ember csak 3 napon születne a 365-ből, akkor a születésnapok egybeesésének valószínűsége nagyon magas lenne.
Először is számítsuk ki annak a valószínűségét, hogy egy embercsoportban minden ember születésnapja eltérő lesz. Ha , akkor a Dirichlet-elv értelmében a valószínűség nulla. Ha , akkor a következőképpen vitatkozunk. Vegyünk véletlenszerűen egy személyt a csoportból, és emlékezzünk a születésnapjára. Ekkor véletlenszerűen vesszük a második személyt, miközben annak a valószínűsége, hogy a születésnapja nem esik egybe az első személy születésnapjával, egyenlő . Akkor vegyük a harmadik személyt; annak a valószínűsége, hogy a születésnapja nem esik egybe az első kettő közül az egyik születésnapjával, egyenlő . A hasonlattal érvelve elérjük az utolsó személyt, akinél annak a valószínűsége, hogy születésnapja nem egyezik az összes előzővel egyenlő lesz . Mindezeket a valószínűségeket megszorozva azt a valószínűséget kapjuk, hogy a csoport összes születésnapja eltérő lesz:
Ekkor annak a valószínűsége, hogy n -ből legalább két embernek ugyanaz a születésnapja, egyenlő
Ennek a függvénynek az értéke meghaladja az 1/2-t , míg az egybeesés valószínűsége megközelítőleg 50,73%, és . Az n értékek és a hozzájuk tartozó valószínűségek listája a következő táblázatban található.
n | p ( n ) |
---|---|
tíz | 12 % |
húsz | 41% |
harminc | 70% |
ötven | 97% |
100 | 99,99996% |
200 | 99,99999999999999999999999999998% |
300 | (1–7× 10–73 ) × 100% |
350 | (1–3× 10–131 ) × 100% |
367 | 100 % |
Ez a probléma újrafogalmazható a klasszikus „koincidencia-probléma”-ként. Legyen:
Ki kell számítani egy esemény valószínűségét, amely abból áll, hogy a mintában nem fordul elő ismétlődés. Minden számítás megegyezik a fentiekkel .
Kombinatorikai képletekkel [4] is kiszámítható annak valószínűsége, hogy egy n csoportban két embernek azonos a születésnapja . Képzelje el, hogy az év minden napján egy betű van az ábécében, és az ábécé 365 betűből áll. n ember születésnapja ábrázolható ennek az ábécének n betűjéből álló karakterlánccal. A Hartley-képlet szerint a lehetséges sorok száma a következő
Azon lehetséges karakterláncok száma, amelyekben a betűk nem ismétlődnek ( 365 helye n -nel )
Ha a sorokat véletlenszerűen választjuk ki ( egyenletes eloszlással ), akkor annak a valószínűsége, hogy olyan sort választunk, amelyben legalább két betű egyezik
és _ at .Ily módon
és ez a kifejezés megegyezik a fent bemutatottal .
Ezenkívül a lehetséges sorok teljes száma kiszámítható az A (ismétlések) n /365 = 365 n ismétlődésű elhelyezések számának kombinatorikai képletével .
Az exponenciális függvény Taylor - soros kiterjesztésének használata
A fenti kifejezés a következőképpen közelíthető :
Következésképpen:
Vegye figyelembe, hogy az egyszerűsített közelítés
ahogy a grafikonon is látszik, még kellő pontosságot ad.
Adjunk még egy közelítést .
Annak a valószínűsége, hogy két embernek azonos születésnapja van, 364/365. Emberek , párok csoportjában . Ezért a valószínűség , feltéve, hogy ezek az események függetlenek , a számmal közelíthető
Ezért közelítést kapunk a szükséges p ( n ) valószínűségre :
A binomiális Poisson -közelítést használva , az előző közelítés alapján , valamivel több, mint 50%-ot kapunk :
Fejezzük ki n -t a fenti képletből . Ekkor p ( n ) helyett 50%-ot (0,5) helyettesítünk. Ennek eredményeként a következőket kapjuk:
Van egy másik módszer is n becslésére 50%-os valószínűséggel . A fentiek szerint :
Keresse meg a legkisebb n -t, amelyhez
vagy ami ugyanaz,
Használjuk a függvény fenti közelítését az exponenciális függvénnyel :
Helyettesítve a kifejezésben , azt kapjuk
Megoldva n -re , azt kapjuk
Innen megtaláljuk n -t és egész számra kerekítjük :
n =23 .Hasonlítsuk össze a p ( n ) valószínűséget azzal a valószínűséggel, hogy egy n fős csoportban a csoportból valamelyik személy születésnapja egybeesik valamelyik előre kiválasztott személy születésnapjával, aki nem tartozik a csoportba. Ez a valószínűség az
Ha n = 23 - at behelyettesítünk , q ( n ) ≈ 6,12%-ot kapunk . Ahhoz, hogy a q ( n ) valószínűség meghaladja az 50%-ot , legalább 253 főnek kell lennie a csoportban ( q (252) ≈ 49,91% ; q (253) ≈ 50,05% . Ez a szám az év napjainak több mint fele ( 365/2 = 182,5 ); ez annak a ténynek köszönhető, hogy a csoport többi tagjának születésnapja azonos lehet, és ez csökkenti a q ( n ) valószínűséget . Pontosabban ez abból adódik, hogy az egybeesések valószínűségeinek összeadásakor minden alkalommal kivonjuk ezen események együttes előfordulásának valószínűségét, mivel az események együttesek, és az összeadásnál ezek együttes előfordulásának valószínűségét veszik figyelembe. kétszer. P ( A + B ) = P ( A ) + P ( B ) − P ( AB ) és így tovább minden új tag hozzáadásával.
A leírt probléma általános formában megfogalmazható:
Ha a fent leírtak szerint érvel, általános megoldásokat kaphat:
Inverz probléma:
Megoldás:
Fentebb bemutattuk a születésnapi paradoxont egy „típusú” ember számára. A probléma általánosítása több „típus” bevezetésével lehetséges, például az embereket férfiakra ( m ) és nőkre ( n ) osztva. Számítsuk ki annak a valószínűségét, hogy legalább egy nőnek és egy férfinak ugyanaz a születésnapja (két nő vagy két férfi születésnapjának egybeesését nem vesszük figyelembe):
ahol d \u003d 365 és S 2 () a második típusú Stirling-számok . Érdekes módon nincs egyértelmű válasz arra a kérdésre, hogy adott valószínűség esetén mekkora n + m érték. Például a 0,5-ös valószínűség egy 16 férfiból és 16 nőből álló halmazt, valamint egy 43 férfiból és 6 nőből álló halmazt ad.
A születésnapi paradoxon egy másik általánosítása annak a problémának a megfogalmazása, hogy hány ember kell ahhoz, hogy egy olyan embercsoportba kerüljön, amelynek születésnapja legfeljebb egy nappal (vagy két, három nappal stb.) tér el egymástól, és meghaladja az 50%-ot . . A probléma megoldása során a befogadás-kizárás elvét alkalmazzuk . Az eredmény (ismét feltételezve, hogy a születésnapok egyenletesen oszlanak el ) a következő:
Maximális különbség születésnapokban, napok számában | Szükséges létszám |
---|---|
egy | 23 |
2 | tizennégy |
3 | tizenegy |
négy | 9 |
5 | nyolc |
6 | nyolc |
7 | 7 |
nyolc | 7 |
Így annak a valószínűsége, hogy egy 7 fős csoportban is legalább kettő születésnapja legfeljebb egy héttel tér el, meghaladja az 50%-ot .
A születésnapi paradoxon általánosságban vonatkozik a hash függvényekre : ha egy hash függvény N bites értéket generál , akkor azon véletlenszerű bemenetek száma, amelyeknél a hash kódok nagy valószínűséggel ütköznek (vagyis a különböző bemeneti adatokon azonos hash kódokat kapunk ) nem 2 N , hanem csak körülbelül 2 N /2 . Ezt a megfigyelést használják ki a kriptográfiai hash függvények elleni támadásban, amelyet születésnapi támadásnak neveznek .
N | Különböző kimeneti láncok száma (2 N ) | Legalább egy ütközés valószínűsége ( p ) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
10 −18 | 10-15 _ | 10 −12 | 10 −9 | 10 −6 | 0,1% | egy % | 25% | ötven % | 75% | ||
32 | 4,3 × 109 | 2 | 2 | 2 | 2.9 | 93 | 2,9×10³ | 9,3×10³ | 5,0 × 10⁴ | 7,7×10⁴ | 1,1×10⁵ |
64 | 1,8 × 10 19 | 6.1 | 1,9×10² | 6,1×10³ | 1,9×10⁵ | 6,1×10⁶ | 1,9×10⁸ | 6,1×10⁸ | 3,3×10⁹ | 5,1×10⁹ | 7,2×10⁹ |
128 | 3,4 × 10 38 | 2,6 × 10 10 | 8,2 × 10 11 | 2,6 × 10 13 | 8,2 × 10 14 | 2,6 × 10 16 | 8,3 × 10 17 | 2,6 × 10 18 | 1,4 × 10 19 | 2,2 × 10 19 | 3,1 × 10 19 |
256 | 1,2 × 10 77 | 4,8 × 10 29 | 1,5 × 10 31 | 4,8 × 10 32 | 1,5×10 34 | 4,8 × 10 35 | 1,5 × 10 37 | 4,8 × 10 37 | 2,6 × 10 38 | 4,0 × 10 38 | 5,7 × 10 38 |
384 | 3,9 × 10 115 | 8,9 × 10 48 | 2,8 × 10 50 | 8,9 × 1051 | 2,8 × 1053 | 8,9 × 1054 | 2,8 × 1056 | 8,9 × 1056 | 4,8 × 1057 | 7,4 × 1057 | 1,0 × 10 58 |
512 | 1,3 × 10154 | 1,6×10 68 | 5,2 × 10 69 | 1,6 × 10 71 | 5,2 × 1072 | 1,6 × 1074 | 5,2 × 1075 | 1,6 × 10 76 | 8,8 × 1076 | 1,4 × 10 77 | 1,9 × 10 77 |
A fehér cellák azt jelzik, hogy a csoportban hány embernél fog bekövetkezni az ütközés adott valószínűséggel (a paradoxonnal analóg módon a kimeneti láncok száma 365).
Hasonló matematikai berendezést használnak a tavakban élő halak populációjának becslésére . A módszer az úgynevezett "elfog-visszafogás" ("elkapni - elkapni újra"). Valójában, ha minden kifogott halat megjelölnek és elengednek, akkor a megjelölt hal fogásának valószínűsége nem lineárisan nő (a fenti grafikonnak megfelelően) a kísérletek számának növekedésével. A populáció mérete durván megbecsülhető az első megjelölt hal kifogása előtti próbálkozások számának négyzetében.
A probléma általános megoldása a matematika számos ágában alkalmazható , például a nem determinisztikus faktorizációs algoritmusokban . Tehát a Pollard-féle ρ-módszer egyik legegyszerűbb magyarázata hasonló a születésnapi paradoxon magyarázatához: elég, ha megközelítőleg véletlenszerű számok vannak 0-tól -ig , ahol prímek, hogy legalább az egyik számpárhoz nagy valószínűséggel van , ami osztója lesz az n számnak .
A fenti képlet segítségével a következőket kapjuk:
p | n | n ↓ | p ( n ↓) | n ↑ | p ( n ↑) |
---|---|---|---|---|---|
0,01 | 0,14178√365 = 2,70864 | 2 | 0,00274 | 3 | 0,00820 |
0,05 | 0,32029√365 = 6,11916 | 6 | 0,04046 | 7 | 0,05624 |
0.1 | 0,45904√365 = 8,77002 | nyolc | 0,07434 | 9 | 0,09462 |
0.2 | 0,66805√365 = 12,76302 | 12 | 0,16702 | 13 | 0,19441 |
0.3 | 0,84460√365 = 16,13607 | 16 | 0,28360 | 17 | 0,31501 |
0.5 | 1,17741√365 = 22,49439 | 22 | 0,47570 | 23 | 0,50730 |
0.7 | 1,55176√365 = 29,64625 | 29 | 0,68097 | harminc | 0,70632 |
0.8 | 1,79412√365 = 34,27666 | 34 | 0,79532 | 35 | 0,81438 |
0.9 | 2,14597√365 = 40,99862 | 40 | 0,89123 | 41 | 0,90315 |
0,95 | 2,44775√365 = 46,76414 | 46 | 0,94825 | 47 | 0,95477 |
0,99 | 3,03485√365 = 57,98081 | 57 | 0,99012 | 58 | 0,99166 |
Legyen n - 1 ember a szobában, és más a születésnapjuk. Legyen g ( n ) annak a valószínűsége, hogy a belépő születésnapja megegyezik a szobában tartózkodó személy születésnapjával. Meg kell találni n azon értékét, amelynél a g ( n ) függvény értéke maximális.
A megoldás a kifejezés maximális értékének megtalálásában rejlik
p ( n ) -p ( n - 1) .A fenti képletet használva p ( n ) -re n = 20 -at kapunk .
Nézzünk egy másik problémát. Átlagosan hány ember kell ahhoz, hogy legalább ketten ugyanazon a születésnapon éljenek?
Ez a probléma a kivonatolási algoritmusokkal kapcsolatos, és Donald Knuth vizsgálta . Kiderült, hogy a számunkra érdekes valószínűségi változó matematikai elvárása egyenlő
ahol
Funkció
Ramanujan fedezte fel . Ehhez a függvényhez a következő aszimptotikus kiterjesztést is megkapta :
M = 365 esetén az átlagos létszám
Ez a szám valamivel nagyobb, mint az 50%-os esélyt biztosító emberek száma . Meglepő módon a szükséges létszám M + 1 = 366 (365 ember születésnapja átfedés nélkül osztható el az év 365 napján), bár átlagosan csak 25-re van szükség.