Bu madde, Vikipedi biçem el kitabına uygun değildir. Maddeyi, Vikipedi standartlarına uygun biçimde düzenleyerek Vikipedi'ye katkıda bulunabilirsiniz. Gerekli düzenleme yapılmadan bu şablon kaldırılmamalıdır.(Mart 2020)
Bu madde çoğu okuyucunun anlayamayacağı kadar teknik olabilir. Lütfen teknik detayları çıkarmadan maddeyi uzman olmayan okuyucular tarafından anlaşılabilir hale getirilmesine yardımcı olun.(Mart 2020)
Olasılık teorisinde, doğum günü problemi veya doğum günü paradoksu, n adet rastgele seçilmiş kişiden oluşan bir grup içindeki bazı çiftlerin doğum gününün aynı olma olasılığını inceler. Güvercin deliği ilkesine göre, kişi sayısı 367'ye ulaştığında (29 Şubat dahil, 366 adet olası doğum günü olduğu için) olasılık %100'e ulaşır fakat, %99,9 olasılığa sadece 70 kişi ile ve %50 olasılığa 23 kişi ile ulaşılır. Bu sonuçlar, yılın her gününün (29 Şubat hariç) eşit derecede olası bir doğum günü olduğu varsayımına dayanır.
Mevcut doğum kayıtları farklı günlerde farklı sayıda insanın doğduğunu gösterir. Bu durumda, %50 eşiğine ulaşmak için gereken insan sayısının 23 veya daha az olduğu söylenebilir.[1] Örneğin, insanların yarısı bir günde ve diğer yarısı başka bir günde doğmuş olsaydı, bu durumda herhangi iki kişinin doğum gününü paylaşma şansı %50 olurdu.
Gruptaki en az iki kişinin aynı doğum gününe sahip olma olasılığının %50'ye ulaşılması için sadece 23 kişilik bir grubun gerektiği şaşırtıcı görünebilir: bu sonuç, bir bireye sabitlenmenin ve onun doğum gününü diğerleriyle karşılaştırmanın aksine doğum günü karşılaştırmasının aslında, olası her bir çift arasında = 23 x 22/2 = 253 karşılaştırma -bir yıl içindeki gün sayısının yarısından (en fazla 183) daha çok- yapılmasıyla daha makul olabilir. Doğum günü problemi kendisiyle mantıksal çelişkili olma anlamda bir “paradoks” değildir, ancak ilk bakışta anlaşılamaz.
Doğum günü probleminin gerçek hayattaki uygulamaları arasında doğum günü saldırısı isimli bir kriptografik saldırı vardır; bu saldırı bu olasılık modelini kullanarak bir özet fonksiyonu için çarpışma bulma karmaşıklığını azaltır ve büyüklüğü belirli bir popülasyonun özetleri arasında bulunan bir özet çarpışmasının yaklaşık riskini hesaplar.
Problemin tarihi bilinmemektedir. W. W. Rouse Ball, bunun ilk olarak Harold Davenport[2] tarafından ele alındığını belirtmiştir (alıntı yok). Ancak, Richard von Mises, bugün doğum günü problemi olarak bilinen şeyin daha eski bir versiyonunu sunmuştur. [2]
Olasılığın hesaplanması
Problem, n kişiden oluşan bir grup içindeki en az iki kişinin doğum gününün aynı olma olasılığını yaklaşık olarak hesaplamaktır. Basitlik adına, artık yıllar, ikizler, sezonluk veya iş günü değişiklikleri gibi dağılımdaki değişimler göz ardı edilmiştir ve 365 olası doğum gününün hepsinin eşit derecede olası olduğu varsayılmıştır. (Gerçekte doğum günü dağılımları düzenli değildir çünkü tüm tarihler eşit derecede olası değildir, fakat bu düzensizliklerin analiz üzerinde çok az etkisi vardır[nb 1]. Aslında, doğum günlerinin düzenli dağılımı en kötü durumdur.[3])
Amaç, P(A) ile ifade edilen, odadaki en az iki kişinin doğum gününün aynı olma olasılığını hesaplamaktır. Ancak, P(A') ile ifade edilen, odadaki hiç kimsenin doğum gününün aynı olmama olasılığını hesaplamak daha kolaydır. Bu durumda, sadece A ve A' olasılık dahilinde ve ayrık olaylar olduğu için, P(A)=1-P(A').
P(A)’nın %50’den fazla olması için gereken kişi sayısının en az 23 olduğunu belirten yaygın çözümleri dikkate alarak, aşağıdaki P(A) hesaplamasında örnek olarak 23 kişi kullanılacaktır. Eğer 23 kişi 1’den 23’e kadar numaralandırılırsa, 23 kişinin hepsinin farklı doğum günlerine sahip olması olayı, 2. kişinin 1. kişi ile aynı doğum gününe sahip olmama olayı ile ve 3. kişinin 1. ve 2. kişiyle aynı doğum gününe sahip olmama olayı, vb.; ve son olarak 23. kişinin 1’den 22’ye kadar olan kişilerin hiçbiri ile aynı doğum gününe sahip olmama olayı ile aynıdır. Bu olaylar sırasıyla “Olay 2”, “Olay 3” vb. olarak isimlendirilsin. “Olay 1” olarak ise, 1. kişinin doğum gününe sahip olma olayı ki bu olayın olasılığı 1'dir, eklenebilir. Bu olayların birleşimi koşullu olasılık kullanılarak hesaplanabilir: Olay 2'nin olasılığı 364/365'tir, çünkü 2. kişinin doğum günü, 1. kişinin doğum günü dışındaki herhangi bir günde olabilir. Benzer şekilde, Olay 2'nin gerçekleştiği göz önüne alındığında, Olay 3'ün olasılığı 363/365'tir, çünkü 3. kişinin doğum günü 1. ve 2. kişinin doğum günleri dışında her gün olabilir. Bu, önceki tüm olayların gerçekleştiği göz önüne alındığında, Olay 23'ün olasılığı 343/365 olana kadar devam eder. Son olarak, koşullu olasılık prensibi, P(A')’nın bu ayrı olasılıkların çarpımına eşit olduğunu belirtir:
Bu nedenle, P(A) ≈ 1 − 0.492703 = 0.507297 (50,7297%).
Bu yöntem n kişiden oluşan bir grup için genelleştirilebilir, p(n) n kişiden en az iki kişinin bir doğum günü paylaşması olasılığıdır. Öncelikle, tüm n doğum günlerinin farklı olma olasılığını, p(n), hesaplamak daha kolaydır. Güvercin yuvası prensibine göre, n>365 ise p(n) sıfırdır. n ≤ 365 ise:
Bu denklem, ilk kişinin kimseyle doğum günü paylaşmadığı gerçeğini ifade eder, bununla birlikte, ikinci kişi ilk kişi ile (364/365 ) aynı doğum gününe sahip olamaz, üçüncü kişinin doğum günü ilk iki kişi ile (364/365) ve genel olarak n’inci doğum günü önceki hiçbir n-1 doğum günü ile aynı olamaz.
n kişiden en az ikisinin aynı doğum gününe sahip olma olayı, tüm n doğum günlerinin farklı olması ile tamamlayıcıdır. Bu nedenle, olasılığı
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p(n)=1-{\bar {p}}(n).}
Aşağıdaki tablo n’in diğer bazı değerleri için olasılıkları göstermektedir (bu tabloda artık yılların varlığı göz ardı edilmiştir ve her doğum gününün eşit derecede olası olduğu varsayılmıştır):
n
p(n)
1
00.0%
5
02.7%
10
11.7%
20
41.1%
23
50.7%
30
70.6%
40
89.1%
50
97.0%
60
99.4%
70
99.9%
75
99.97%
100
99,99997%
200
99,9999999999999999999999999998%
300
(100 − 6×10-80)%
350
(100 − 3×10-129)%
365
(100 − 1,45×10-155)%
≥ 366
100%
Artık yıllar. Eğer Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\bar {p}}(n)}
formülünde 365 yerine 366 yazarsak, benzer bir hesaplama ile artık yıllar için, bir eşleşme olasılığının %50'den fazla olması için gerekli kişi sayısının 23 olduğunu gösterir; bu durumda eşleşme olasılığı %50.6'dır
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p(n)=1-{\bar {p}}(n)\approx 1-e^{-n(n-1)/730}.}
Daha kaba bir yaklaşım şu şekilde verilir
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p(n)\approx 1-e^{-n^{2}/730},}
ki, grafikte görüldüğü üzere, hala oldukça doğrudur.
Yaklaşıma göre, aynı yöntem herhangi bir sayıda “insan” ve “gün” için de uygulanabilir. Eğer 365 gün yerine d varsa, n kişi varsa ve n ≪ d ise, o zaman yukarıdaki yaklaşımı kullanarak, p(n, d)n kişiden en az iki kişinin, d uygun gün içerisinden aynı doğum gününü paylaşma olasılığını belirtiyor ise, ulaşacağımız sonuç:
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\begin{aligned}p(n,d)&\approx 1-e^{-n(n-1)/(2d)}\\[6pt]&\approx 1-e^{-n^{2}/(2d)}.\end{aligned}}}
Basit üssalma
Herhangi iki kişinin aynı doğum gününe sahip olmama olasılığı
364/365’tir. n kişinin olduğu bir odada (n2) = n(n − 1)/2 çift insan, bir başka deyişle (n2) olay vardır. Hiçbir iki kişinin aynı doğum gününü paylaşmama olasılığı, bu olayların bağımsız olduğunu varsaymak ve olasılıklarını beraber çarpmak ile yaklaşık olarak bulunabilir. Kısaca
364/365 kendisi ile (n2) kere çarpılır, bu da:
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\bar {p}}(n)\approx \left({\frac {364}{365}}\right)^{\binom {n}{2}}.}
Bu kimsenin aynı doğum gününe sahip olmama olasılığı olduğu için, birinin bir doğum günü paylaşma olasılığı:
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p(n)\approx 1-\left({\frac {364}{365}}\right)^{\binom {n}{2}}.}
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle \Pr(X>0)=1-\Pr(X=0)\approx 1-e^{-0.6932}\approx 1-0.499998=0.500002.}
Sonuç, önceki açıklamalar gibi %50’nin üzerindedir. Bu yaklaşım yukarıdaki Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle e^{x}\approx 1+x}
kullanan Taylor açılımı yaklaşımıyla aynıdır.
Kare yaklaşımı
Zihinsel hesaplama için kullanılabilecek iyi bir kural,
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p(n)\approx {\frac {n^{2}}{2m}}}
ayrıca şu şekilde de yazılabilir
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle n\approx {\sqrt {2m\times p(n)}}}
1/2’den küçük veya 1/2’ye eşit olasılıklar için etkilidir. Bu denklemlerde, m bir yıldaki gün sayısıdır.
Örneğin, ortak bir doğum günü şansının 1/2 olması için gereken kişi sayısını tahmin etmek için
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle n\approx {\sqrt {2\times 365\times {\tfrac {1}{2}}}}={\sqrt {365}}\approx 19}
Bu da doğru cevap olan 23’ten çok uzak değildir.
Kişi sayısı yaklaşımı
Bu aynı zamanda, eşleşme şansın en az 1/2 olması için gereken kişi sayısı, aşağıdaki formül kullanılarak yaklaşık olarak hesaplanabilir:
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle n\approx {\tfrac {1}{2}}+{\sqrt {{\tfrac {1}{4}}+2\times \ln(2)\times 365}}=22.999943.}
Bu, 1/k olasılığı olan bir olayın, eğer kln 2 kere tekrarlanırsa, en az bir kere gerçekleşme şansının 1/2 olacağına dair iyi bir yaklaşımın sonucudur.[4]
Olasılık tablosu
length of
hex string
no. of
bits
(b)
hash space
size
(2b)
Number of hashed elements such that probability of at least one hash collision ≥ p
p = 10-18
p = 10-15
p = 10-12
p = 10-9
p = 10-6
p = 0.001
p = 0.01
p = 0.25
p = 0.50
p = 0.75
8
32
4,3×109
2
2
2
2.9
93
2,9×103
9,3×103
5,0×104
7,7×104
1,1×105
(10)
(40)
(1,1×1012)
2
2
2
47
1,5×103
4,7×104
1,5×105
8,0×105
1,2×106
1,7×106
(12)
(48)
(2,8×1014)
2
2
24
7,5×102
2,4×104
7,5×105
2,4×106
1,3×107
2,0×107
2,8×107
16
64
1,8×1019
6.1
1,9×102
6,1×103
1,9×105
6,1×106
1,9×108
6,1×108
3,3×109
5,1×109
7,2×109
(24)
(96)
(7,9×1028)
4,0×105
1,3×107
4,0×108
1,3×1010
4,0×1011
1,3×1013
4,0×1013
2,1×1014
3,3×1014
4,7×1014
32
128
3,4×1038
2,6×1010
8,2×1011
2,6×1013
8,2×1014
2,6×1016
8,3×1017
2,6×1018
1,4×1019
2,2×1019
3,1×1019
(48)
(192)
(6,3×1057)
1,1×1020
3,5×1021
1,1×1023
3,5×1024
1,1×1026
3,5×1027
1,1×1028
6,0×1028
9,3×1028
1,3×1029
64
256
1,2×1077
4,8×1029
1,5×1031
4,8×1032
1,5×1034
4,8×1035
1,5×1037
4,8×1037
2,6×1038
4,0×1038
5,7×1038
(96)
(384)
(3,9×10115)
8,9×1048
2,8×1050
8,9×1051
2,8×1053
8,9×1054
2,8×1056
8,9×1056
4,8×1057
7,4×1057
1,0×1058
128
512
1,3×10154
1,6×1068
5,2×1069
1,6×1071
5,2×1072
1,6×1074
5,2×1075
1,6×1076
8,8×1076
1,4×1077
1,9×1077
Bu tabloda açık renkli alanlar, belli bir bit boyutunda verilen özet alanı (satır) belirli çarpışma olasılığını (sütun) başarmak için gereken özet sayısını göstermektedir. Doğum günü benzetmesi kullanılarak: “özet alan boyutu” “uygun günler”e, “çarpışma olasılığı” “ortak doğum günü olasılığı”na ve “gerekli özet elementi sayısı” "bir grup içerisinden gerekli kişi sayısı”na benzemektedir. Bu grafik ayrıca gerekli minimum özet boyutunu (özet üst sınırları ve hata olasılığı verildiğinde) veya çarpışma olasılığını (sabit sayıda özet ve hata olasılığı için) belirlemek için de kullanılabilir.
Karşılaştırma yapılırsa, 10-18 ile 10-15, tipik bir sabit diskin bit olarak düzeltilemez hata oranıdır.[5] Teorik olarak, MD5gibi 128-bit özet fonksiyonları, olası çıktıları çok daha fazla olsa bile, yaklaşık 8,2×1011 belgeye kadar bu aralıkta kalmalıdır.
Olasılık üst sınırı ve kişi sayısı alt sınırı
Aşağıdaki argüman Paul Halmos'un bir görüşünden uyarlanmıştır. [6]
Yukarıda belirtildiği gibi, hiçbir iki doğum gününün örtüşmeme olasılığı
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle 1-p(n)={\bar {p}}(n)=\prod _{k=1}^{n-1}\left(1-{\frac {k}{365}}\right).}
Önceki paragraflardaki gibi, p(n) > 1/2’i sağlayan en küçük n değeri ile veya p(n) < 1/2’i sağlayan en küçük n değeri ile ilgilenilmektedir.
1 − x < e−x eşitsizliği kullanılarak, yukarıdaki denklemde 1 − k/365 yerine e−k⁄365 yazıldığında
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\bar {p}}(n)=\prod _{k=1}^{n-1}\left(1-{\frac {k}{365}}\right)<\prod _{k=1}^{n-1}\left(e^{-k/365}\right)=e^{-n(n-1)/730}.}
Bu nedenle, yukarıdaki denklem yalnızca bir yaklaşım değil, aynı zamanda p(n) için bir üst sınırdır. Eşitsizlik
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle e^{-n(n-1)/730}<{\frac {1}{2}}}
p(n) < 1/2 olduğunu gösterir. n için çözülürse
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle n^{2}-n>730\ln 2.}
Bu durumda, 730 ln 2 yaklaşık olarak 505.997’ye eşittir, ki bu 506’nın çok az altındadır, n2 − n değeri n = 23 iken elde edilir. Bu nedenle 23 kişi yeterlidir. Yeri gelmişken, n2 − n = 730 ln 2 denkleminin n için çözülmesi, yukarıda bahsedilen Frank H. Mathis’in formülünü yaklaşık olarak verir.
Bu derivasyon sadece, eşit şansa sahip bir doğum günü eşleşmesi sağlamak için en fazla 23 kişiye ihtiyaç duyulduğunu göstermektedir; n’in 22 veya daha az olmasının işe yarama olasılığının ucunu açık bırakmaktadır.
Genelleştirmeler
Genelleştirilmiş doğum günü problemi
Verilen d adet güne sahip bir yılda, genelleştirilmiş doğum günü problemi, rastgele seçilen n kişilik bir grupta bir doğum gününün örtüşme olasılığını en az %50 yapan minimum n(d) sayısını sorar. Başka bir deyişle, n(d) minimum n tam sayısıdır öyle ki,
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle 1-\left(1-{\frac {1}{d}}\right)\left(1-{\frac {2}{d}}\right)\cdots \left(1-{\frac {n-1}{d}}\right)\geq {\frac {1}{2}}.}
Klasik doğum günü problemi bu nedenle, n(365)’in belirlenmesine karşılık gelir. n(d)’nin ilk 99 değeri burada verilmiştir (OEIS'de A033810 dizisi):
d
1–2
3–5
6–9
10–16
17–23
24–32
33–42
43–54
55–68
69–82
83–99
n(d)
2
3
4
5
6
7
8
9
10
11
12
Benzer bir hesaplama, d 341-372 aralığında olduğunda n(d)=23 olduğunu gösterir
n(d) için bir dizi sınır ve formül yayınlanmıştır.[7] Tüm d ≥ 1 için n(d) sayısı aşağıdaki eşitsizliği sağlar:[8]
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\frac {3-2\ln 2}{6}}<n(d)-{\sqrt {2d\ln 2}}\leq 9-{\sqrt {86\ln 2}}.}
Bu limitler, n(d) − √2d ln 2 dizisinin aşağıdaki sayıya rastgele yakınlaşması açısından uygundur;
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle {\frac {3-2\ln 2}{6}}\approx 0.27,}
aslında,
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle 9-{\sqrt {86\ln 2}}\approx 1.28}
d = 43 alındığında maksimumdadır.
Limitler, tüm olayların %99'unda n(d)'nin tam değerini verecek kadar sıkıdır, örneğin n(365) = 23. Genel olarak, bu sınırlardan n(d)'nin daima
d ≤ 1018 için geçerlidir ve bu formülün tüm d değerleri için geçerli olduğu tahmin edilir.
2 kişiden fazla
Problem, gruptan en az 3/4/5 vb. kişinin aynı doğum gününü paylaşma olasılığının %50’den fazla olması için kaç kişilik bir grubun gerektiğini sormak için genişletilebilir.
İlk birkaç değer şöyledir: 3 kişinin bir doğum günü paylaşma olasılığı>50% - 88 kişi; 4 kişinin bir doğum günü paylaşma olasılığı>50% - 187 kişi. Tüm liste Tam sayı Dizilerinin Çevrimiçi Ansiklopedisi’nin A014088 dizisinde bulunabilir.[11]
Bir çarpışma problemi olarak tahmin
Doğum günü problemi aşağıdaki şekilde genelleştirilebilir:
[1,d] aralığındaki ayrı bir muntazam dağılımdan alınan n rastgele tam sayı verildiğinde, en az iki sayının aynı olma olasılığı, p(n; d) nedir? ( d = 365 olağan doğum günü problemini verir. )[12]
Genel sonuçlar yukarıda verilen aynı argümanlar kullanılarak türetilebilir.
Doğum günü probleminin arkasında yatan teori Zoe Schnabel[13]Mark and recapture istatistikleri adı altında, göllerdeki balık popülasyonunun büyüklüğünü tahmin etmek için kullanılmıştır.
Çoklu tip için genelleştirme
Temel problem, tüm denemelerin tek bir “tip” olduğunu kabul eder. Doğum günü problemi, rastgele tip sayısını hesaba katmak için genelleştirilebilir.[14] En basit kapsamda, m erkek ve n kadın olmak üzere iki tip insan vardır ve problem, en az bir erkek ve bir kadın arasındaki ortak doğum günü olasılığını simgeler. (İki erkek veya iki kadın arasındaki ortak doğum günleri sayılmaz.) Burada paylaşılan doğum günlerinin olmama olasılığı
Ayrıştırılamadı (Dönüştürme hatası. Sunucu ("https://wikimedia.org/api/rest_") bildirdi: "Cannot get mml. Server problem."): {\displaystyle p_{0}={\frac {1}{d^{m+n}}}\sum _{i=1}^{m}\sum _{j=1}^{n}S_{2}(m,i)S_{2}(n,j)\prod _{k=0}^{i+j-1}d-k}
d = 365 ve S2 ikinci dereceden Stirling sayılarıdır. Dolayısıyla, istenen olasılık 1 − p0’dır.
Doğum günü probleminin bu değişimi ilginçtir çünkü toplam insan sayısı m + n için tek özgün çözüm yoktur. Örneğin, olağan %50 olasılık değeri, hem 16 erkek ve 16 kadından oluşan 32 üyeli grup için hem de 43 kadın ve 6 erkekten oluşan 49 üyeli grup için gerçekleştirilir.
Notlar
^In reality, birthdays are not evenly distributed throughout the year; there are more births per day in some seasons than in others, but for the purposes of this problem the distribution is treated as uniform. In particular, many children are born in the summer, especially the months of August and September (for the northern hemisphere) [1], and in the U.S. it has been noted that many children are conceived around the holidays of Christmas and New Year's Day.[1] Also, because hospitals rarely schedule caesarian sections and induced labor on the weekend, more people are born between Tuesday and Friday than on weekends;[1] where many of the people share a birth year (e.g. a class in a school), this creates a tendency toward particular dates. In Sweden 9.3% of the population is born in March and 7.3% in November when a uniform distribution would give 8.3% Swedish statistics board. See also:
These factors tend to increase the chance of identical birth dates, since a denser subset has more possible pairs (in the extreme case when everyone was born on three days, there would obviously be many identical birthdays). The problem of a non-uniform number of births occurring during each day of the year was first understood by Murray Klamkin in 1967. A formal proof that the probability of two matching birthdays is least for a uniform distribution of birthdays was given by Bloom Bloom 1973.
Kaynakça
^abcMario Cortina Borja; John Haigh (September 2007). "The Birthday Problem". Significance. Royal Statistical Society. 4 (3): 124-127. doi:10.1111/j.1740-9713.2007.00246.x.
^abFrank, P.; Goldstein, S.; Kac, M.; Prager, W.; Szegö, G.; Birkhoff, G., (Ed.) (1964). Selected Papers of Richard von Mises. 2. Providence, Rhode Island: Amer. Math. Soc. ss. 313-334.
^In his autobiography, Halmos criticized the form in which the birthday paradox is often presented, in terms of numerical computation. He believed that it should be used as an example in the use of more abstract mathematical concepts. He wrote:
“
The reasoning is based on important tools that all students of mathematics should have ready access to. The birthday problem used to be a splendid illustration of the advantages of pure thought over mechanical manipulation; the inequalities can be obtained in a minute or two, whereas the multiplications would take much longer, and be much more subject to error, whether the instrument is a pencil or an old-fashioned desk computer. What calculators do not yield is understanding, or mathematical facility, or a solid basis for more advanced, generalized theories.
^Suzuki, K.; Tonien, D. (2006). "Birthday Paradox for Multi-collisions". Rhee M.S., Lee B. (Ed.). Lecture Notes in Computer Science, vol 4296. Berlin: Springer. doi:10.1007/11927587_5. Information Security and Cryptology – ICISC 2006.