ระบุว่าในวันนี้เป็นวันก้าวกระโดดไม่มีใครรู้ว่าน่าจะเป็นเกิดในวันก้าวกระโดด?
ระบุว่าในวันนี้เป็นวันก้าวกระโดดไม่มีใครรู้ว่าน่าจะเป็นเกิดในวันก้าวกระโดด?
คำตอบ:
แน่ใจ ดูที่นี่สำหรับคำอธิบายรายละเอียดเพิ่มเติมได้ที่: http://www.public.iastate.edu/~mlamias/LeapYear.pdf
แต่ในขั้นต้นผู้เขียนสรุปว่า "มี 485 ปีอธิกสุรทินใน 2 พันปีดังนั้นใน 2 พันปีมีวันรวมในวันนั้น 29 กุมภาพันธ์เกิดขึ้นใน 485 ของพวกเขา (ปีอธิกสุรทิน) ดังนั้นความน่าจะเป็นคือ "485 / 730,485 = 0.0006639424
ในการทำนายความน่าจะเป็นโดยใช้สถิติอย่างแม่นยำจะช่วยให้ทราบได้ว่าเกิดที่ไหน
หน้านี้http://chmullig.com/2012/06/births-by-day-of-year/มีกราฟแสดงชุดย่อยของจำนวนการเกิดต่อวัน (คูณ 29 ด้วย 4 ซึ่งไม่ถูกต้องและไม่พึงประสงค์ สำหรับคำถามนี้ แต่ยังเชื่อมโยงไปยังข้อมูลดั้งเดิมและให้ข้อมูลคร่าวๆเกี่ยวกับสิ่งที่คุณคาดหวังได้ในสหรัฐอเมริกา ฉันจะสมมติว่าเส้นโค้งนี้ไม่เป็นจริงสำหรับประเทศอื่น ๆ และโดยเฉพาะอย่างยิ่งไม่ได้สำหรับทวีปอื่น ๆ โดยเฉพาะอย่างยิ่งในซีกโลกใต้และภูมิภาคเส้นศูนย์สูตรอาจแสดงผลมาจากผลลัพธ์เหล่านี้อย่างมากมาย - สมมติว่าสภาพภูมิอากาศเป็นปัจจัยกำหนด
นอกจากนี้ยังมีปัญหาของ "การเลือกเกิด" (สัมผัสโดยผู้เขียนของhttp://bmjopen.bmj.com/content/3/8/e002920.full ) - ในภูมิภาคที่ยากจนของโลกฉันคาดหวังที่แตกต่างกัน การกระจายของการคลอดเพียงเพราะในแผนกที่ไม่ได้เกิดเหตุฉุกเฉินหรือการเกิดที่เกิดขึ้นยากกว่าในประเทศที่พัฒนาแล้ว นี่เป็นการกระจายการเกิดครั้งสุดท้าย
จากการใช้ข้อมูลอเมริกันสมมติว่ามีการเกิด 71 ล้านครั้ง (ค่าเฉลี่ยกราฟคร่าวๆ * 366) และการเกิด 46.000 ครั้งในวันที่ 29 กุมภาพันธ์ไม่ได้แก้ไขการกระจายตัวของปีอธิกสุรทินเนื่องจากข้อมูลไม่ได้ระบุช่วงเวลาที่แน่นอน ประมาณ ~ 0.000648 นี่เป็นค่าที่ต่ำกว่าค่าเล็กน้อยที่คาดว่าจะได้รับเมื่อมีการกระจายของการเกิดและสอดคล้องกับความประทับใจทั่วไปที่ได้รับจากกราฟ
ฉันจะปล่อยให้การทดสอบที่มีนัยสำคัญของการประมาณคร่าวๆนี้แก่ผู้อ่านที่ได้รับแรงบันดาลใจ แต่เนื่องจากเมื่อวันที่ 29 (แม้ว่าจะไม่ถูกแก้ไข - ในปี 2000 ฉีดข้อมูลที่มีอคติต่ำกว่าค่าเฉลี่ย) คะแนนต่ำแม้สำหรับมาตรฐานเดือนกุมภาพันธ์ที่ต่ำอยู่แล้วฉันถือว่ามีความเชื่อมั่นค่อนข้างสูงว่าการกระจายโมฆะที่เท่าเทียมกัน
ฉันคิดว่าคำตอบสำหรับคำถามนี้สามารถประจักษ์เท่านั้น คำตอบเชิงทฤษฎีใด ๆ ที่จะมีข้อบกพร่องโดยไม่ต้องปรากฏการณ์การเลือกวันเกิดการบัญชีฤดูกาล ฯลฯ สิ่งเหล่านี้เป็นไปไม่ได้ที่จะจัดการกับในทางทฤษฎี
ข้อมูลวันเกิดหายากในสหรัฐอเมริกาเนื่องจากเหตุผลด้านความเป็นส่วนตัว มีอยู่คนหนึ่งชุดข้อมูลที่ไม่ระบุชื่อเป็นที่นี่ มาจากการสมัครประกันในสหรัฐอเมริกา ความแตกต่างจากรายงานอื่น ๆ เช่นบทความ NYT ที่ได้รับความนิยมมักอ้างถึงคือมันแสดงความถี่ของการเกิดตามวันที่แทนที่จะเป็นอันดับที่เรียบง่ายของวันในหนึ่งปี จุดอ่อนคือการสุ่มตัวอย่างอคติเนื่องจากมันมาจากการประกัน: ไม่รวมคนไม่มีประกันและอื่น ๆ
จากข้อมูลมีการเกิด 325 ครั้งในวันที่ 29 กุมภาพันธ์จากทั้งหมด 481040 ตามรอยเมอร์ฟีกลุ่มตัวอย่างครอบคลุมตั้งแต่ปี 1981 ถึงปี 1994 มันรวม 3 ปีอธิกสุรทิน 14 ปี โดยไม่ต้องปรับเปลี่ยนใด ๆน่าจะเป็นจะเป็น 0.0675% ของการเกิดเมื่อวันที่ 29 กุมภาพันธ์ระหว่างปี 1981 และ 1994
คุณสามารถปรับความน่าจะเป็นโดยการบัญชีสำหรับความถี่ของปีอธิกสุรทินซึ่งอยู่ใกล้กับ 1/4 ( ไม่ว่าแม้ว่า ) เช่นจากการคูณจำนวนนี้โดยที่จะมาถึงประมาณการ 0.079% ที่นี่น่าจะเป็นเงื่อนไขพีของการถูกเกิดเมื่อวันที่ 29 กุมภาพันธ์ในปีอธิกสุรทินมีการเชื่อมโยงไปยังความถี่ที่สังเกตF o = 325โดยความถี่ฉL = 3ของปีอธิกสุรทินในตัวอย่าง: F o = ฉL / N ⋅ F ⋅ p , โดย ที่N = 14
โดยปกติแล้วน่าจะเป็นของปีอธิกสุรทินคือดังนั้นระยะยาวน่าจะเป็นค่าเฉลี่ยP Lของการถูกเกิดเมื่อวันที่ 29 กุมภาพันธ์เป็น: P L = P L ⋅ P ≈ P L ⋅ N
คุณอาจจะสนใจในความน่าจะเป็นเงื่อนไขของการถูกเกิดเมื่อวันที่ 29 กุมภาพันธ์ที่กำหนดว่าคุณเกิดในปีอธิกสุรทิน: P = N
แน่นอนการสนทนานี้เป็นศูนย์กลางของสหรัฐอเมริกา ใครจะรู้ว่าลวดลายในประเทศอื่นเป็นอย่างไร
UPDATE: เราสันนิษฐานว่า OP เป็นปฏิทินเกรกอเรียนโดยอัตโนมัติ มันน่าสนใจยิ่งขึ้นถ้าคุณพิจารณาปฏิทินที่แตกต่างกันเช่นปฏิทินจันทรคติฮิจเราะห์ซึ่งปีอธิกสุรทินจะอยู่ที่ 30 ปีหรือมากกว่านั้น
อัปเดต 2:
Amitabh Chandra, Harvard University
ทีนี้มันเป็นไปได้ยังไงที่เป็นวันพิเศษในปฏิทินเกรกอเรียน: 1 ม.ค. 25 ธ.ค. และ 29 Deb จะเป็นวันเกิดที่ได้รับความนิยมมากที่สุด ฉันบอกว่ามันไม่น่าจะเกิดขึ้นแบบสุ่ม ดังนั้นจึงน่าสนใจยิ่งขึ้นที่จะเห็นสิ่งที่เกิดขึ้นในปฏิทินอื่น ๆ เช่นฮิจเราะห์
อัปเดต 3:
อัพเดท 4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
เอาท์พุท:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
ปกหนังสือเล่มโปรดของฉันเคยให้หลักฐานที่เกี่ยวข้องอย่างมากกับข้อสันนิษฐานของการจัดสรรชุดการเกิดจนถึงปัจจุบัน โดยเฉพาะอย่างยิ่งการเกิดในสหรัฐอเมริกาตั้งแต่ปี 1970 แสดงให้เห็นแนวโน้มหลายอย่างที่ซ้อนทับกันในแต่ละคน: แนวโน้มที่ยาวนานและหลายทศวรรษ, แนวโน้มที่ไม่เป็นระยะ, แนวโน้มวันต่อสัปดาห์, แนวโน้มรายวัน, แนวโน้มวันหยุดประจำปี (เนื่องจากกระบวนการเช่น Cesarean ส่วนอนุญาตให้หนึ่งเพื่อกำหนดวันเกิดอย่างมีประสิทธิภาพและแพทย์มักจะไม่ทำในวันหยุด) ผลลัพธ์ก็คือความน่าจะเป็นที่จะเกิดในวันที่เลือกแบบสุ่มในหนึ่งปีนั้นไม่เหมือนกันและเนื่องจากอัตราการเกิดแตกต่างกันไประหว่างปีไม่ใช่ทุกปีมีโอกาสเท่ากัน
สิ่งนี้ยังแสดงหลักฐานว่าทางออกของ Asksal ในขณะที่คู่แข่งที่แข็งแกร่งมากก็ไม่สมบูรณ์เช่นกัน จำนวนก้าวกระโดดเล็ก ๆ จะ "ปนเปื้อน" จากผลกระทบทั้งหมดที่เล่นที่นี่ดังนั้นการคาดการณ์ของ Asksal ก็ยังจับภาพ (โดยไม่ได้ตั้งใจ) ผลกระทบของแนวโน้มรายวันและระยะยาวพร้อมกับ 29 กุมภาพันธ์ ผล ผลกระทบใดบ้างและไม่เหมาะสมที่จะรวมไว้ไม่ชัดเจนตามคำถามของคุณ
และการวิเคราะห์นี้มีเฉพาะในสหรัฐอเมริกาซึ่งมีแนวโน้มทางประชากรซึ่งอาจแตกต่างจากประเทศอื่น ๆ หรือประชากร ยกตัวอย่างเช่นอัตราการเกิดของญี่ปุ่นลดลงมาหลายทศวรรษแล้ว อัตราการเกิดของจีนถูกควบคุมโดยรัฐโดยมีผลกระทบบางอย่างต่อองค์ประกอบทางเพศของประเทศและอัตราการเกิดในรุ่นต่อ ๆ มา
ในทำนองเดียวกันการวิเคราะห์ของ Gelman จะอธิบายเพียงไม่กี่ทศวรรษที่ผ่านมาและไม่จำเป็นต้องชัดเจนว่านี่เป็นยุคของคำถามที่คุณสนใจ
สำหรับผู้ที่ตื่นเต้นเกี่ยวกับสิ่งนี้เนื้อหาในหน้าปกจะถูกกล่าวถึงในบทเกี่ยวกับกระบวนการแบบเกาส์
29 กุมภาพันธ์เป็นวันที่เกิดขึ้นในแต่ละปีที่มีหลายของ4
อย่างไรก็ตามปีที่เป็นทวีคูณของ 100 แต่ไม่ใช่หนึ่งใน 400 ไม่ถือว่าเป็นปีอธิกสุรทิน (เช่น: 1900 ไม่ใช่ปีอธิกสุรทินขณะที่ปี 2000 หรือ 1600) ดังนั้นทุกวันนี้มันเป็นลวดลายเดียวกันทุก ๆ 400 ปี
ลองทำคณิตศาสตร์กันที่[0; 400 [ช่วงเวลา:
ในระยะเวลา 400 ปีที่ผ่านมามีอยู่ตรง4 x 25 = 100ปีที่มีหลาย4 แต่เราต้องลบ3 (หลายปีเป็น 100 แต่ไม่ใช่ 400) จาก 100 และเราได้100 - 3 = 97ปี
ตอนนี้เราต้องคูณ 97 ด้วย 366, 97 x 366 = 35502 (จำนวนวันในหนึ่งปีอธิกสุรทินในรอบ 400 ปี) มันยังคงอยู่(365 x (400-97)) = 110 595 (จำนวนวันที่ไม่ได้ ' ปีอธิกสุรทินในรอบ 400 ปี)
จากนั้นเราก็ต้องมีการเพิ่มจำนวนทั้งสองนี้เพื่อให้ทราบจำนวนวันในช่วงเวลา 400 ปี: 110 595 + 35,502 = 146 097
ในการสิ้นสุดความน่าจะเป็นของเราคือจำนวน 29 กุมภาพันธ์ในรอบระยะเวลา 400 ปีดังนั้น 97 เนื่องจาก 97 ปีอธิกสุรทินหารด้วยจำนวนวันทั้งหมดของช่วงเวลาของเรา:
p = 97/146097 ≈ 0,0006639424492
หวังว่านี่ถูกต้องและชัดเจน
ฉันเชื่อว่ามีคำถามสองข้อผสมกันอยู่ที่นี่ หนึ่งคือ "ความน่าจะเป็นของวันใดวันหนึ่งเป็นวันที่ 29 กุมภาพันธ์?" อันที่สองคือ (และอันที่จริงถาม) "ความเป็นไปได้ที่จะเกิดในวันกระโดดคืออะไร"
ฉันสังเกตเห็นว่าคำตอบส่วนใหญ่ทำงานโดยคำนวณจำนวนวันก้าวกระโดดในช่วงเวลาหนึ่ง มีวิธีที่ง่ายกว่าในการรับคำตอบอย่างถูกต้อง 100% ตามคำจำกัดความ:
เราใช้ปีอธิกสุรทินในการปรับปฏิทินปกติ (365 วัน) เป็นปีเขตร้อน (หรือหมายถึงปีสุริยคติ) ปีเขตร้อนหมายถึง "เป็นเวลาที่ดวงอาทิตย์ใช้เพื่อกลับสู่ตำแหน่งเดียวกันในวงจรของฤดูกาลตามที่เห็นจากโลก" (Wikipedia) ปีที่เขตร้อนแตกต่างกันเล็กน้อย แต่ปีเขตร้อนเฉลี่ย (เฉลี่ย) เป็นเรื่องเกี่ยวกับ 365.24667
หากวันที่เผ่นออกไปถูกต้องโอกาสของวันที่เลือกแบบสุ่มคือวันอธิกสุรทินคือ (ปีเขตร้อน) - (ไม่ใช่ปีอธิกสุรทิน) / ปีเขตร้อน
การเสียบหมายเลขโดยประมาณที่เรามีคือ (365.24667-365) /365.24667 หรือ 0.24667 / 365.24667 หรือ 675 ต่อล้าน (0.0675%)
อย่างไรก็ตามสำหรับวันที่เลือกแบบสุ่ม ฉันคิดว่านี่เป็นสิ่งที่พ่อแม่ผู้ปกครองบิดเบือนซึ่งค่อนข้างจะไม่ต้องอธิบายให้ลูก ๆ ฟังว่า "วันเกิดที่แท้จริงของคุณมาเพียงครั้งเดียวต่อ 4 ปี"
ฉันถามพี่สาวของฉันซึ่งมีวันที่ 29 กุมภาพันธ์และเธอพูดว่า "ผลลัพธ์ของการศึกษาเชิงประจักษ์ของฉันเองก็คือมันคือ 1.00 เห็นได้ชัด"