ย้อนกลับปัญหาวันเกิดที่มีการชนกันหลายครั้ง


9

สมมติว่าคุณมีปีเอเลี่ยนที่มีความยาวไม่ทราบเอ็นถ้าคุณมีตัวอย่างแบบสุ่มของเอเลี่ยนที่กล่าวมาและบางส่วนแบ่งวันเกิดคุณสามารถใช้ข้อมูลนี้เพื่อประเมินความยาวของปีได้หรือไม่?

ตัวอย่างเช่นในตัวอย่าง 100 คุณอาจมีสองสาม (เช่นวันเกิดสองวันที่แต่ละแบ่งปันโดยมนุษย์ต่างดาวสามคน) และห้าคู่และแปดสิบสี่ตันเดี่ยว ในการประมาณ N ต่ำสุดที่แน่นอนคือ 91 และสูงสุดไม่ จำกัด แต่ฉันจะหาค่าที่คาดหวังที่เหมาะสมได้อย่างไร

สมมติฐานรวมถึงสิ่งต่าง ๆ เช่น "วันเกิดทั้งหมดมีโอกาสเท่ากัน"

ต่างจากคำถามอื่นที่ตอบไว้ที่นี่มีการชนกันในห้อง ปีใดที่ยาวนานพอจะมีความเป็นไปได้สูงที่จะไม่มีการชนกันของห้องมนุษย์ต่างดาว แต่ปีที่ยาวมาก ๆ จะมีอัตราต่อรองที่ต่ำเมื่อเกิดการชนใด ๆ และปีสั้น ๆ จะมีอัตราต่อรองที่ต่ำของการชนกันเล็กน้อยดังนั้นจึงจัดให้มีช่วง


3
คำตอบของฉันเป็นรุ่นพิเศษของคำถามนี้ได้อย่างง่ายดาย generalizes (โดยใช้การกระจายพหุนาม): ดูstats.stackexchange.com/questions/252813
whuber

@ Techhead ในรูปแบบต่างๆ! แนวทางที่ชัดเจนสำหรับการประมาณค่าพารามิเตอร์ที่จะกล่าวถึงจะเป็นโอกาสสูงสุด
Glen_b -Reinstate Monica


1
@ โฮเบอร์ฉันเห็นคำถามนั้นและความคิดเห็นของคุณ แต่ฉันไม่เห็นวิธีนำไปใช้กับตัวอย่างที่มีการชนกันมากที่สุด ไม่ใช่เรื่องยากที่จะหารูปแบบที่ขยาย แต่ฉันไม่รู้ว่าจะหาผลรวมลอการิทึมได้อย่างไร
Techhead

1
ฉันยอมรับว่าเวอร์ชันของคุณมีความซับซ้อนเพียงพอที่จะไม่สามารถปิดซ้ำได้
whuber

คำตอบ:


2

ค่าความคาดหวังของการจัดจำหน่ายจะถูกคำนวณเป็นp_ix_i} สำหรับปัญหานี้เราต้องการคำนวณการแจกแจงของตามเกณฑ์การชนกันหรือหาได้รับเกณฑ์การชนกันโดยที่E(X)=pixiNE(N)=n=0pnnpn=P(N=n).

สมมติว่าคุณมีเกณฑ์การชนกันตามที่ระบุไว้ข้างต้นและให้เป็นความน่าจะเป็นที่เกณฑ์การชนได้รับตามความยาวของปีคือจากนั้นสามารถพบได้โดยเพียงหารจำนวนวิธีที่เกณฑ์การชนสามารถพบได้ตามจำนวนวันเกิดที่สามารถจัดเรียงโดยทั่วไป เมื่อพบสำหรับแต่ละที่เป็นไปได้จากนั้นชิ้นเดียวที่ขาดหายไปคือการแปลเป็นqnn.qnqnnqnpn.

หากเราสมมติว่าเป็นสัดส่วนกับดังนั้นตั้งแต่ ,และดังนั้นเราจึงต้องการสูตรสำหรับเพื่อแก้ปัญหานี้pnqnpn=αqn.n=0pn=1αn=0qn=1α=1n=0qn.qn

สำหรับตัวอย่างของคุณให้เราค้นหาจำนวนวิธีที่เกณฑ์การชนสามารถเกิดขึ้นได้ตั้งแต่เดี่ยวคนต่างด้าวแรกที่สามารถลงจอดในแต่ละวันจึงมีความเป็นไปได้ ซิงเกิลต่อไปสามารถลงจอดได้ทุกวัน แต่วันเกิดของเอเลี่ยนตัวแรกดังนั้นจึงมีความเป็นไปได้ที่ทำสิ่งนี้ให้สำเร็จใน 84 ซิงเกิลแรกเราได้รับวิธีที่เป็นไปได้ที่จะเกิดขึ้น โปรดสังเกตว่าเรามี 5 คู่และ 3 คู่ดังนั้นคนต่างด้าว "คนแรก" สำหรับแต่ละกลุ่มจะต้องไม่ลงจอดในคู่เดี่ยวเช่นกัน สิ่งนี้นำไปสู่วิธีที่มนุษย์ต่างดาวเหล่านี้ไม่ได้ชนกัน (ไวยากรณ์ซุ่มซ่ามสำหรับการทั่วไปที่ง่ายขึ้นในภายหลัง)N=n.nn1n(n1)(n2)...(n83)n(n1)(n2)...(n8452+1)

ถัดไปเอเลี่ยนตัวที่สองสำหรับคู่หรือทริปเล็ตมี 91 ตัวเลือกตัวต่อมี 90 และจำนวนวิธีที่สามารถเกิดขึ้นได้ในวันเกิดของเอเลี่ยน 91 ตัวแรกคือ1) สมาชิกที่เหลือของแฝดสามจะต้องตกอยู่ในวันเกิดของคู่และความน่าจะเป็นสิ่งที่เกิดขึ้นว่าเป็น 6 เราคูณความน่าจะเป็นสำหรับสิ่งเหล่านี้ทั้งหมดเข้าด้วยกันเพื่อให้ได้จำนวนวิธีที่เป็นไปได้ทั้งหมดสำหรับเกณฑ์การชนที่จะเป็น:91(911)(912)...(917+1)76

rn=n(n1)...(n8452+1)(84+5+2)(84+5+21)...(84+1)(5+2)(5+1)

ณ จุดนี้รูปแบบที่มีความชัดเจนถ้าเรามีsingletons,คู่และแฝดเราแทนที่ 84 ห้องพร้อมด้วย 5และ 2 มีที่จะได้รับสูตรทั่วไป ฉันคิดว่ามันชัดเจนว่าจำนวนวิธีที่เป็นไปได้สำหรับวันเกิดที่จะจัดโดยทั่วไปคือโดยที่ m คือจำนวนมนุษย์ต่างดาวทั้งหมดในปัญหา ดังนั้นน่าจะเป็นของที่อยู่ในเงื่อนไขการปะทะกันเป็นจำนวนของวิธีการที่เป็นไปตามเกณฑ์การปะทะกันหารด้วยจำนวนของวิธีการที่คนต่างด้าวที่อาจจะเกิดหรือm}abca,b,cnmqn=rnnm

อีกสิ่งที่น่าสนใจปรากฏในสูตรของr_nปล่อยให้และปล่อยให้เป็นส่วนที่เหลือของเพื่อให้r_nโปรดทราบว่าเป็นอิสระจาก n ดังนั้นเราสามารถเขียนเป็นค่าคงที่ได้! เนื่องจากและเราสามารถแยกออกจากผลรวมในส่วนได้ ณ จุดนี้มันจะยกเลิกกับส่วนจากเศษที่จะได้รับ . เราสามารถทำให้ง่ายขึ้นrnyn=n(n1)...(n(a+b+c)+1)=n!(n(a+b+c))!znrnrn=ynznznzn=zpn=qn/i=0qiqn=zynnmzpn=ynnm/i=0(yiim)ynต่อไปถ้าเราปล่อยให้ (หรืออาจเป็นจำนวนวันเกิดที่ไม่ซ้ำกันในกลุ่มมนุษย์ต่างดาว) ดังนั้นเราจะได้รับ:s=a+b+c

pn=n!(ns)!nm/i=0(i!(is)!im)

ตอนนี้เรามีสูตรอย่างง่าย (เป็นธรรม) สำหรับและดังนั้นสูตรอย่างง่าย (เป็นธรรม) สำหรับโดยที่สมมติฐานเดียวที่ทำคือเป็นสัดส่วนกับ (ความน่าจะเป็นของการปะทะกันของการปะทะกัน เกณฑ์ที่ระบุว่า ) ฉันคิดว่านี่เป็นข้อสันนิษฐานที่เป็นธรรมที่จะทำและใครบางคนที่ฉลาดกว่าฉันอาจจะสามารถพิสูจน์ได้ว่าสมมติฐานนี้มีความเกี่ยวข้องกับหลังจากการกระจายตัวแบบมัลติโนเมียล ณ จุดนี้เราสามารถคำนวณโดยใช้วิธีการเชิงตัวเลขหรือทำให้สมมติฐานประมาณบางอย่างจะเข้าใกล้ 0 เป็นวิธี\pnE(N)P(N=n)qnN=nP(N=n)E(N)pnn


ดูเหมือนว่าคุณเสนอให้คำนวณค่าความคาดหวังจากฟังก์ชันความน่าจะเป็นแทนที่จะเป็นฟังก์ชันความน่าจะเป็น เป็นความตั้งใจหรือไม่?
Sextus Empiricus

2

คำตอบที่ดีเยี่ยมจากโคให้เป็นวิธีที่ดีที่จะแสดงฟังก์ชั่นสำหรับโอกาสวันจำนวนในปี (หรือการกระจายหลังขึ้นอยู่กับแบนก่อน) โดยแฟออกเป็นส่วนหนึ่งของความน่าจะเป็นบางอย่างที่มีความเป็นอิสระจากNNN

ในคำตอบนี้ฉันต้องการเขียนให้กระชับและให้วิธีการคำนวณค่าสูงสุดของฟังก์ชันความน่าจะเป็นนี้ (แทนที่จะเป็นค่าที่คาดหวังซึ่งยากต่อการคำนวณ)


ฟังก์ชันความน่าจะเป็นสำหรับ N

จำนวนวิธีในการวาดลำดับของวันเกิดออกจากชุดวันเกิดโดยมีข้อ จำกัด ว่าคือจำนวนวันเกิดเดี่ยววันเกิดซ้ำซ้อนและสามวันเกิดเท่ากับa+2b+3cnabc

rn=(na+b+c)number of ways topick m unique birthdaysout of n days(a+b+c)!a!b!c!number of ways todistribute m birthdaysamong groups of size ab and c(a+2b+3c)!1!a2!b3!cnumber of ordered ways toarrange specific single, duplicate, and triplicatesamong the aliens =n!(nabc)!×(a+2b+3c)a!b!c!1!a2!b3!c

และมีเพียงเทอมแรกบน righthandside ขึ้นอยู่กับดังนั้นโดยแยกคำอื่น ๆ ที่เราลงท้ายด้วยนิพจน์อย่างง่ายสำหรับฟังก์ชันความน่าจะเป็นn

L(n|a,b,c)=n(a+2b+3c)n!(nabc)!=nmn!(ns)!P(a,b,c|n)

ที่เราทำตามสัญกรณ์จากโคและการใช้เพื่อแสดงถึงจำนวนของคนต่างด้าวและจำนวนวันเกิดที่ไม่ซ้ำกันms


การประมาณโอกาสสูงสุดสำหรับ N

เราสามารถใช้ฟังก์ชั่นนี้โอกาสที่จะได้รับการประมาณการโอกาสสูงสุดสำหรับNN

สังเกตได้ว่า

L(n)=L(n1)(n1n)mnns

และค่าสูงสุดจะเกิดขึ้นก่อนหน้าซึ่งn

(n1n)mnns=1

หรือ

s=n(1(11/n)m)

ซึ่งมีขนาดใหญ่ประมาณ (ใช้ชุด Laurent ซึ่งคุณสามารถค้นหาได้โดยการแทนที่และเขียนชุด Taylor สำหรับในจุด )nx=1/nxx=0

sk=0l(mk)(n)k+O(n(l+1))

ใช้เฉพาะคำสั่งซื้อแรกคุณได้รับ:smm(m1)2n

n1(m2)ms

ใช้คำสั่งที่สองเช่นกันคุณจะได้รับ :smm(m1)2n+m(m1)(m2)6n2

n2(m2)+(m2)24(ms)(m3)2(ms)

ดังนั้นในกรณีของคนต่างด้าวในระหว่างที่มีวันเกิดที่ไม่ซ้ำกันที่คุณจะใช้ประมาณและ515.1215 เมื่อคุณแก้สมการเชิงตัวเลขคุณจะได้ซึ่งเราปัดเศษเป็นเพื่อให้ได้ MLEm=100s=91n1550n2515.1215n=516.82n=516

เปรียบเทียบการประมาณกับ MLE จริง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.