ผลรวมของสัมประสิทธิ์การกระจายแบบพหุนาม


10

ฉันกำลังจะตายอย่างยุติธรรม เมื่อใดก็ตามที่ฉันได้รับ 1, 2 หรือ 3 ฉันจะเขียน '1' เมื่อใดก็ตามที่ฉันได้ 4 ฉันเขียน '2'; เมื่อใดก็ตามที่ฉันได้ 5 หรือ 6 ฉันจะเขียน '3'

ให้Nเป็นจำนวนพ่นฉันต้องการสำหรับผลิตภัณฑ์ของตัวเลขทั้งหมดที่ผมเขียนลงไปเป็น100000100000 ฉันต้องการคำนวณ (หรือโดยประมาณ) P(N25)และการประมาณสามารถให้เป็นฟังก์ชันของการแจกแจงแบบปกติ

ครั้งแรกผมรู้ว่าP(N11)=1เพราะlog3100.00010.4810.48 ทีนี้ลองa , bและcเป็นจำนวนครั้งที่ผมเขียน 1, 2 และ 3 ตามลำดับ แล้ว:

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

สิ่งที่ฉันต้องการคำนวณคือ:

P(a+b+c252b3c100000)

ฉันจะคำนวณสิ่งนี้ได้อย่างไร

--EDIT:

ดังนั้นจึงแนะนำว่าฉันสามารถแทนที่เงื่อนไขด้วย:

P(a+b+c25αa+βb+γcδ)

ที่ , ,และ100000α=0β=log2γ=log3δ=log100000

วิธีนี้ดูแก้ไขได้มากขึ้น! ฉันโชคไม่ดีที่ยังไม่รู้วิธีแก้ปัญหา


2
+1 ปัญหานี้อาจจะดูคุ้นตากว่าเล็กน้อยและให้ยืมชัดเจนกว่าโซลูชันโดยประมาณหากคุณต้องเขียนเงื่อนไขในรูปแบบโดยที่และ(100000) αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber

ฉันได้เพิ่มวิธีการใหม่ในการเขียนเงื่อนไข แต่น่าเสียดายที่ฉันยังไม่รู้วิธีการแก้ปัญหานี้!
Pedro Carvalho

คำใบ้อีกอย่างคือถ้ามีเหตุการณ์ของ '2' คุณจะหยุด คุณสามารถประมาณค่านี้ด้วยทวินามลบด้วยพารามิเตอร์และ (เช่นและ ) คำตอบที่แน่นอนก็จัดการได้เช่นกันเนื่องจากมีชุดค่าผสมไม่มาก นอกจากนี้เงื่อนไขไม่ถูกต้อง - คุณต้องรวมว่า '2' หรือ '3' ถูกบันทึกในม้วนลำดับที่17170.5111/3N
ความน่าจะเป็นทาง

คำตอบ:


1

คำถามปัจจุบันเป็นกรณีเฉพาะที่คุณกำลังเผชิญกับปริมาณที่เป็นฟังก์ชันเชิงเส้นของตัวแปรสุ่มแบบมัลติโนเมียล เป็นไปได้ที่จะแก้ปัญหาของคุณอย่างแน่นอนโดยการระบุชุดค่าผสมแบบหลายค่าที่ตอบสนองความไม่เท่าเทียมกันที่ต้องการและรวมการกระจายในช่วงนั้น ในกรณีที่มีขนาดใหญ่สิ่งนี้อาจกลายเป็นไปไม่ได้ที่คำนวณได้ ในกรณีนี้มันเป็นไปได้ที่จะได้รับการกระจายโดยประมาณโดยใช้การประมาณค่าแบบมัลติโนเมียล รุ่นทั่วไปของการประมาณนี้แสดงไว้ด้านล่างจากนั้นจะนำไปใช้กับตัวอย่างเฉพาะของคุณN


ปัญหาประมาณทั่วไป:สมมติว่าเรามีลำดับของตัวแปรสุ่มแลกเปลี่ยนที่มีช่วงม. สำหรับเราสามารถนับจำนวน vectorซึ่งนับจำนวน การเกิดขึ้นของผลลัพธ์แต่ละรายการในค่าแรกของลำดับ เนื่องจากลำดับพื้นฐานสามารถแลกเปลี่ยนได้เวกเตอร์การนับจะถูกกระจายเป็น:1,2,...,mnNXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

ทีนี้สมมติว่าเรามีเวกเตอร์น้ำหนักไม่เชิงลบและเราใช้น้ำหนักเหล่านี้เพื่อกำหนดฟังก์ชันเชิงเส้น:w=(w1,w2,...,wm)

A(n)i=1mwiXi.

เนื่องจากน้ำหนักจะไม่ลบปริมาณใหม่นี้จะไม่ลดลงnจากนั้นเราจะกำหนดหมายเลขซึ่งเป็นจำนวนการสังเกตที่น้อยที่สุดที่จำเป็นในการรับค่าต่ำสุดที่ระบุสำหรับฟังก์ชันเชิงเส้นของเรา เราต้องการประมาณการกระจายตัวของในกรณีที่ค่านี้มีขนาดใหญ่ (สุ่ม)nN(a)min{nN|A(n)a}N(a)


การแก้ปัญหาการประมาณทั่วไป:ประการแรกเราทราบว่าเนื่องจากไม่ลดลงใน (ซึ่งถือเพราะเราได้สันนิษฐานว่าน้ำหนักทั้งหมดไม่เป็นลบ) เรามี:A(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

ดังนั้นการกระจายตัวของจะเกี่ยวข้องโดยตรงกับการกระจายของ สมมติว่าปริมาณในอดีตมีขนาดใหญ่เราสามารถประมาณการกระจายตัวของหลังด้วยการแทนที่เวกเตอร์แบบสุ่มโดยสิ้นเชิงด้วยการประมาณอย่างต่อเนื่องจากการแจกแจงปกติหลายตัวแปร สิ่งนี้นำไปสู่การประมาณค่าปกติสำหรับ linear quantitiyและเราสามารถคำนวณช่วงเวลาของปริมาณนี้โดยตรง ในการทำสิ่งนี้เราใช้ข้อเท็จจริงที่ว่า ,และสำหรับเจ ด้วยพีชคณิตพื้นฐานนี่ทำให้เรา:NAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

การประมาณปกติกับพหุนามตอนนี้ทำให้เรามีตัวอย่างการกระจายMU)) การใช้การประมาณนี้ให้ผลตอบแทน:A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(สัญลักษณ์เป็นสัญกรณ์มาตรฐานสำหรับฟังก์ชันการแจกแจงแบบปกติมาตรฐาน.) มันเป็นไปได้ที่จะใช้ประมาณนี้เพื่อหาน่าจะเกี่ยวข้องกับปริมาณสำหรับค่าที่ระบุของ นี่คือการประมาณขั้นพื้นฐานซึ่งไม่ได้พยายามรวมการแก้ไขความต่อเนื่องกับค่าของค่าการนับหลายค่าที่เกี่ยวข้อง มันได้มาจากการประมาณค่าปกติโดยใช้ช่วงเวลาสองช่วงกลางเหมือนกันกับฟังก์ชันเชิงเส้นที่แน่นอนΦN(a)a


การประยุกต์ใช้กับปัญหาของคุณ:ในปัญหาของคุณคุณมีความน่าจะเป็น , น้ำหนักและตัดค่า100000 คุณจึงมี (ปัดเศษทศนิยมหกจุด)0.481729 การใช้การประมาณข้างต้นที่เรามี (ปัดเศษเป็นทศนิยมหกตำแหน่ง):θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

โดยการประยุกต์ใช้การแจกแจงพหุนามที่แท้จริงรวมกับชุดค่าผสมทั้งหมดที่เป็นไปตามข้อกำหนด , มันสามารถแสดงให้เห็นว่าผลลัพธ์ที่แน่นอนคือ0.483500 ดังนั้นเราจะเห็นได้ว่าการประมาณนั้นค่อนข้างใกล้เคียงกับคำตอบที่แน่นอนในกรณีปัจจุบันP(A(24)<a)P(N(a)25)=0.483500

หวังว่าคำตอบนี้ให้คำตอบสำหรับคำถามเฉพาะของคุณในขณะที่วางไว้ในกรอบทั่วไปของผลลัพธ์ความน่าจะเป็นที่นำไปใช้กับฟังก์ชันเชิงเส้นของเวกเตอร์แบบสุ่มหลายส่วน วิธีการในปัจจุบันควรอนุญาตให้คุณหาวิธีแก้ไขปัญหาโดยประมาณเกี่ยวกับประเภททั่วไปที่คุณกำลังเผชิญอยู่ซึ่งทำให้สามารถเปลี่ยนแปลงตัวเลขเฉพาะในตัวอย่างของคุณได้


0

ลองทำค่าประมาณปกติ

ก่อนอื่นให้ปรับปรุงปัญหาของคุณในบันทึกให้สมบูรณ์ คุณเริ่มต้นที่ 0 ในเวลา t = 0 จากนั้นในแต่ละขั้นตอนคุณจะเพิ่ม:

  • 0 ที่มีความน่าจะเป็น 1/2

  • log(2)มีความน่าจะเป็น 1/6

  • log(3)ด้วยความน่าจะเป็น 1/3

คุณหยุดกระบวนการนี้เมื่อผลรวมของคุณเกินณ จุดที่คุณดูว่ามีการโยนกี่ครั้ง จำนวนการโยนที่คุณไปถึงจุดนั้นคือ ^log(105)N

เครื่องคิดเลขของฉันบอกฉันว่าค่าเฉลี่ยของการเพิ่มขึ้นของคุณคือ:และความแปรปรวนเป็น0.25 สำหรับการอ้างอิงจุดสิ้นสุดอยู่ที่ดังนั้นเราจะไปถึงเขาในเวลาประมาณ 24 ขั้น0.480.2511.51

เงื่อนไขกับความจริงที่ว่าเราได้ทำไปแล้ว 25 ขั้นตอนการกระจายตัวของผลรวมนั้นเป็นแบบเกาส์ซึ่งมีศูนย์กลางที่ 12.0 และมีความแปรปรวน 6.25 สิ่งนี้ทำให้เราประมาณแบบเกาส์คร่าวๆของp(N25)0.5

คุณต้องดูยอดรวมของผลรวมที่ N = 25 เพื่อให้ทราบว่าการประมาณแบบเกาส์นั้นดีหรือไม่ เนื่องจากการเพิ่มขึ้นนั้นไม่สมมาตรค่าประมาณอาจไม่ดีที่สุด


1
คุณช่วยทำให้ฉันสำเร็จได้ไหม? ฉันมีเวลายากที่จะเห็นมัน นอกจากนี้ยังไม่มีวิธีที่แน่นอนในการคำนวณหรือไม่
Pedro Carvalho

1
คุณไม่ได้หมายถึง "log (2)" และ "log (3)" ที่คุณมีบันทึก (1) และ log (2) ใช่หรือไม่
Glen_b -Reinstate Monica

@GuillaumeDehaene wrote: .... โดยการคำนวณของฉันในสองวิธีที่แตกต่างกันซึ่งแตกต่างกันมากกับ 0.5p(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
wolfies

คุณจะได้ P (n \ leq24) ได้ประมาณ 0.18 อย่างไร
Guillaume Dehaene
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.