ปัญหาในเชิงลึกที่ร้ายแรงของความน่าจะเป็นสำหรับการพลิกเหรียญ


10

ให้บอกว่าฉันทำ 10,000 flips เหรียญ ฉันต้องการทราบความน่าจะเป็นของการพลิกหลายครั้งเพื่อให้ได้ 4 หัวติดต่อกันหรือมากกว่าติดต่อกัน

การนับจะทำหน้าที่ดังต่อไปนี้คุณจะนับหนึ่งรอบการพลิกต่อเนื่องที่เป็นแค่หัว (4 หัวหรือมากกว่า) เมื่อก้อยกระทบและแตกแนวของหัวการนับจะเริ่มอีกครั้งจากการโยนครั้งต่อไป นี่จะทำซ้ำ 10,000 ครั้ง

ฉันต้องการทราบความน่าจะเป็นไม่ใช่เพียง 4 หัวขึ้นไปในแถว แต่ 6 หรือมากกว่าและ 10 หรือมากกว่า หากต้องการให้ชัดเจนหากมีริ้ว 9 หัวมันจะนับเป็น 1 ริ้ว 4 หรือมากกว่า (และ / หรือ 6 หรือมากกว่า) ไม่ใช่ 2 เส้นแยกกัน ตัวอย่างเช่นหากเหรียญมาถึง THTHTHTHHHHHH /// THAHTHT .... การนับจะเป็น 13 และเริ่มต้นอีกครั้งบนก้อยถัดไป

สมมุติว่าข้อมูลออกมาเอียงไปทางขวาอย่างมาก หมายความว่าเฉลี่ย 40 พลิกโดยเฉลี่ยเพื่อให้ได้แนว 4 หรือมากกว่าและการกระจายคือ u = 28 ความเบ้เห็นได้ชัด

ฉันพยายามอย่างเต็มที่เพื่อหาวิธีที่จะทำให้ข้อมูลบางอย่างมีความหมายยกเว้น ณ ตอนนี้ฉันไม่พบอะไรเลย

ฉันต้องการค้นหาวิธีที่จะทำให้ความน่าจะเป็นบางอย่างออกมาได้ เช่นเส้นโค้งปกติที่ +/- 1 SD อยู่ที่ 68% ฯลฯ ฉันได้ดูบันทึกการทำให้เป็นมาตรฐานและนั่นใช้สำหรับการทดสอบพารามิเตอร์ที่ไม่ใช่เป้าหมายของฉัน

ฉันได้รับแจ้งว่ามีการแจกแจงเบต้า แต่คำแนะนำทุกข้อที่ฉันค่อนข้างสับสน ฉันได้ถามคำถามนี้เมื่อหนึ่งปีที่แล้วและได้รับข้อมูลเชิงลึก แต่น่าเสียดายที่ฉันยังไม่มีคำตอบ ขอบคุณทุกคนที่มีความคิด


ฉันอาจจะอธิบายให้กระจ่างหน่อย 1) ฉันกำลังมองหาข้อมูลเชิงพรรณนาของจำนวนหัวต่อเนื่องที่สูงกว่า 4 ใน 1,000 flips (คล้ายกับบางอย่างเช่นความน่าจะเป็นเส้นโค้งปกติ +/- 1 SD = 68%) จากชุดข้อมูลที่เอียง 2) แนะนำให้ใช้การแจกแจงแบบเบต้า แต่ข้อเสนอแนะอื่น ๆ จะดีมาก!
ด่าน

1
แดนฉันเพิ่งสังเกตว่าชุดหัวและก้อยตัวอย่างของคุณมี "A"
Glen_b -Reinstate Monica

การแก้ไขที่คุณทำเป็นการปรับปรุงที่ยิ่งใหญ่ แต่เราจำเป็นต้องทำการเปลี่ยนแปลงเพิ่มเติม ที่คุณพูดว่า "และการกระจายคือ u = 28" คุณหมายถึงอะไรกันแน่? คุณกำลังพูดถึงค่ามัธยฐาน?
Glen_b -Reinstate Monica

@Dan รุ่นเบต้าสามารถคำนึงถึงปัญหานี้ได้หากคุณใช้วิธีแบบเบย์และประเมินความน่าจะเป็นของหัวจากนั้นใช้การแจกแจงนั้น (และความไม่แน่นอนที่เกี่ยวข้อง) ลงในผลลัพธ์ทางคณิตศาสตร์ของปัญหาที่คุณระบุ
AdamO

คำตอบ:


12

หากฉันเข้าใจอย่างถูกต้องแล้วปัญหาคือการหาการแจกแจงความน่าจะเป็นในช่วงเวลาที่การเรียกใช้ครั้งแรกของหัวหรือมากกว่าสิ้นสุดลงn

แก้ไขความน่าจะเป็นสามารถกำหนดได้อย่างแม่นยำและรวดเร็วโดยใช้การคูณเมทริกซ์และยังสามารถคำนวณค่าเฉลี่ยเป็นและความแปรปรวนเป็นโดยที่แต่อาจมีรูปแบบปิดไม่ง่ายสำหรับการแจกแจง ดังกล่าวข้างต้นจำนวนหนึ่งของเหรียญพลิกกระจายเป็นหลักกระจายเรขาคณิต: มันจะทำให้ความรู้สึกที่จะใช้แบบฟอร์มนี้สำหรับขนาดใหญ่ทีσ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 ตันμ=2n+11σ2=2n+2(μn3)μ2+5μμ=μ+1t

วิวัฒนาการในช่วงเวลาของการกระจายความน่าจะเป็นในพื้นที่รัฐสามารถสร้างแบบจำลองโดยใช้เมทริกซ์การเปลี่ยนแปลงสำหรับรัฐโดยที่จำนวนของเหรียญที่ต่อเนื่องกันพลิก รัฐมีดังนี้:n =k=n+2n=

  • สถานะไม่มีหัวH0
  • สถานะ ,หัวหน้า,ฉัน1 ฉัน( n - 1 )Hii1i(n1)
  • รัฐ ,หรือหัวมากขึ้น nHnn
  • รัฐ , หัวหรือมากกว่าตามด้วยหาง nHn

เมื่อคุณเข้าสู่สถานะคุณจะไม่สามารถกลับไปสู่สถานะอื่นได้H

ความน่าจะเป็นในการเปลี่ยนสถานะเพื่อเข้าสู่รัฐมีดังนี้

  • สถานะ : ความน่าจะเป็นจาก , , รวมถึงตัวเอง แต่ไม่ใช่สถานะ1H0 Hii=0,,n-1Hn12Hii=0,,n1Hn
  • สถานะ : ความน่าจะเป็นจาก1Hi Hi-112Hi1
  • สถานะ : ความน่าจะเป็นจากคือจากรัฐที่มีหัวและตัวมันเอง1Hn Hn-1,Hnn-112Hn1,Hnn1
  • สถานะ : ความน่าจะเป็นจากและความน่าจะเป็น 1 จาก (ตัวมันเอง)1H HnH12HnH

ตัวอย่างเช่นสำหรับนี่จะให้เมทริกซ์การเปลี่ยนแปลงn=4

X={H0H1H2H3H4HH01212121200H11200000H20120000H30012000H400012120H0000121}

สำหรับกรณีที่ , เวกเตอร์เริ่มต้นของความน่าจะเป็นเป็น(1,0,0,0,0,0) โดยทั่วไปเวกเตอร์เริ่มต้นมี p p = ( 1 , 0 , 0 , 0 , 0 , 0 ) p i = { 1 i = 0 0 i > 0n=4pp=(1,0,0,0,0,0)

pi={1i=00i>0

vectorคือการแจกแจงความน่าจะเป็นในอวกาศตามเวลาที่กำหนด CDF ต้องเป็น CDF ในเวลาและความน่าจะเป็นของที่ได้เห็นอย่างน้อยเหรียญพลิกสิ้นสุดตามเวลาทีมันสามารถเขียนเป็นโดยสังเกตว่าเรามาถึงสถานะ 1 การเวลาหลังจากครั้งสุดท้ายในการโยนเหรียญติดต่อกัน n t ( X t + 1 p ) k H pnt(Xt+1p)kH

PMF ต้องในเวลาที่สามารถเขียนเป็น k อย่างไรก็ตามตัวเลขนี้เกี่ยวข้องกับการเอาจำนวนที่น้อยมากจากจำนวนที่มากขึ้น ( ) และจำกัดความแม่นยำ ดังนั้นในการคำนวณจะเป็นการดีกว่าถ้าตั้งค่ามากกว่า 1 จากนั้นจึงเขียนสำหรับเมทริกซ์ที่ได้จากผลลัพธ์ , pmf คือ k นี่คือสิ่งที่จะดำเนินการในง่าย R โปรแกรมด้านล่างซึ่งทำงานสำหรับการใด ๆ ,1 X(Xt+1p)k(Xtp)k1 X X =X | X k , k =0( X t + 1 p ) k n2Xk,k=0XX=X|Xk,k=0(Xt+1p)kn2

n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
           rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
           1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
         byrow=T,nrow=k)/2
X

t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
  #pvk=pv[k]; # if calculating via cdf
  pv = X %*% pv;
  #pt[i-1]=pv[k]-pvk # if calculating via cdf
  pt[i-1]=pv[k] # if calculating pmf
}

m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)

par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")

พล็อตด้านบนแสดง pmf ระหว่าง 0 ถึง 100 พล็อตที่สองที่ต่ำกว่าแสดง pmf ระหว่าง 10 และ 110 และระหว่าง 1010 และ 1110 แสดงให้เห็นถึงความคล้ายคลึงกันในตัวเองและความจริงที่ @Glen_b บอกว่าการกระจายดูเหมือนว่า ประมาณโดยการกระจายทางเรขาคณิตหลังจากช่วงเวลาที่ปักหลัก

ป้อนคำอธิบายรูปภาพที่นี่

มันเป็นไปได้ที่จะตรวจสอบพฤติกรรมนี้ต่อไปโดยใช้การสลายตัววิคเตอร์ของXการทำเช่นนี้แสดงให้เห็นว่าสำหรับมีขนาดใหญ่พอ, , ที่คือคำตอบของสมการ 0 การประมาณนี้ดีขึ้นเมื่อเพิ่มและยอดเยี่ยมสำหรับในช่วงจาก 30 ถึง 50 ขึ้นอยู่กับค่าของดังแสดงในพล็อตของข้อผิดพลาดบันทึกด้านล่างสำหรับการคำนวณ (สีรุ้งสีแดงบน เหลือไว้สำหรับt p t + 1c ( n ) p t cXtpt+1c(n)pt2 n + 1 c n ( c - 1 ) + 1 = 0 n t n p 100 n = 2 tc(n)2n+1cn(c1)+1=0ntnp100n=2) (อันที่จริงด้วยเหตุผลเชิงตัวเลขจริง ๆ แล้วมันจะดีกว่าที่จะใช้การประมาณทางเรขาคณิตสำหรับความน่าจะเป็นเมื่อมีขนาดใหญ่กว่า)t

ป้อนคำอธิบายรูปภาพที่นี่

ฉันสงสัยว่า (ed) อาจมีรูปแบบปิดสำหรับการแจกจ่ายเนื่องจากค่าเฉลี่ยและความแปรปรวนตามที่ฉันคำนวณได้ดังต่อไปนี้

nMeanVariance2724315144431736563339261271472072556169685112534409102310291201020474151296

(ฉันต้องชนจำนวนขึ้นขอบฟ้าเวลาที่t=100000จะได้รับนี้ แต่โปรแกรมยังคงวิ่งสำหรับในเวลาน้อยกว่าประมาณ 10 วินาที) หมายถึงโดยเฉพาะตามรูปแบบที่ชัดเจนมาก; ความแตกต่างน้อยดังนั้น ฉันได้แก้ไขระบบการเปลี่ยนสถานะที่เรียบง่ายกว่า 3 รัฐในอดีตที่ผ่านมา แต่จนถึงตอนนี้ฉันไม่มีโชคกับวิธีการวิเคราะห์ที่ง่ายสำหรับระบบนี้ อาจมีทฤษฎีที่มีประโยชน์บางอย่างที่ฉันไม่ทราบเช่นเกี่ยวกับเมทริกซ์การเปลี่ยนแปลงn=2,,10

แก้ไข : หลังจากการเริ่มต้นผิดพลาดมากมายฉันคิดสูตรการทำซ้ำ ให้เป็นความน่าจะเป็นของการอยู่ในรัฐในเวลาทีให้เป็นความน่าจะเป็นที่สะสมของการอยู่ในรัฐคือรัฐสุดท้ายในเวลาทีNB H ฉัน t q , t H tpi,tHitq,tHt

  • สำหรับใดก็ตาม,และคือการแจกแจงความน่าจะเป็นในอวกาศและทันทีที่ฉันใช้ข้อเท็จจริงที่ว่าความน่าจะเป็นของพวกมันเพิ่มเป็น 1p i , t , 0 i n q , t itpi,t,0inq,ti
  • tp,tรูปแบบการกระจายความน่าจะเป็นในช่วงเวลาทีต่อมาฉันใช้ข้อเท็จจริงนี้เพื่อหาวิธีและความแปรปรวนt

ความน่าจะเป็นของการอยู่ที่สถานะแรกในเวลาคือไม่มีหัวโดยการเปลี่ยนแปลงความน่าจะเป็นจากรัฐที่สามารถกลับไปที่เวลา (โดยใช้ทฤษฎีบทของความน่าจะเป็นรวม) แต่ ที่จะได้รับจากรัฐถึงใช้ขั้นตอนดังนั้นและ อีกครั้งโดยทฤษฎีบทของความน่าจะเป็นทั้งหมด อยู่ที่สถานะt p 0 , t + 1t+1t

p0,t+1=12p0,t+12p1,t+12pn1,t=12i=0n1pi,t=12(1pn,tq,t)
H n - 1 n - 1 p n - 1 , t + n - 1 = 1H0Hn1n1pn-1,t+n=1pn1,t+n1=12n1p0,t H n t+1 p n , t + 1
pn1,t+n=12n(1pn,tq,t)
Hnณ เวลาที่คือ และ ใช้ข้อเท็จจริงที่ว่า , ดังนั้นเปลี่ยน , t+1
pn,t+1=12pn,t+12pn1,t=12pn,t+12n+1(1pn,tnq,tn)()
q,t+1q,t=12pn,tpn,t=2q,t+12q,t
2q,t+22q,t+1=q,t+1q,t+12n+1(12q,tn+1+q,tn)
tt+n
2q,t+n+23q,t+n+1+q,t+n+12nq,t+112n+1q,t12n+1=0

การตรวจสอบการเกิดซ้ำสูตรนี้ออกสำหรับกรณีและ 6 เช่นสำหรับพล็อตของสูตรนี้โดยใช้ให้ความแม่นยำในการสั่งซื้อเครื่องn=4n=6n=6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7

ป้อนคำอธิบายรูปภาพที่นี่

แก้ไขฉันไม่สามารถดูตำแหน่งที่จะไปหาแบบฟอร์มปิดจากความสัมพันธ์ที่เกิดซ้ำนี้ อย่างไรก็ตามมันเป็นไปได้ที่จะได้รับแบบฟอร์มปิดสำหรับค่าเฉลี่ย

เริ่มต้นจากและสังเกตว่า , รับผลรวมจากถึงและใช้สูตรสำหรับค่าเฉลี่ยและสังเกตว่าคือการแจกแจงความน่าจะเป็น ()p,t+1=12pn,t

pn,t+1=12pn,t+12n+1(1pn,tnq,tn)()2n+1(2p,t+n+2p,t+n+1)+2p,t+1=1q,t
t=0E[X]=x=0(1F(x))p,t
2n+1t=0(2p,t+n+2p,t+n+1)+2t=0p,t+1=t=0(1q,t)2n+1(2(112n+1)1)+2=μ2n+1=μ
นี่คือค่าเฉลี่ยสำหรับการเข้าถึงสถานะ ; ค่าเฉลี่ยสำหรับจุดสิ้นสุดของการวิ่งของหัวน้อยกว่านี้H

แก้ไขวิธีการที่คล้ายกันโดยใช้สูตรจากคำถามนี้ทำให้เกิดความแปรปรวน E[X2]=x=0(2x+1)(1F(x))

t=0(2t+1)(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)=t=0(2t+1)(1q,t)2t=0t(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)+μ=σ2+μ22n+2(2(μ(n+2)+12n+1)(μ(n+1)))+4(μ1)+μ=σ2+μ22n+2(2(μ(n+2))(μ(n+1)))+5μ=σ2+μ22n+2(μn3)+5μ=σ2+μ22n+2(μn3)μ2+5μ=σ2

วิธีการและความแปรปรวนสามารถสร้างได้อย่างง่ายดายโดยทางโปรแกรม เช่นเพื่อตรวจสอบวิธีการและผลต่างจากตารางข้างต้นใช้งาน

n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2

ในที่สุดฉันไม่แน่ใจว่าสิ่งที่คุณต้องการเมื่อคุณเขียน

เมื่อก้อยกระทบและแตกแนวของหัวการนับจะเริ่มอีกครั้งจากการโยนครั้งต่อไป

หากคุณหมายถึงการกระจายความน่าจะเป็นในครั้งถัดไปที่การเรียกใช้ครั้งแรกของหัวหรือมากกว่าสิ้นสุดลงจุดสำคัญจะอยู่ในความคิดเห็นนี้โดย @Glen_bซึ่งก็คือกระบวนการเริ่มต้นอีกครั้งหลังจากหางหนึ่ง (cf ปัญหาเริ่มต้นที่คุณสามารถได้รับหัวหรือมากกว่าทันที)nn

ซึ่งหมายความว่าตัวอย่างเช่นเวลาเฉลี่ยของเหตุการณ์แรกคือแต่เวลาเฉลี่ยระหว่างเหตุการณ์มักจะเป็นเสมอ(ความแปรปรวนเหมือนกัน) นอกจากนี้ยังเป็นไปได้ที่จะใช้เมทริกซ์การเปลี่ยนแปลงเพื่อตรวจสอบความน่าจะเป็นในระยะยาวของการอยู่ในสถานะหลังจากที่ระบบ "ตัดสินลง" ที่จะได้รับการเปลี่ยนแปลงเมทริกซ์ที่เหมาะสมตั้งและเพื่อให้ผลตอบแทนจากระบบทันทีไปยังรัฐจากรัฐ * จากนั้นปรับขนาดวิคเตอร์แรกของเมทริกซ์ใหม่นี้จะช่วยให้ความน่าจะนิ่ง ด้วยความน่าจะเป็นแบบคงที่คือμ1μ+1Xk,k,=0X1,k=1H0Hn=4

probabilityH00.48484848H10.24242424H20.12121212H30.06060606H40.06060606H0.03030303
เวลาที่คาดหวังระหว่างรัฐจะได้รับจากส่วนกลับของความน่าจะเป็น ดังนั้นครั้งคาดว่าระหว่างการเข้าชม1H=1/0.03030303=33=μ+1

ภาคผนวก : โปรแกรม Python ใช้เพื่อสร้างความน่าจะเป็นที่แน่นอนสำหรับn= จำนวนของส่วนหัวที่ต่อเนื่องกันมากกว่าที่จะNโยน

import itertools, pylab

def countinlist(n, N):
    count = [0] * N
    sub = 'h'*n+'t'
    for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
        f = string.find(sub)
        if (f>=0):
            f = f + n -1 # don't count t, and index in count from zero 
            count[f] = count[f] +1
            # uncomment the following line to print all matches
            # print "found at", f+1, "in", string
    return count, 1/float((2**(N+1)))

n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]

for i in range(N):
    print '{0:2d} {1:.10f}'.format(i+1,probs[i]) 
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()

7

ฉันไม่แน่ใจว่าเบต้าน่าจะเหมาะสมเป็นพิเศษในการจัดการกับปัญหานี้ - "จำนวนการเล่นจนกว่า ... " จะนับอย่างชัดเจน มันเป็นจำนวนเต็มและไม่มีขีด จำกัด สูงสุดสำหรับค่าที่คุณได้รับความน่าจะเป็นบวก

ในทางตรงกันข้ามการกระจายเบต้านั้นต่อเนื่องและในช่วงเวลาที่ จำกัด ดังนั้นมันจึงเป็นตัวเลือกที่ผิดปกติ หากช่วงเวลาคุณตรงกับเบต้าที่ปรับขนาดฟังก์ชันการแจกแจงแบบสะสมอาจจะไม่ได้ประมาณค่าที่ไม่ดีในส่วนที่เป็นศูนย์กลางของการแจกแจง อย่างไรก็ตามทางเลือกอื่น ๆ มีแนวโน้มที่จะดีขึ้นอย่างมีนัยสำคัญต่อไปในหางทั้งสอง

หากคุณมีการแสดงออกถึงความน่าจะเป็นหรือการจำลองจากการแจกแจง (ซึ่งคุณอาจต้องการเพื่อหาเบต้าประมาณ) ทำไมคุณไม่ใช้โดยตรง


หากความสนใจของคุณอยู่ในการค้นหานิพจน์สำหรับความน่าจะเป็นหรือการกระจายความน่าจะเป็นของจำนวนการโยนที่ต้องการความคิดที่ง่ายที่สุดคือการทำงานกับฟังก์ชันสร้างความน่าจะเป็น สิ่งเหล่านี้มีประโยชน์สำหรับการหาฟังก์ชั่นจากความสัมพันธ์แบบเรียกซ้ำระหว่างความน่าจะเป็นซึ่งฟังก์ชัน (pgf) จะช่วยให้เราสามารถแยกความน่าจะเป็นที่เราต้องการได้

ต่อไปนี้เป็นบทความที่มีคำตอบที่ดีเกี่ยวกับวิธีการทางพีชคณิตซึ่งอธิบายทั้งความยากลำบากและการใช้ประโยชน์จาก pgfs และความสัมพันธ์ที่เกิดซ้ำ มันมีการแสดงออกที่เฉพาะเจาะจงสำหรับค่าเฉลี่ยและความแปรปรวนในกรณี "สองความสำเร็จในแถว":

/math/73758/probability-of-n-successes-in-a-row-at-the-k-th-bernoulli-trial-geometric

กรณีความสำเร็จทั้งสี่จะยากกว่าเดิมมาก ในทางกลับกันทำให้สิ่งต่าง ๆ ง่ายขึ้นp=12

-

หากคุณต้องการคำตอบเชิงตัวเลขการจำลองนั้นค่อนข้างตรงไปตรงมา การประมาณความน่าจะเป็นสามารถใช้โดยตรงหรือมิฉะนั้นก็มีเหตุผลที่จะทำให้ความน่าจะเป็นแบบจำลองราบรื่นขึ้น

หากคุณต้องใช้การแจกแจงแบบประมาณคุณอาจเลือกสิ่งที่ทำได้ค่อนข้างดี

อาจเป็นไปได้ว่าส่วนผสมของชื่อทวินามเชิงลบ (เวอร์ชัน 'จำนวนการทดสอบ' แทนที่จะเป็น 'จำนวนครั้งที่ประสบความสำเร็จ') อาจมีเหตุผล ควรคาดหวังว่าองค์ประกอบสองหรือสามองค์ประกอบจะให้การประมาณที่ดีในทุกส่วนยกเว้นส่วนท้ายสุด

หากคุณต้องการการกระจายแบบต่อเนื่องเพียงครั้งเดียวสำหรับการประมาณค่าอาจมีทางเลือกที่ดีกว่าการแจกแจงแบบเบต้า มันจะเป็นสิ่งที่ต้องสืบสวน


เอาล่ะฉันทำพีชคณิตนิดหน่อยแล้วบางคนก็เล่นกับความสัมพันธ์ที่เกิดซ้ำการจำลองบางอย่างและแม้แต่ความคิดเล็กน้อย

สำหรับการประมาณที่ดีมากฉันคิดว่าคุณสามารถหนีไปได้โดยเพียงแค่ระบุความน่าจะเป็นที่ไม่ใช่ศูนย์สี่ตัวแรก (ซึ่งเป็นเรื่องง่าย) คำนวณค่าสองสามกำมือถัดไปผ่านการเกิดซ้ำ (เช่นง่าย) และจากนั้นใช้หางเรขาคณิต ทำให้ความก้าวหน้าที่ราบรื่นน้อยลงในขั้นแรก

ดูเหมือนว่าคุณสามารถใช้หางรูปทรงเรขาคณิตเพื่อความแม่นยำสูงมากที่ผ่านมา k = 20 แต่หากคุณกังวลว่าจะบอกความแม่นยำของรูปที่ 4 คุณสามารถนำมาใช้ก่อนหน้านี้

สิ่งนี้จะช่วยให้คุณสามารถคำนวณ pdf และ cdf ได้อย่างแม่นยำ

ฉันกังวลเล็กน้อย - การคำนวณของฉันระบุว่าค่าเฉลี่ยของการโยนคือ 30.0 และค่าเบี่ยงเบนมาตรฐานคือ 27.1; ถ้าฉันเข้าใจความหมายของ "x" และ "u" คุณจะได้ 40 และ 28 ในการโยน 28 ดูเหมือนไม่เป็นไร แต่ 40 ดูเหมือนจะเป็นวิธีที่ฉันได้ ... ซึ่งทำให้ฉันกังวลว่าฉันทำอะไรผิด

====

หมายเหตุ: ด้วยความซับซ้อนระหว่างครั้งแรกและครั้งต่อ ๆ ไปที่เราพบฉันแค่อยากจะแน่ใจอย่างแน่นอนตอนนี้ที่เรากำลังนับสิ่งเดียวกัน

นี่คือลำดับสั้น ๆ ที่มีจุดสิ้นสุดของลำดับ '4 หรือมากกว่า H' (ชี้ไปที่ช่องว่างระหว่างการพลิกทันทีหลังจาก H สุดท้าย)

       \/                     \/
TTHHHHHHTTHTTTTTHHTTHTTHHTHHHHHT...
       /\                     /\

ระหว่างเครื่องหมายทั้งสองนี้ฉันนับ 23 การโยน นั่นคือทันทีที่ลำดับก่อนหน้าของ (6 ในกรณีนี้) สิ้นสุดของ H เราจะเริ่มนับที่จุดถัดไปทันทีจากนั้นเรานับสิทธิ์จนถึงจุดสิ้นสุดของลำดับ 5 H (ในกรณีนี้) ซึ่งจบลำดับถัดไป ให้นับ 23 ในกรณีนี้

นั่นเป็นวิธีที่คุณนับพวกเขา?


นี่คือสิ่งที่ฟังก์ชั่นความน่าจะเป็นของการโยนหลังจากการวิ่งหนึ่งครั้งที่มีอย่างน้อย 4 หัวเสร็จสมบูรณ์จนกว่าการวิ่งครั้งต่อไปของอย่างน้อย 4 หัวจะเสร็จสมบูรณ์ดูเหมือนว่า:

โพรบเหรียญ

เมื่อมองดูครั้งแรกมันดูเหมือนว่าแบนสำหรับค่าสองสามค่าแรกจากนั้นมีหางรูปทรงเรขาคณิตแต่ความประทับใจนั้นไม่แม่นยำนัก - ใช้เวลาสักครู่ในการปักหลักหางรูปทรงเรขาคณิตได้อย่างมีประสิทธิภาพ

ฉันกำลังดำเนินการเกี่ยวกับการประมาณที่เหมาะสมที่คุณสามารถใช้เพื่อตอบคำถามใด ๆ ที่คุณมีเกี่ยวกับความน่าจะเป็นที่เกี่ยวข้องกับกระบวนการนี้เพื่อความแม่นยำที่ดีในเวลาเดียวกันให้ง่ายที่สุดเท่าที่จะทำได้ ฉันมีการประมาณค่าที่ดีพอสมควรซึ่งควรใช้งานได้ (ซึ่งฉันได้ตรวจสอบกับการจำลองการโยนเหรียญเป็นพันล้านเหรียญ) แล้ว แต่มีอคติบางอย่าง (เล็ก แต่สอดคล้องกัน) ในความน่าจะเป็นที่ประมาณในช่วงนั้นและฉันต้องการ ดูว่าฉันจะได้รับความแม่นยำหลักพิเศษจากมัน

อาจเป็นได้ว่าวิธีที่ดีที่สุดที่จะทำคือให้ตารางฟังก์ชันความน่าจะเป็นและ cdf ออกไปจนถึงจุดที่สามารถใช้การกระจายแบบเรขาคณิตได้

อย่างไรก็ตามมันจะช่วยถ้าคุณสามารถให้ความคิดเกี่ยวกับช่วงของสิ่งต่าง ๆ ที่คุณจำเป็นต้องใช้ในการประมาณค่า


ฉันหวังว่าจะทำตามวิธีการของ pgf แต่เป็นไปได้ที่คนอื่นจะมีความเชี่ยวชาญกับพวกเขามากกว่าฉันและไม่สามารถทำได้แค่ 4 ราย แต่เป็นกรณีอื่น


เพื่อชี้แจงสิ่งต่าง ๆ เพิ่มเติม การแจกแจงที่ปรับหรือจำลองแบบจำลองที่คำนึงถึงการไหลของหัวที่ประสบความสำเร็จมากกว่า 4 หัวจะเป็นอุดมคติ ตัวอย่างเช่นถ้าค่าเฉลี่ย populatoin เท่ากับ 150 flips สำหรับ 4 หัวติดต่อกัน ถ้า 4 หัวขึ้นไปมาในการโยนครั้งที่ 8 มันไม่น่าเป็นไปได้ที่หัว 4 คนขึ้นไปจะไม่มาในอีก 20 หรือมากกว่าพลิก (ฉันแค่เดา) และอาจจะใกล้เคียงกับค่าเฉลี่ย บางสิ่งที่ทำให้ฉันมีโอกาสเป็นไปได้เมื่อหัวที่ต่อเนื่องกันได้ถึง 4 หัวจะเกิดขึ้นภายในระยะการโยนที่แน่นอนจะเป็นที่น่าอัศจรรย์
ด่าน

เมื่อคุณเพิ่งมี 4 หัวถ้าคุณได้รับหัว 5 ทำชุด 4 ล่าสุดนั้นนับเป็นอีกชุด 4 หรือนับการตั้งค่าใหม่ดังนั้นคุณจะเริ่มต้นอีกครั้งจากหัวแรก (ทันทีที่คุณเห็น หนึ่ง)?
Glen_b -Reinstate Monica

(ฉันสันนิษฐานว่าจนถึงตอนนี้ถ้าคุณสร้างลำดับสี่จำนวนมากจากนั้นจะไม่มีการทับซ้อนกัน - เมื่อคุณได้รับ 4 จำนวนการนับของ S รีเซ็ตเป็น 0)
Glen_b

4 หัวหรือมากกว่านั้นทันทีที่คุณได้หางหลังจาก 4 หัวแนวจะหยุด จากนั้นจำนวนจะเริ่มต้นใหม่จนกว่าคุณจะเห็น 4 หัวขึ้นไปอีกครั้งอย่างต่อเนื่อง
ด่าน

4 หัวหรือมากกว่า - ฉันเห็นว่าจริง ๆ แล้วสิ่งที่มันบอกไว้ในคำถามฉันเพิ่งไม่เข้าใจมันค่อนข้างถูกต้อง ดังนั้นหัว 9 หัวจะไม่นับรวมเป็น 2 หัว 4 หัว นั่นเปลี่ยนการคำนวณทั้งหมดที่ฉันทำ ความสัมพันธ์ที่เกิดซ้ำที่ฉันใช้นั้นไม่ถูกต้อง แนวคิดพื้นฐาน - ว่าควรมีหางเรขาคณิต - ที่จะยังคงถือ
Glen_b -Reinstate Monica

0

คุณต้องการกระจายทางเรขาคณิต จากวิกิพีเดีย:

การกระจายความน่าจะเป็นของจำนวนของการทดลอง Bernoulli จำเป็นต้องได้รับอย่างใดอย่างหนึ่งที่ประสบความสำเร็จได้รับการสนับสนุนในชุด {1, 2, 3, ... }X

ให้หัว H เป็นความล้มเหลวและก้อย T เป็นความสำเร็จ ตัวแปรสุ่มคือจำนวนของการโยนเหรียญที่ต้องการเพื่อดูก้อยแรก ตัวอย่างเช่นจะเป็นลำดับ HHHT นี่คือการแจกแจงความน่าจะเป็นสำหรับ :XX=4X

P(X=x)=(1p)x1p

อย่างไรก็ตามเราต้องการเพียงจำนวนหัวเท่านั้น ลองกำหนดแทนจำนวนหัวแทน นี่คือการกระจาย:Y=X1

P(Y+1=x)=(1p)x1pP(Y=x1)=(1p)x1pP(Y=y)=(1p)yp

สำหรับ... เราคิดเหรียญยุติธรรมทำให้pดังนั้น: y=0,1,2,3...p=0.5

P(Y=y)=(0.5)y(0.5)=0.5y+1

ทั้งหมดนี้จะถือว่าจำนวนการโยนมีขนาดใหญ่พอ (เช่น 10,000) สำหรับขนาดเล็ก (จำกัด )เราจะต้องเพิ่มตัวประกอบการทำให้เป็นมาตรฐานลงในนิพจน์ พูดง่ายๆก็คือเราต้องทำให้แน่ใจว่าผลรวมทั้งหมดเท่ากับ 1 เราสามารถทำได้โดยหารด้วยผลรวมของความน่าจะเป็นทั้งหมดซึ่งนิยามไว้ที่นี่เป็น :nnα

α=i=0n1P(Y=i)

นี่หมายถึงรูปแบบที่ถูกต้องของซึ่งเขียนแทนจะเป็น:YZ

P(Z=z)=1α(1p)zp=1i=0n1(1p)ip(1p)zp

อีกครั้งด้วยเราสามารถลดสิ่งนี้ได้มากขึ้นโดยใช้การสรุปชุดทางภูมิศาสตร์ :p=0.5

P(Z=z)=1i=0n10.5i+10.5z+1=110.5n0.5z+1=0.5z+110.5n

และเราจะเห็นได้ว่าเมื่อเวอร์ชันแก้ไขของเราเข้าใกล้จากก่อนหน้านี้Z YnZY


2
ฉันคิดว่ามีรายละเอียดของคำถามที่คุณอาจพลาดไป ถ้าฉันไม่เข้าใจผิดคำถามมันไม่ใช่แค่เรขาคณิต
Glen_b -Reinstate Monica

ฉันอัพเดทมันเพื่อจัดการกับ n จำกัด และใช่ฉันเห็นตอนนี้ว่าเขาต้องการย้ายหน้าต่างมากกว่าจำนวนที่แน่นอน เหมืองใช้งานได้กับโซ่เท่านั้นไม่ใช่เวลาระหว่างพวกเขา
clintonmonk

ขั้นตอนแรกที่ดีคือดูกราฟในโพสต์ของ @ Glen_b และดูว่าคุณสามารถทำซ้ำได้หรือไม่ ฉันได้เพิ่มโปรแกรม Python ที่ฉันเขียนเพื่อตรวจสอบความน่าจะเป็นที่แน่นอน หากคุณสามารถเรียกใช้สิ่งนี้ได้ให้ยกเลิกการใส่เครื่องหมายบรรทัดที่พิมพ์ตรงกันลดลงNระหว่าง 5 ถึง 7 และคุณจะรู้สึกดีกับเหตุการณ์ที่ต้องการ (หมายเหตุpylabจำเป็นสำหรับการพล็อตเท่านั้น)
TooTone

น่าเสียดายที่ฉันไม่ได้อยู่กับพีซีที่ฉันสามารถทดสอบได้ในขณะนี้ ฉันเริ่มใช้กระบวนการมาร์คอฟเพื่อแสดงว่าโซลนิ่งเป็นรูปทรงเรขาคณิต (และ E [เวลาในการส่งคืน] = 1 / ) แต่ฉันไม่มีเวลาที่จะแยกมันออกมาให้สมบูรณ์ πi
clintonmonk

ใช่ถ้าโดยเครื่องเขียนแบบนิ่งคุณกำลังพูดถึงอัตราส่วนของความน่าจะเป็นติดต่อกันในหางที่แปรปรวนเป็นค่าคงที่แล้วเครื่องเขียนแบบคงที่นั้นเป็นรูปทรงเรขาคณิตจริง ๆ
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.