เราสามารถแก้ปัญหานี้ได้ด้วย "ลูกเล่น" และคณิตศาสตร์เล็กน้อย
นี่คืออัลกอริทึมพื้นฐาน:
- สร้างตัวแปรสุ่มเรขาคณิตที่มีความน่าจะเป็นของความสำเร็จของพีp
- ผลของตัวแปรสุ่มนี้จะกำหนดค่าที่รู้จักกันคงfn∈[0,1] ]
- สร้างตัวแปรสุ่มBer(fn)โดยใช้การโยนเหรียญยุติธรรมที่สร้างขึ้นจากการพลิกคู่ที่ถูกบล็อกคู่ของเหรียญBer(p)
- ผลที่เกิดจะเป็นBer(pa)สำหรับการใด ๆ∈ ( 0 , 1 )ซึ่งเป็นสิ่งที่เราต้องการa∈(0,1)
เพื่อให้สิ่งต่าง ๆ ย่อยง่ายขึ้นเราจะแบ่งข้าวของออกเป็นชิ้น ๆ
ชิ้นส่วนที่ 1 : โดยไม่ต้องสูญเสียของทั่วไปคิดว่า0<a<1 1
หาก≥ 1แล้วเราสามารถเขียนหน้า = P n P ขสำหรับบางจำนวนเต็มบวกnและบาง0 ≤ ข< 1 แต่สำหรับ Bernoulli สองคนที่เป็นอิสระเรามี
P ( X 1 = X 2 = 1 ) = p 1 p 2a≥1pa=pnpbn0≤b<1
P(X1=X2=1)=p1p2.
เราสามารถสร้าง
pn Bernoulli จากเหรียญของเราได้อย่างชัดเจน ดังนั้นเราต้องกังวลเท่านั้นตัวเองด้วยการสร้าง
Ber(pa)เมื่อ
∈ ( 0 , 1 )
a∈(0,1)
ชิ้นที่ 2 : รู้วิธีการสร้างโดยพลBer(q)จากพลิกเหรียญยุติธรรม
มีวิธีมาตรฐานในการทำเช่นนี้ ขยายในการขยายตัวไบนารีแล้วใช้เหรียญที่เหมาะสมของเราที่จะพลิก "จับคู่" ตัวเลขของคิว นัดแรกกำหนดว่าเราประกาศความสำเร็จ ("หัว") หรือล้มเหลว ("ก้อย") ถ้า q n = 1และการพลิกเหรียญของเราคือหัวประกาศหัวถ้า q n = 0และการพลิกเหรียญของเราคือก้อยให้ประกาศก้อย มิฉะนั้นให้พิจารณาตัวเลขที่ตามมากับการพลิกเหรียญใหม่q=0.q1q2q3…qqn=1qn=0
ส่วนที่ 3 : รู้วิธีสร้างเหรียญที่ยุติธรรมจากผู้ไม่ยุติธรรมที่มีอคติไม่ทราบ
สิ่งนี้เสร็จสิ้นสมมติว่าโดยการโยนเหรียญเป็นคู่ ถ้าเราได้รับ H Tให้ประกาศหัว หากเราได้รับ T Hให้ประกาศก้อยและทำซ้ำการทดลองจนกว่าจะมีผลลัพธ์หนึ่งในสองข้อดังกล่าวเกิดขึ้น พวกเขามีความน่าจะเป็นอย่างเท่าเทียมกันดังนั้นจะต้องมีความน่าจะเป็น 1 / 2p∈(0,1)HTTH1/2
ส่วนที่ 4 : คณิตศาสตร์บางอย่าง (เทย์เลอร์เพื่อช่วยเหลือ)
ด้วยการขยายประมาณp 0 = 1ทฤษฎีบทของเทย์เลอร์ยืนยันว่า
p a = 1 - a ( 1 - p ) - a ( 1 - a )h(p)=pap0=1
โปรดทราบว่าเนื่องจาก 0 < a < 1แต่ละเทอมหลังจากเทอมแรกเป็นลบเราจึงมี
p a = 1 - ∞ ∑ n = 1 b n ( 1 - p ) n
pa=1−a(1−p)−a(1−a)2!(1−p)2−a(1−a)(2−a)3!(1−p)3⋯.
0<a<1
ที่
0 ≤ ขn ≤ 1เป็นที่รู้จักกันเบื้องต้น
ดังนั้น
1 - p a = ∞ ∑ n = 1 b n ( 1 - p ) n = ∞ ∑ n = 1 b n P ( G ≥ n ) = ∞ ∑ n = 1 f n P ( G = n ) = Epa=1−∑n=1∞bn(1−p)n,
0≤bn≤1
ที่
G ~ จีอีo เมตร (1−pa=∑n=1∞bn(1−p)n=∑n=1∞bnP(G≥n)=∑n=1∞fnP(G=n)=Ef(G),
,
ฉ0 = 0และ
ฉn = Σ n k = 1ขkสำหรับ
n ≥ 1
G∼Geom(p)f0=0fn=∑nk=1bkn≥1
และเรารู้อยู่แล้วว่าวิธีการใช้เหรียญของเราในการสร้างตัวแปรสุ่มเรขาคณิตที่มีความน่าจะเป็นของความสำเร็จของพีp
ส่วนที่ 5 : เคล็ดลับ Monte Carlo
ให้เป็นตัวแปรสุ่มต่อเนื่องการค่าใน[ 0 , 1 ]ด้วยP ( X = x n ) = P n Let U | X ~ B อีอาร์ ( X ) แล้ว
P ( U = 1 ) = Σ n x n P nX[0,1]P(X=xn)=pnU∣X∼Ber(X)
P(U=1)=∑nxnpn.
แต่เมื่อใช้และx n = f nเราจะเห็นวิธีสร้างB e r ( 1 - p a)pn=p(1−p)nxn=fnตัวแปรสุ่ม )และนี่เป็นการเทียบเท่ากับการสร้าง B e r ( p ก )หนึ่งBer(1−pa)Ber(pa)