ค่า Worm และ Apple ที่คาดหวัง


8

แอปเปิ้ลตั้งอยู่ที่จุดสุดยอดของเพนตากอนและหนอนตั้งอยู่สองจุดอยู่ห่างออกไปที่Cทุกวันหนอนจะคลานด้วยความน่าจะเป็นที่เท่ากันของหนึ่งในสองจุดยอดที่อยู่ติดกัน ดังนั้นหลังจากที่วันหนึ่งหนอนที่จุดสุดยอดหรือแต่ละคนมีความน่าจะเป็น1/2หลังจากสองวันหนอนอาจกลับมาที่อีกครั้งเนื่องจากไม่มีหน่วยความจำของตำแหน่งก่อนหน้า เมื่อถึงจุดสุดยอดมันจะหยุดรับประทานอาหารAABCDECBD1/2CA

(a) จำนวนวันจนกระทั่งอาหารค่ำคืออะไร?

(b) ให้ p เป็นความน่าจะเป็นที่จำนวนวันเป็นหรือมากกว่า ความไม่เท่าเทียมของมาร์คอฟพูดถึงอย่างไร100p

สำหรับ (a) ให้เป็นตัวแปรสุ่มที่กำหนดโดยจำนวนวันจนกระทั่งอาหารเย็น ดังนั้นP (X = 0) = 0 \\ P (X = 1) = 0 \\ P (X = 2) = \ frac {1} {\ binom {5} {2}} \\ \ vdotsX

P(X=0)=0P(X=1)=0P(X=2)=1(52)

อะไรคือการกระจายทั่วไป

สำหรับ (b) ถ้าเรารู้ (ก) จากนั้นเรารู้ว่า

P(X100)E(X)100

2
คุณช่วยอธิบายสมการชุดแรกได้ไหม ดูเหมือนว่าพวกเขาจะไม่คำนึงถึงความเป็นไปได้ที่ทิศทางการย้อนกลับของหนอนจะไม่ถูกต้อง แล้วนั้นน้อยกว่าโอกาสของเส้นทางซึ่งมีความน่าจะเป็น โปรดทราบว่าประเด็นของคำถามนี้คือมันอาจจะยากที่จะได้รับการกระจายเต็มรูปแบบกว่าที่จะคำนวณความคาดหวังของมัน และความไม่เสมอภาคของมาร์คอฟช่วยให้คุณสามารถอนุมานข้อมูลที่เป็นประโยชน์จากความคาดหวังเพียงอย่างเดียว 1/(52)=1/10ABC(1/2)(1/2)=1/4.
whuber

คำตอบ:


6

ในคำตอบที่ยอดเยี่ยมโดยGlen_bเขาแสดงให้เห็นว่าคุณสามารถคำนวณค่าที่คาดหวังได้โดยใช้ระบบสมการเชิงเส้นอย่างง่าย ตามวิธีการวิเคราะห์นี้คุณสามารถตรวจสอบว่าจำนวนการย้ายที่คาดหวังไปยังแอปเปิ้ลคือหก คำตอบที่ยอดเยี่ยมอีกคำตอบโดยwhuberแสดงให้เห็นว่าจะได้รับฟังก์ชั่นมวลความน่าจะเป็นสำหรับกระบวนการหลังจากจำนวนการเคลื่อนไหวใด ๆ ที่กำหนดและวิธีนี้ยังสามารถใช้เพื่อรับโซลูชันการวิเคราะห์สำหรับค่าที่คาดหวัง หากคุณต้องการดูข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับปัญหานี้คุณควรอ่านเอกสารบางส่วนเกี่ยวกับการเดินสุ่มแบบวงกลม (ดูเช่นStephens 1963 )

เพื่อให้มุมมองทางเลือกของปัญหาฉันจะแสดงให้คุณเห็นว่าคุณจะได้รับผลลัพธ์เดียวกันโดยใช้วิธีการเดรัจฉานบังคับเพียงแค่การคำนวณห่วงโซ่มาร์คอฟโดยใช้การคำนวณทางสถิติ วิธีนี้ด้อยกว่าการตรวจสอบวิเคราะห์ในหลาย ๆ ด้าน แต่มันมีข้อดีที่จะช่วยให้คุณสามารถจัดการกับปัญหาโดยไม่ต้องมีความเข้าใจทางคณิตศาสตร์ที่สำคัญ


วิธีการคำนวณแรงแบบเดรัจฉาน:จดสถานะตามลำดับ , ช่วงการเปลี่ยนภาพเชนมาร์คอฟของคุณตามเมทริกซ์การเปลี่ยนแปลงต่อไปนี้:A,B,C,D,E

P=[100001201200012012000120121200120]

สถานะแรกคือสถานะการดูดซับที่หนอนอยู่ที่แอปเปิ้ล ให้เป็นจำนวนของการเคลื่อนไหวจนหนอนได้รับไปยังแอปเปิ้ลจากรัฐCจากนั้นสำหรับทั้งหมดความน่าจะเป็นที่เวิร์มอยู่ที่แอปเปิลหลังจากจำนวนการเคลื่อนไหวนี้คือและจำนวนที่คาดว่าจะได้รับจากแอปเปิ้ลคือ:ATCCnNP(TCn)={Pn}C,A

E(TC)=n=0P(TC>n)=n=0(1{Pn}C,A).

คำศัพท์ในผลรวมลดลงแบบทวีคูณสำหรับขนาดใหญ่เพื่อให้เราสามารถคำนวณค่าที่คาดหวังในระดับความถูกต้องที่ต้องการโดยตัดทอนผลรวมด้วยจำนวนเทอมที่ จำกัด (การสลายตัวแบบเอ็กซ์โพเนนเชียลของเงื่อนไขทำให้แน่ใจว่าเราสามารถ จำกัด ขนาดของคำที่ถูกลบให้ต่ำกว่าระดับที่ต้องการ) ในทางปฏิบัติมันง่ายที่จะรับจำนวนมากของคำจนกระทั่งขนาดของคำที่เหลืออยู่มีขนาดเล็กมากn


การเขียนโปรแกรมนี้ใน R:คุณสามารถโปรแกรมนี้เป็นฟังก์ชั่นในการRใช้รหัสด้านล่าง รหัสนี้ได้รับการเวกเตอร์เพื่อสร้างอาเรย์พลังของเมทริกซ์การเปลี่ยนแปลงสำหรับลำดับการเคลื่อนที่ที่แน่นอน นอกจากนี้เรายังสร้างพล็อตความน่าจะเป็นที่แอปเปิ้ลยังไม่ถึงแสดงให้เห็นว่าสิ่งนี้ลดลงอย่างมาก

#Create function to give n-step transition matrix for n = 1,...,N
#N is the last value of n
PROB <- function(N) { P <- matrix(c(1, 0, 0, 0, 0, 
                                    1/2, 0, 1/2, 0, 0, 
                                    0, 1/2, 0, 1/2, 0,
                                    0, 0, 1/2, 0, 1/2,
                                    1/2, 0, 0, 1/2, 0),
                                  nrow = 5, ncol = 5, 
                                  byrow = TRUE);
                      PPP <- array(0, dim = c(5,5,N));
                      PPP[,,1] <- P;
                      for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                      PPP }

#Calculate probabilities of reaching apple for n = 1,...,100
N  <- 100;
DF <- data.frame(Probability = PROB(N)[3,1,], Moves = 1:N);

#Plot probability of not having reached apple
library(ggplot2);
FIGURE <- ggplot(DF, aes(x = Moves, y = 1-Probability)) +
          geom_point() +
          scale_y_log10(breaks = scales::trans_breaks("log10", function(x) 10^x),
                        labels = scales::trans_format("log10", 
                                 scales::math_format(10^.x))) +
          ggtitle('Probability that worm has not reached apple') +
          xlab('Number of Moves') + ylab('Probability');
FIGURE;

#Calculate expected number of moves to get to apple
#Calculation truncates the infinite sum at N = 100
#We add one to represent the term for n = 0
EXP <- 1 + sum(1-DF$Probability);
EXP;

[1] 6

อย่างที่คุณเห็นจากการคำนวณนี้จำนวนการย้ายที่คาดหวังเพื่อไปยังแอปเปิ้ลคือหก การคำนวณนี้เป็นไปอย่างรวดเร็วมากโดยใช้รหัส vectorised ด้านบนสำหรับห่วงโซ่มาร์คอฟ

ป้อนคำอธิบายรูปภาพที่นี่


5

เพียงแค่ต้องการแสดงวิธีง่ายๆในการดูส่วน (a) โดยไม่ต้องผ่านรูทีนลูกโซ่มาร์คอฟทั้งหมด มีสองสถานะของอเมริกาที่ต้องกังวล: อยู่ห่างออกไปหนึ่งก้าวและอยู่ห่างออกไปสองก้าว (C และ D เหมือนกันในแง่ของขั้นตอนที่คาดไว้จนกว่าจะถึง A และ B และ E เหมือนกัน) ให้ " " แทนจำนวนขั้นตอนที่ใช้จากจุดยอดและอื่น ๆSBB

E(SC)=1+12[E(SB)+E(SD)]=1+12[E(SB)+E(SC)]

ในทำนองเดียวกันเขียนสมการสำหรับการคาดการณ์สำหรับ(S_B)E(SB)

แทนค่าที่สองลงในแรก (และเพื่อความสะดวกในการเขียนสำหรับ ) และคุณจะได้คำตอบสำหรับในสองสามบรรทัดcE(SC)c


3
+1 ฉันยังชอบว่าด้วยการเปลี่ยนความคาดหวังจากความน่าจะเป็นฟังก์ชั่นการสร้างที่คุณได้รับสมการที่คล้ายกันเพียงแค่การแก้ไขได้อย่างง่ายดายแสดงให้เห็นว่า PGF สำหรับรัฐเริ่มต้นเท่ากับและนำไปสู่การ สูตรง่ายๆสำหรับความน่าจะเป็นใด ๆ ดีกว่า: ให้เป็นจำนวนขั้นตอนเริ่มต้นที่กำหนดและความสัมพันธ์คือและการทดแทนส่วนหลังในผลตอบแทนเดิมสำหรับดังนั้นคือt2/(42tt2),Xyy{A,B}.fn=2nPr(XA=n)gn=2nPr(XB=n).fn=fn1+gn1gn1=fn2.fn=fn1+fn2n3.fnn2ndหมายเลขฟีโบนักชี
whuber

@whuber: คุณควรเปลี่ยนความคิดเห็นของคุณเป็นคำตอบแบบเต็ม - ดีจริงๆ
เบ็น - คืนสถานะโมนิก้า

1
ฉันเห็นด้วยมันคุ้มค่าการโพสต์เป็นคำตอบแม้ในรูปแบบสั้น ๆ นี้
Glen_b -Reinstate Monica

3

ปัญหา

ลูกโซ่มาร์คอฟนี้มีสามสถานะโดยแยกได้ว่าเวิร์มคือหรือเว้นวรรคจาก ปล่อยให้เป็นตัวแปรสุ่มที่ให้จำนวนขั้นตอนที่เวิร์มจะไปถึงจากสถานะฟังก์ชันสร้างความน่าจะเป็น ของพวกเขาเป็นวิธีพีชคณิตที่สะดวกในการเข้ารหัสความน่าจะเป็นของตัวแปรเหล่านี้ มันไม่จำเป็นต้องกังวลเกี่ยวกับปัญหาการวิเคราะห์เช่นลู่: เพียงแค่ดูพวกเขาเป็นชุดไฟอย่างเป็นทางการในสัญลักษณ์ที่กำหนดโดย0, 1,2C.XiCi{0,1,2}.t

fi(t)=Pr(Xi=0)+Pr(Xi=1)t1+Pr(Xi=2)t2++Pr(Xi=n)tn+

ตั้งแต่มันเป็นเรื่องเล็กน้อยที่ เราจำเป็นต้องค้นหาPr(X0=0)=1,f0(t)=1.f2.

การวิเคราะห์และการแก้ปัญหา

จากรัฐหนอนมีโอกาสที่เท่าเทียมกันของของย้ายกลับไปยังรัฐหรือถึงCการบัญชีสำหรับการทำหนึ่งขั้นตอนนี้จะเพิ่มให้กับพลังทั้งหมดของ , เท่ากับการคูณ pgf ด้วย , ให้1,1/22C1tt

f1=12t(f2+f0).

ในทำนองเดียวกันจากสถานะเวิร์มจะมีโอกาสเท่ากันในการอยู่ในสถานะหรือเข้าถึงสถานะดังนั้น221,

f2=12t(f2+f1).

การปรากฏตัวของแสดงให้เห็นว่างานของเราจะง่ายขึ้นโดยการแนะนำตัวแปรให้t/2x=t/2,

f1(x)=x(f2(x)+f0(x));f2(x)=x(f2(x)+f1(x)).

แทนเป็นครั้งแรกที่สองและนึกถึงจะช่วยให้f0=1

(*)f2(x)=x(f2(x)+x(f2(x)+1))

ซึ่งโซลูชันที่ไม่เหมือนใครคือ

(**)f2(x)=x21xx2.

ฉันเน้นสมการ เพื่อเน้นความเรียบง่ายพื้นฐานและความคล้ายคลึงกันอย่างเป็นทางการกับสมการที่เราจะได้รับโดยการวิเคราะห์เฉพาะค่าที่คาดหวังมีผลสำหรับปริมาณงานเดียวกันที่ใช้เพื่อค้นหาหมายเลขนี้ เราได้รับการแจกแจงทั้งหมด()E[Xi]:

ความหมายและการทำให้เข้าใจง่าย

เท่ากันเมื่อถูกเขียนออกมาเป็นระยะโดยเทอมและพลังของถูกจับคู่มันอ้างว่าสำหรับ()tn4,

2nPr(X2=n)=2n1Pr(X2=n1)+2n2Pr(X2=n2).

นี่คือการเกิดซ้ำของลำดับฟีโบนักชีที่มีชื่อเสียง

(Fn)=(1,1,2,3,5,8,13,21,34,55,89,144,)

(จัดทำดัชนีจาก ) การจับคู่โซลูชันคือลำดับนี้เลื่อนโดยสองตำแหน่ง (เนื่องจากไม่มีความน่าจะเป็นที่หรือและง่ายต่อการตรวจสอบว่า )n=0()X2=0X2=122Pr(X2=2)=1=23Pr(X2=3)

ดังนั้น

Pr(X2=n)=2n2Fn2.

โดยเฉพาะอย่างยิ่ง,

f2(t)=22F0t2+23F1t3+24F2t4+=14t2+18t3+216t4+332t5+564t6+8128t7+13256t8+.

ความคาดหวังของพบได้อย่างง่ายดายโดยการประเมินอนุพันธ์แทนเพราะ (ความแตกต่างของอำนาจของระยะโดยระยะ) นี้จะช่วยให้สูตรX2ft=1,t

f(1)=Pr(X2=0)(0)+Pr(X2=1)(1)10++Pr(X2=n)(n)1n1+

ซึ่งเป็นผลรวมของความน่าจะเป็นคูณด้วยค่าของนั่นคือนิยามของอย่างแม่นยำ การหาอนุพันธ์โดยใช้สร้างสูตรอย่างง่ายสำหรับการคาดการณ์X2,E[X2].()


ความเห็นสั้น ๆ

โดยการขยายเป็นเศษส่วนบางส่วนสามารถเขียนเป็นผลรวมของอนุกรมเรขาคณิตสองชุด นี่แสดงให้เห็นน่าจะเป็นจะลดลงอย่างรวดเร็ว นอกจากนี้ยังให้รูปแบบปิดสำหรับความน่าจะเป็นหาง การใช้สิ่งนั้นเราสามารถคำนวณได้อย่างรวดเร็วว่าน้อยกว่า()f2Pr(X2=n)Pr(X2>n).Pr(X2100)109.

ในที่สุดสูตรเหล่านี้เกี่ยวข้องกับอัตราส่วนทองคำ หมายเลขนี้คือความยาวของคอร์ดรูปห้าเหลี่ยมปกติ (ของหน่วยด้านข้าง) ซึ่งให้การเชื่อมต่อที่น่าประทับใจระหว่างห่วงโซ่มาร์คอฟแบบ combinatorial อย่างหมดจดบนรูปห้าเหลี่ยม (ซึ่ง "ไม่รู้" เกี่ยวกับเรขาคณิตแบบยุคลิด) และเรขาคณิตของรูปห้าเหลี่ยมปกติ ระนาบแบบยุคลิดϕ=(1+5)/2.


1

สำหรับจำนวนวันเฉลี่ยจนถึงอาหารเย็นให้ระบุเงื่อนไขตามขั้นตอนในวันแรก ให้เป็นจำนวนวันจนกว่าหนอนจะได้รับแอปเปิ้ล ให้เป็นก้าวแรกXF

ถ้าอย่างนั้นเราก็มี

E[X]=E[X|F=B] [P(F=B)]+E[X|F=D] P[F=D]

หากขั้นตอนแรกคือถึงเวิร์มได้รับแอปเปิลในวันที่ 2 โดยมีความน่าจะเป็นครึ่งเดียวหรือกลับไปที่จุดยอดมีความน่าจะเป็นครึ่งหนึ่งและเริ่มต้นใหม่ เราสามารถเขียนสิ่งนี้เป็นB,C

E[X|F=B]=2(12)+(2+E[X])(12)=2+E[X]2

หากขั้นตอนแรกคือจากนั้นโดยสมมาตรนี่จะเหมือนกับอยู่ที่จุดยอดยกเว้นเวิร์มได้ดำเนินการในขั้นตอนเดียวดังนั้นD,C

E[X|F=D]=1+E[X]

เรารวบรวมทุกอย่างเข้าด้วยกัน

E[X]=(2+E[X]2)(12)+(1+E[X])(12)

การแก้หาให้ผลตอบแทนE[X]

E[X]=6

1
ดูเหมือนว่าจะสรุปคำตอบของ @ Glen_b
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.