เมื่อพิจารณาจากโซ่มาร์คอฟสองอันที่ดูดซับได้ความน่าจะเป็นที่จะสิ้นสุดก่อนที่อื่นจะเป็นเท่าไหร่


9

ฉันมีโซ่มาร์คอฟที่แตกต่างกันสองโซ่แต่ละอันมีสถานะการดูดซับที่หนึ่งและตำแหน่งเริ่มต้นที่รู้จัก ฉันต้องการกำหนดความน่าจะเป็นที่เชน 1 จะถึงสถานะดูดซับในขั้นตอนน้อยกว่าเชน 2

ฉันคิดว่าฉันสามารถคำนวณความน่าจะเป็นในการเข้าถึงสถานะการดูดซับในห่วงโซ่หนึ่งหลังจากขั้นตอน n: เนื่องจากเมทริกซ์การเปลี่ยนแปลงความน่าจะเป็นที่จะถูกดูดซึมหลังจากขั้นตอนคือโดยที่คือสถานะเริ่มต้นและคือ รัฐดูดซับPnPijnij

ฉันไม่แน่ใจว่าจะไปจากที่นี่ ปัญหาที่คล้ายคลึงกันที่ฉันเคยเห็นเกี่ยวข้องกับลูกเต๋า (เช่นการหมุนผลรวมของ 7 ก่อนผลรวมของ 8) แต่นั่นง่ายกว่าที่จะแก้เพราะความน่าจะเป็นในการกลิ้งผลรวมนั้นคงที่และไม่ขึ้นกับจำนวนขั้นตอนที่ดำเนินการ

คำตอบ:


13

ใช้โซ่ในแบบคู่ขนาน กำหนดสามสถานะการดูดซับในห่วงโซ่ผลิตภัณฑ์ที่ได้:

  1. ห่วงโซ่แรกมาถึงสถานะที่น่าสนใจ แต่ที่สองไม่ได้

  2. ห่วงโซ่ที่สองถึงสถานะที่น่าสนใจ แต่ครั้งแรกไม่ได้

  3. โซ่ทั้งสองพร้อมกันถึงสถานะที่น่าสนใจ

ความน่าจะเป็นที่ จำกัด ของทั้งสามสถานะในห่วงโซ่ผลิตภัณฑ์ให้โอกาสในการสนใจ


การแก้ปัญหานี้เกี่ยวข้องกับการก่อสร้าง (ง่าย) บางส่วน ในฐานะที่เป็นคำถามที่ให้เป็นเมทริกซ์การเปลี่ยนแปลงสำหรับห่วงโซ่P เมื่อห่วงโซ่อยู่ในสถานะที่ ,ให้ความน่าจะเป็นของการเปลี่ยนแปลงไปยังรัฐเจรัฐดูดซับทำให้การเปลี่ยนแปลงตัวเองด้วยความน่าจะเป็นที่ 1P=Pij,1i,jnPiPijj1

  1. รัฐใด ๆ ที่สามารถทำให้น่าสนใจเมื่อเปลี่ยนแถวโดยเวกเตอร์ตัวบ่งชี้กับในฐานะที่ฉันiPi=(Pij,j=1,2,,n)(0,0,,0,1,0,,0)1i
  2. ใด ๆ ชุดการดูดซับรัฐสามารถรวมโดยการสร้างห่วงโซ่ใหม่ที่มีรัฐเป็น\} เมทริกซ์การเปลี่ยนแปลงได้รับจากAP/A{i|iA}{A}

    (P/A)ij={PijiA,jAkAPikiA,j=A0i=A,jA1i=j=A.

    จำนวนนี้จะรวมคอลัมน์ของสอดคล้องกับและแทนที่แถวนั้นให้สอดคล้องกับด้วยแถวเดียวที่ทำให้เกิดการเปลี่ยนแปลงในตัวเองPAA

  3. สินค้าของสองโซ่ในรัฐและในรัฐกับการเปลี่ยนแปลงการฝึกอบรมและตามลำดับเป็นห่วงโซ่มาร์คอฟในรัฐด้วยเมทริกซ์การเปลี่ยนแปลงPSPQSQPQSP×SQ={(p,q)|pSP,qSQ}

    (PQ)(i,j),(k,l)=PikQjl.

    ห่วงโซ่ผลิตภัณฑ์จะเรียกใช้สองโซ่ขนานกันแยกกันติดตามว่าแต่ละตำแหน่งนั้นอยู่ที่ใดและทำให้ช่วงการเปลี่ยนภาพเป็นอิสระ


ตัวอย่างง่ายๆอาจอธิบายสิ่งปลูกสร้างเหล่านี้ สมมติว่าพอลลี่จะพลิกเหรียญที่มีโอกาสของหัวเชื่อมโยงไปถึง เธอวางแผนที่จะทำเช่นนั้นจนกระทั่งสังเกตหัว สถานะของกระบวนการพลิกเหรียญคือแสดงผลลัพธ์ของการพลิกครั้งล่าสุด:สำหรับก้อย,สำหรับหัว เมื่อวางแผนที่จะหยุดที่หัวพอลลี่จะใช้สิ่งก่อสร้างแรกโดยทำให้เป็นสถานะที่น่าสนใจ เมทริกซ์การเปลี่ยนแปลงที่เกิดขึ้นคือpSP={T,H}THH

P=(1pp01).

มันเริ่มต้นในสถานะสุ่มกำหนดโดยการโยนครั้งแรก(1p,p)

ทันเวลากับพอลลี่ควินซีจะโยนเหรียญที่ยุติธรรม เขาวางแผนที่จะหยุดเมื่อเขาเห็นหัวสองหัวติดต่อกัน ลูกโซ่มาร์คอฟของเขาจึงต้องติดตามผลลัพธ์ก่อนหน้าเช่นเดียวกับผลลัพธ์ปัจจุบัน มีการรวมกันสองชุดของสองหัวและสองก้อยซึ่งฉันจะย่อว่า " " ตัวอย่างเช่นที่ตัวอักษรตัวแรกคือผลลัพธ์ก่อนหน้าและตัวอักษรตัวที่สองคือผลลัพธ์ปัจจุบัน Quincy ใช้โครงสร้าง (1) เพื่อทำให้เป็นสถานะที่น่าสนใจ หลังจากทำเช่นนั้นเขาตระหนักว่าเขาไม่ต้องการสี่สถานะจริง ๆ : เขาสามารถทำให้ห่วงโซ่ของเขาง่ายขึ้นเป็นสามสถานะ:หมายถึงผลลัพธ์ในปัจจุบันคือก้อยหมายถึงผลลัพธ์ในปัจจุบันเป็นหัวและTHHHTHXหมายถึงผลลัพธ์สองรายการสุดท้ายเป็นทั้งสองหัว - นี่คือสถานะที่น่าสนใจ เมทริกซ์การเปลี่ยนแปลงคือ

Q=(1212012012001).

ห่วงโซ่ผลิตภัณฑ์ทำงานในหกสถานะ:X) เมทริกซ์การเปลี่ยนแปลงเป็นผลิตภัณฑ์เทนเซอร์ของและและคำนวณได้ง่าย ตัวอย่างเช่นเป็นโอกาสที่พอลลี่เปลี่ยนจากเป็นและที่ ในเวลาเดียวกัน (และเป็นอิสระ), ควินซีทำให้การเปลี่ยนแปลงจากเพื่อHอดีตมีโอกาสของและโอกาสหลังของ1/2เนื่องจากโซ่มีการทำงานอย่างอิสระโอกาสเหล่านั้นทวีคูณให้(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ(PQ)(T,T),(T,H)TTTH1p1/2(1p)/2 2 เมทริกซ์การเปลี่ยนแปลงแบบเต็มคือ

PQ=(1p21p20p2p201p201p2p20p2001p00p0001212000012012000001).

It is in block matrix form with blocks corresponding to the second matrix Q:

PQ=(P11QP12QP21QP22Q)=((1p)QpQ0Q).

Polly and Quincy compete to see who will achieve their goal first. The winner will be Polly whenever a transition is first made to (H,*) where * is not X; the winner will be Quincy whenever a transition is first made to (T,X); and if before either of those can happen a transition is made to (H,X), the result will be a draw. To keep track, we will make the states (H,T) and (H,H) both absorbing (via construction (1)) and then merge them (via construction (2)). The resulting transition matrix, ordered by the states (T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) is

R=(1p21p20p01p201p2p2p2001000001000001).

The results of the simultaneous first throw by Polly and Quincy will be the states (T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) with probabilities μ=((1p)/2,(1p)/2,0,p,0), respectively: this is the initial state at which to start the chain.

In the limit as n,

μRn11+4pp2(0,0,(1p)2,p(5p),p(1p)).

Thus the relative chances of the three absorbing states (T,X),{(H,T),(H,H)},(H,X) (representing Quincy wins, Polly wins, they draw) are (1p)2:p(5p):p(1p).

Figure

As a function of p (the chance that any one of Polly's throws will be heads), the red curve plots Polly's chance of winning, the blue curve plots Quincy's chance of winning, and the gold curve plots the chance of a draw.


1
Very neat example, thanks for this. I'm still working out the details to see them for myself. Just a question: here we assumed the two events (Polly and Quincy throws) were happening simultaneously, how much of a difference would it make if we made them sequential, or even chose at random each time who'd throw next?
user929304

1
@user929304 You would get different answers, possibly substantially so. For instance, suppose P and Q are running a chain in which the states are partitioned into subsets A and B where all transitions from A go to B and all from B go to A. Let P and Q both start at states in A. In the product chain they both simultaneously alternate between A and B, but the sequential and random-choice chains break that invariant pattern.
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.