โซ่มาร์คอฟคืออะไร?


9

ขณะนี้ฉันกำลังอ่านบทความเกี่ยวกับก้อนลูกโซ่มาร์คอฟและฉันไม่สามารถเห็นความแตกต่างระหว่างลูกโซ่มาร์คอฟและกราฟถ่วงน้ำหนักแบบกำกับ

ตัวอย่างเช่นในบทความการหาพื้นที่รัฐที่เหมาะสมที่สุดในเครือมาร์คอฟพวกเขาให้คำจำกัดความต่อไปนี้ของ CTMC (ห่วงโซ่มาร์คอฟเวลาต่อเนื่อง):

เราพิจารณา CTMC ที่ จำกัด (S,Q) กับพื้นที่ของรัฐ S={x1,x2,,xn} โดยเมทริกซ์อัตราการเปลี่ยนแปลง Q:S×SR+.

พวกเขาไม่ได้พูดถึงคุณสมบัติมาร์คอฟเลยและในความเป็นจริงถ้าน้ำหนักบนขอบแสดงถึงความน่าจะเป็นฉันเชื่อว่าคุณสมบัติมาร์คอฟถือเป็นเรื่องเล็กน้อยเนื่องจากความน่าจะเป็นขึ้นอยู่กับสถานะปัจจุบันของโซ่เท่านั้นและไม่ใช่เส้นทางที่นำไปสู่ เพื่อมัน

ในบทความอื่น ๆเกี่ยวกับคุณสมบัติเชิงสัมพันธ์ของโซ่ของความสามารถมาร์คอฟLumpabilityถูกกำหนดในทำนองเดียวกัน:

ห่วงโซ่มาร์คอฟ M จะแสดงเป็น triplet (S,P,π) ที่ไหน S เป็นชุด จำกัด ของรัฐของ M, P เมทริกซ์ความน่าจะเป็นช่วงการเปลี่ยนภาพแสดงความน่าจะเป็นที่จะได้รับจากสถานะหนึ่งไปอีกสถานะหนึ่งและ π คือการแจกแจงความน่าจะเป็นเบื้องต้นที่แสดงถึงโอกาสที่ระบบจะเริ่มในสถานะที่แน่นอน

อีกครั้งไม่พูดถึงอดีตหรืออนาคตหรือความเป็นอิสระ

มีกระดาษแผ่นที่สามSimple O (m logn) Time Markov Chain ก้อนที่พวกเขาไม่เพียง แต่ไม่เคยระบุว่าน้ำหนักบนขอบเป็นความน่าจะเป็น แต่พวกเขายังพูดว่า:

ในหลายแอพพลิเคชั่นค่านิยม W(s,s)ไม่เป็นลบ อย่างไรก็ตามเราไม่ได้ตั้งสมมติฐานนี้เนื่องจากมีแอปพลิเคชันอยู่ด้วยW(s,s) ถูกเลือกโดยเจตนาว่าเป็น W(s,S{s})ทำให้มักเป็นลบ

ยิ่งไปกว่านั้นมีการระบุว่าการจับก้อนก้อนควรเป็นวิธีในการลดจำนวนรัฐในขณะที่ยังคงคุณสมบัติของมาร์คอฟ (โดยการรวมสถานะ "เทียบเท่า" เข้าสู่สถานะที่ใหญ่กว่า) ถึงกระนั้นสำหรับฉันแล้วดูเหมือนว่ามันเป็นเพียงการสรุปความน่าจะเป็นและไม่ควรรับประกันว่าผลลัพธ์ที่เป็นไปได้ของการเปลี่ยนเป็น / จากสถานะรวมจะอยู่ในช่วง[0,1]. ก้อนที่เก็บรักษาไว้จริงๆแล้วคืออะไร?

ดังนั้นมีความเป็นไปได้สองอย่างที่ฉันเห็นคือ:

  • ฉันไม่เข้าใจว่าห่วงโซ่มาร์คอฟคืออะไรหรือ
  • การใช้คำว่ามาร์คอฟเชนในเอกสารเหล่านั้นเป็นการหลอกลวง

มีคนอธิบายสถานการณ์ได้ไหม

ดูเหมือนว่ามีชุมชนที่แตกต่างกันโดยใช้คำนั้นและพวกเขาหมายถึงสิ่งที่แตกต่างกันอย่างกว้างขวาง จากบทความทั้ง 3 ที่ฉันพิจารณาแล้วดูเหมือนว่าคุณสมบัติของมาร์คอฟนั้นไม่สำคัญหรือไร้ประโยชน์ในขณะที่ดูเอกสารประเภทอื่นที่ดูเหมือนพื้นฐาน


มีตำราและแหล่งข้อมูลมากมายบนอินเทอร์เน็ตที่อธิบาย (a) สิ่งที่เชนมาร์คอฟคือ (b) นิยามทางคณิตศาสตร์ที่แม่นยำคืออะไร เราคาดหวังให้คุณทำการวิจัยจำนวนมากและศึกษาด้วยตนเองก่อนถาม ดังนั้นคุณได้ปรึกษาทรัพยากรเหล่านั้นหรือไม่? คุณพบอะไรที่นั่น ป.ล. ฉันเดาว่าเอกสารในวรรณคดีจะถือว่าคุณรู้ว่านิยามของลูกโซ่มาร์คอฟและประโยคเหล่านั้นไม่จำเป็นต้องมีจุดมุ่งหมายที่ชัดเจนสำหรับนิยามลูกโซ่มาร์คอฟ แต่เป็นการสร้างสัญลักษณ์ที่ใช้เมื่อพูด ประมาณหนึ่ง
DW

อดีตหรืออนาคตหรือความเป็นอิสระเป็นคุณสมบัติที่ตามมา ควรมีข้อ จำกัด บางประการเกี่ยวกับน้ำหนัก บางทีบางสิ่งอาจอยู่โดยปริยายเช่นการกำหนดน้ำหนักขาออกที่หายไปให้กับขอบที่นำไปสู่สถานะ sink (เปรียบเทียบคำจำกัดความ DFA ที่แตกต่างกัน)
Raphael

4
@DW ใช่ฉันทำ สิ่งที่ฉันพบคือความคิดของห่วงโซ่มาร์คอฟในตำราเรียนดูเหมือนจะไม่มีส่วนเกี่ยวข้องกับแนวคิดที่ใช้ในเอกสารดังกล่าว นี่คือเหตุผลที่ฉันถามสิ่งนี้
Bakuriu

4
มีความเป็นไปได้ที่สามอีกครั้ง ฉันคิดว่าความผิดพลาดที่คุณกำลังทำคือการตีความคำแถลงการณ์ในเอกสารเหล่านั้นเป็นคำจำกัดความของลูกโซ่มาร์คอฟ ฉันเดาว่านั่นอาจไม่ใช่เจตนาของข้อความเหล่านั้น ฉันเดาว่าผู้เขียนคิดว่าคุณคุ้นเคยกับคำนิยามของห่วงโซ่มาร์คอฟแล้วและกำลังพยายามสร้างสัญกรณ์ (มีสัญกรณ์หลายแบบที่คุณสามารถใช้สำหรับแนวคิดเดียวกัน) ดังนั้นลองมองจากมุมมองนั้นอีกครั้งและดูว่าคุณพบสิ่งใดที่ขัดแย้งกับมันในเอกสาร (หากคุณพบสิ่งใดให้เพิ่มเข้าไปในคำถาม)
DW

4
@DW ดูเหมือนว่า OP ได้ทำการวิจัยที่ดีและจัดโครงสร้างคำถามของเขาให้เป็นที่ยอมรับ ใช่เราสามารถใช้ google เพื่อเรียนรู้ แต่คุณสังเกตเห็นว่าเว็บไซต์ SE ที่มีการจัดอันดับสูงใน google หรือไม่ เพราะเรารวมข้อมูลเป็นคำถามเดียวที่กำหนดชัดเจน ความพยายามในการทำงานร่วมกันของชุมชนของเราสร้างเนื้อหาที่มีคุณค่าและหลากหลายซึ่งหลายครั้งมีประโยชน์มากกว่าหน้าเว็บและหน้าข้อมูลที่มีอยู่ทำให้การเรียนรู้มีประสิทธิภาพมากขึ้น
BAR

คำตอบ:


10

อย่างต่อเนื่องเวลา Markov Chainสามารถแสดงเป็นกราฟกำกับที่มีน้ำหนักขอบที่ไม่ใช่เชิงลบอย่างต่อเนื่อง การแทนค่าเท่ากับน้ำหนักขอบคงที่ของกราฟกำกับด้วยN โหนดเป็น N×Nมดลูก มาร์คอฟอสังหาริมทรัพย์ (ที่รัฐอนาคตขึ้นอยู่เฉพาะในสถานะปัจจุบัน) เป็นนัยในน้ำหนักขอบคงที่ (หรือรายการอย่างต่อเนื่องในเมทริกซ์) โดยปริยายหมายโดยนัย นักคณิตศาสตร์ใช้มันเป็นความหมายที่ไพเราะ "คุณควรพิสูจน์ด้วยตัวคุณเอง"

แต่กระดาษแผ่นแรกกำหนดสัญกรณ์ที่สอดคล้องกับห่วงโซ่มาร์คอฟต่อเนื่องบางครั้งเรียกว่ากระบวนการมาร์คอฟในขณะที่กระดาษแผ่นที่สองกำหนดสัญกรณ์ที่สอดคล้องกับโซ่มาร์คอฟแบบไม่ต่อเนื่อง พวกเขาพูดว่า

Pเป็นเมทริกซ์ความน่าจะเป็นการเปลี่ยนแปลงที่แสดงถึงความน่าจะเป็นที่จะได้รับจากสถานะหนึ่งไปสู่อีกสถานะหนึ่งและπคือการแจกแจงความน่าจะเป็นเบื้องต้นที่แสดงถึงความเป็นไปได้ที่ระบบจะเริ่มต้นในสถานะที่แน่นอน [เน้นเพิ่ม]

พวกเขากำลังสันนิษฐานว่าเมทริกซ์คงที่ตลอดเวลา (เช่นนี้หมายถึงคุณสมบัติมาร์คอฟ) ความน่าจะเป็นในระยะโดยนัยคือความจริงที่ว่าค่าคงที่แต่ละค่าอยู่ในช่วง[0,1]ว่ารายการในทุกคอลัมน์ของ P รวมเป็น 1และนั่นคือผลรวมของรายการใน π รวมเป็น 1.

ฉันอ่านกระดาษแผ่นที่สามไม่ได้ หากรายการในทุกคอลัมน์ของเมทริกซ์จำเป็นต้องรวมกับ 1 ดังนั้นความน่าจะเป็นและพวกเขากำลังพูดถึงโซ่มาร์คอฟแบบไม่ต่อเนื่อง หากรายการในทุกคอลัมน์สามารถรวมกับจำนวนโดยพลการรายการจะแสดงอัตราที่ไม่น่าจะเป็นและพวกเขากำลังพูดถึงเครือมาร์คอฟแบบต่อเนื่อง

อย่างต่อเนื่องเวลามาร์คอฟโซ่ไม่ได้เช่นเดียวกับการแยกเวลาโซ่มาร์คอฟ ในความต่อเนื่องเวลา Markov Chain น้ำหนักขอบไม่ได้เป็นตัวแทนความน่าจะเป็น แต่อัตราการเปลี่ยนแปลง น้ำหนักของขอบต้องไม่เป็นลบ แต่สามารถมีขนาดใหญ่โดยพลการและน้ำหนักของขอบนอกสามารถรวมกับจำนวนที่ไม่เป็นลบได้ ผลรวมไม่จำเป็นต้องเป็น1.

ด้วย Markov Chains ทั้งแบบต่อเนื่องและแบบไม่ต่อเนื่องคุณสมบัติมาร์คอฟจะบอกเป็นนัยโดยน้ำหนักขอบคงที่ (หรือรายการคงที่ในเมทริกซ์ช่วงการเปลี่ยนภาพ)


8

มาร์คอฟเชนมีสองรสชาติ: เวลาต่อเนื่องและเวลาไม่ต่อเนื่อง

ทั้งโซ่มาร์คอฟเวลาอย่างต่อเนื่อง (CTMC) และโซ่มาร์คอฟเวลาแบบไม่ต่อเนื่อง (DTMC) จะแสดงเป็นกราฟถ่วงน้ำหนักกำกับ

สำหรับ DTMC การเปลี่ยนภาพจะใช้เวลา "หนึ่งหน่วย" เสมอ ดังนั้นจึงไม่มีทางเลือกว่าน้ำหนักของคุณในอาร์คควรเป็นเท่าไหร่ - คุณใส่ความน่าจะเป็นที่จะไปที่ "เจ" เนื่องจากคุณอยู่ที่ "i"

สำหรับ CTMC's ช่วงเวลาการเปลี่ยนภาพระหว่างสองสถานะจำเป็นต้องได้รับจากตัวแปรสุ่มแบบเอ็กซ์โปเนนเชียล นี่คือความแตกต่างที่สำคัญระหว่าง CTMC และ DTMC: DTMC มีเวลาเปลี่ยนหน่วยเสมอ CTMC มีเวลาการเปลี่ยนแปลงแบบสุ่ม

สำหรับ CTMC โดยทั่วไปแล้วการประชุมจะวางน้ำหนักลงบนส่วนโค้งตามอัตราของตัวแปรสุ่มแบบเอ็กซ์โพเนนเชียลจากแหล่งต้นทางไปยังปลายทาง นั่นคือ - การประชุมคือการวางอัตราในส่วนโค้งไม่ใช่ความน่าจะเป็น

อัตราลบ

แม้ว่า CTMC ทั้งหมดที่ฉันจำได้จะแสดงด้วยอัตราบวกบนขอบ แต่อัตราเชิงลบจะเกิดขึ้นในการวิเคราะห์ CTMC

สมมติว่าเรากำลังยืนอยู่ที่สถานะ A ซึ่งเชื่อมต่อกับ B, C และ D ดังนี้

A -> B (อัตราการเข้าสู่ A จาก B เป็นลบ) A -> C (อัตราการเข้าสู่ A จาก C เป็นลบ) D -> A (อัตราการเข้าสู่ A จาก D เป็นค่าบวก)

นี่อาจไม่ใช่สิ่งที่กระดาษของคุณอ้างถึง ฉันนำมาใช้เพื่อแสดงว่าน้ำหนักเชิงลบไม่จำเป็นต้องไร้สาระถ้ามีคนทำงานกับการประชุมที่เหมาะสม

มาร์คอฟคุณสมบัติ

สำหรับ DTMC's- คุณพูดถูก ทรัพย์สินมาร์คอฟมีความพึงพอใจเล็กน้อย สำหรับ CTMC นั้นคุณสมบัติมาร์คอฟนั้นเป็นที่น่าพอใจเพราะช่วงการเปลี่ยนภาพจะได้รับจากตัวแปรสุ่มแบบเอ็กซ์โปเนนเชียล (ซึ่งเป็น "memoryless") ถ้าช่วงการเปลี่ยนภาพไม่ได้รับจากตัวแปรสุ่มแบบเอ็กซ์โพเนนเชียล (พูดแทนพวกมันเหมือนกัน) เราจะพูดถึง "Semi-Markov Chains" หรือ "Semi-Markov Processes"


ขอบคุณสำหรับการชี้แจงเกี่ยวกับเลขชี้กำลังไม่มีหน่วยความจำ มันสมเหตุสมผลแล้ว ฉันตรวจสอบบทความที่สองเป็นครั้งที่สองและพวกเขาบอกอย่างชัดเจนว่าพวกเขาไม่คิดว่าน้ำหนักจะไม่เป็นลบเพราะมีคำจำกัดความเฉพาะของW(s,s) (อัตราของรัฐเป็นของตัวเอง) ซึ่งมักจะถูกกำหนดให้เป็น W(s,S{s}) (เช่นลบผลรวมของอัตราของ sไปยังรัฐอื่น ๆ ทั้งหมด) ซึ่งทำให้เป็นลบเสมอ
Bakuriu

กระดาษสุดท้ายค่อนข้างลึกลับสำหรับฉันเพราะพวกเขาไม่ได้ใช้คำศัพท์ลูกโซ่ของมาร์คอฟผ่านกระดาษส่วนใหญ่ เป็นไปได้ว่าพวกเขาแก้ปัญหาทั่วไปได้มากกว่าแม้ว่าแรงจูงใจคือโซ่มาร์คอฟ ที่กล่าวว่าW(s,s)=W(s,S{s})สอดคล้องกับการทำงานกับผู้ประกอบการ Laplace (หรือมากกว่าการปฏิเสธ ... ด้วยเหตุผลบางอย่าง)
Sasho Nikolov
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.