Markov chains เทียบกับ HMM


11

ลูกโซ่มาร์คอฟมีเหตุผลสำหรับฉันฉันสามารถใช้มันเพื่อจำลองการเปลี่ยนแปลงสถานะความน่าจะเป็นในปัญหาชีวิตจริง จากนั้น HMM ก็มาถึง HMM ได้รับการกล่าวถึงว่าเหมาะสมกับโมเดลปัญหามากกว่า MCs อย่างไรก็ตามปัญหาที่คนพูดถึงค่อนข้างซับซ้อนที่จะเข้าใจเช่นการพูด ดังนั้นคำถามของฉันคือคุณสามารถอธิบายปัญหา "จริงและเรียบง่าย" สำหรับ HMM ใดที่เหมาะสมกว่า MC และอธิบายว่าทำไม ขอบคุณ

คำตอบ:


19

การรู้จำเสียงไม่ซับซ้อนอย่างที่คุณคิด

ขั้นแรกให้จินตนาการถึงการสร้าง Markov Chain (MC) ที่รับรู้ข้อความ โปรแกรมของคุณอ่านข้อความ (สมบูรณ์แบบไม่มีข้อผิดพลาด) และคำนวณสถานะ (คำ) และการเปลี่ยนแปลงสถานะ (คำถัดไป) ดูเหมือนว่าคุณจะทำสิ่งนี้ลง ตอนนี้คุณสามารถสร้างข้อความหรือให้ข้อความคาดเดาคำถัดไปโดยใช้สถานะและการเปลี่ยนแปลงความน่าจะเป็นของ MC ของคุณ

ตอนนี้คิดว่าคุณต้องการใช้ MC ของคุณด้วยคำพูด คุณจะให้คนอ่านข้อความที่คล้ายกับ MC ของคุณและคุณตั้งค่าใช่มั้ย ดี ... ยกเว้นว่าพวกเขาจะออกเสียงคำที่แตกต่าง: ที่ข้อความเขียนว่า "มันฝรั่ง" คุณจะได้ยิน "po-TAY-toh" และ "po-TAH-toh" และ "pu-TAY" - ถึง "ฯลฯ และในทางกลับกัน: ข้อความ" กิน "และ" แปด "แสดงถึงสองสถานะที่แตกต่างกัน แต่มี (โดยปกติ) ออกเสียงเหมือนกัน

อัลกอริทึมของคุณไม่เห็นสถานะ (คำ) พื้นฐานอีกต่อไป แต่จะเห็นการกระจายความน่าจะเป็นของการออกเสียงสำหรับแต่ละคำ MC ต้นฉบับของคุณถูกซ่อนอยู่หลังการออกเสียงและตอนนี้แบบจำลองของคุณต้องมีสองชั้น

ดังนั้นคุณสามารถให้ผู้คนมากมายอ่านออกเสียงข้อความที่คุณใช้สำหรับการฝึกอบรมดั้งเดิมของคุณคุณจะได้รับการแจกแจงการออกเสียงสำหรับแต่ละคำแล้วรวมโมเดลเดิมของคุณเข้ากับโมเดลการออกเสียงและคุณมีโมเดลมาร์คอฟที่ซ่อนอยู่ ( HMM)

ปัญหาในโลกแห่งความเป็นจริงส่วนใหญ่จะเป็นเช่นนี้เนื่องจากโลกแห่งความจริงมีแนวโน้มที่จะมีเสียงดัง คุณจะไม่ทราบว่ามีบางสิ่งในสถานะแทนคุณจะได้รับตัวบ่งชี้ที่หลากหลายสำหรับแต่ละรัฐ: บางครั้งตัวบ่งชี้เดียวกันสำหรับสถานะที่แตกต่างกัน ("กิน" และ "แปด") และตัวบ่งชี้ที่แตกต่างกันสำหรับรัฐเดียวกัน ("pu-TAY-toe" และ "pah-tah-TOE") ดังนั้น HMM จึงเหมาะสำหรับปัญหาในโลกแห่งความเป็นจริงมากขึ้น

[หมายเหตุสองด้าน: 1) การรู้จำเสียงที่เกิดขึ้นจริงทำงานได้ในระดับเสียงไม่ใช่ระดับคำและ 2) ฉันเชื่อว่า HMM เป็นราชาแห่งเนินเขาสำหรับการรู้จำเสียง แต่เพิ่งได้รับการลดทอนจากเครือข่ายประสาทลึก]


6

โดยพื้นฐานแล้ว HMM เป็นแบบจำลองของมาร์คอฟซึ่งรัฐไม่สามารถสังเกตได้อย่างสมบูรณ์ แต่เป็นการสังเกตเพียงทางอ้อมผ่านการสังเกตที่มีเสียงดัง ส่วนแบบจำลองของมาร์คอฟเป็นวิธีที่ง่ายในการกำหนดการพึ่งพาทางโลกในรัฐ ตามลําดับปัญหาที่ HMM มีประโยชน์คือปัญหาที่สถานะเป็นไปตามโมเดลของมาร์คอฟ แต่คุณไม่ได้สังเกตสถานะนั้นโดยตรง

มีหลายสิ่งที่คุณสามารถทำได้ด้วย HMM สิ่งหนึ่งที่มีประโยชน์ที่คุณสามารถทำได้มีดังต่อไปนี้ - จากชุดของการสังเกตที่มีเสียงดังจนถึงปัจจุบันบางทีคุณอยากรู้ว่าสถานะปัจจุบันของระบบที่เป็นไปได้มากที่สุดคืออะไร ในการทำเช่นนี้คุณจะรวมโครงสร้างลูกโซ่มาร์คอฟเข้ากับการสำรวจเพื่อสรุปสถานะอย่างเหมาะสม ในทำนองเดียวกันคุณสามารถขยายสิ่งนี้เพื่ออนุมานลำดับทั้งหมดของรัฐจากลำดับการสังเกต ( นี่คือมาตรฐาน)

ในวิทยาศาสตร์และวิศวกรรมรุ่นนี้มีการใช้งานตลอดเวลา ตัวอย่างเช่นบางทีคุณกำลังบันทึกวิดีโอสัตว์ง่าย ๆ เช่นc elegans(เวิร์ม) และมีสถานะพฤติกรรมไม่ต่อเนื่องจำนวนเล็กน้อยเท่านั้น จากวิดีโอคุณต้องการติดป้ายกำกับแต่ละเฟรมด้วยสถานะพฤติกรรมของสัตว์ จากเฟรมเดียวอัลกอริทึมการติดฉลากมีข้อผิดพลาด / เสียงรบกวน อย่างไรก็ตามยังมีการพึ่งพาชั่วคราวที่คุณสามารถสร้างแบบจำลองด้วยห่วงโซ่มาร์คอฟ ... หากอยู่ในกรอบเดียวสัตว์อยู่ในสถานะเดียวก็มีแนวโน้มที่จะอยู่ในสถานะเดียวกันสำหรับเฟรมถัดไป (และบางรัฐอาจอนุญาตให้เปลี่ยนผ่านเท่านั้น บางรัฐอื่น ๆ ) โดยพื้นฐานแล้วโดยการรวมการสังเกตการณ์แบบเฟรมเดียวที่มีเสียงดังกับโครงสร้างของการเปลี่ยนภาพ (โดย HMM) คุณจะได้รับลำดับการประมาณสถานะที่ราบรื่นและดีขึ้นกว่าเดิม


2

HMM เป็นแบบผสม เช่นเดียวกับส่วนผสมของเกาส์รุ่น เหตุผลที่เราใช้นอกเหนือจากเครือมาร์คอฟคือมันซับซ้อนกว่าในการจับรูปแบบของข้อมูล

คล้ายกับถ้าเราใช้ Gaussian เดียวเพื่อสร้างแบบจำลองตัวแปร contentious หรือเราใช้ส่วนผสมของ Gaussian เพื่อสร้างแบบจำลองตัวแปรต่อเนื่อง

ฉันจะใช้ตัวแปรต่อเนื่องเพื่อสาธิตแนวคิดนี้: สมมติว่าเรามีข้อมูลนี้

ป้อนคำอธิบายรูปภาพที่นี่

เป็นการดีกว่าที่จะสร้างโมเดลด้วย 2 เสียนและสัดส่วนต่างกัน ซึ่งเป็น "เทียบเท่า" ในกรณีที่ไม่ต่อเนื่อง: เราสร้าง HMM ด้วยสถานะซ่อน 2 สถานะ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.