คำถามติดแท็ก hidden-markov-model

Hidden Markov Models ใช้สำหรับการสร้างแบบจำลองระบบที่ถือว่าเป็นกระบวนการ Markov ที่มีสถานะที่ซ่อนอยู่ (เช่นไม่สามารถสังเกตได้)

11
แหล่งข้อมูลสำหรับการเรียนรู้โซ่มาร์คอฟและโมเดลมาร์คอฟที่ซ่อนอยู่
ฉันกำลังมองหาแหล่งข้อมูล (แบบฝึกหัดตำราเรียนเว็บคาสต์ ฯลฯ ) เพื่อเรียนรู้เกี่ยวกับ Markov Chain และ HMM พื้นหลังของฉันเป็นนักชีววิทยาและปัจจุบันฉันมีส่วนร่วมในโครงการที่เกี่ยวข้องกับชีวสารสนเทศศาสตร์ นอกจากนี้พื้นหลังทางคณิตศาสตร์ที่จำเป็นต้องมีความเข้าใจเพียงพอของโมเดลของมาร์คอฟ & HMM คืออะไร ฉันได้ดูรอบ ๆ โดยใช้ Google แต่จนถึงตอนนี้ฉันยังไม่พบบทแนะนำเบื้องต้นที่ดี ฉันแน่ใจว่าคนที่นี่รู้ดีกว่า

5
ความแตกต่างระหว่างอัลกอริทึมไปข้างหน้าถอยหลังและ Viterbi คืออะไร
ฉันต้องการทราบว่าความแตกต่างระหว่างอัลกอริทึมไปข้างหน้าถอยหลังและอัลกอริทึม Viterbiสำหรับการอนุมานในโมเดล Markov ที่ซ่อนอยู่ (HMM) คืออะไร

3
ความแตกต่างที่ใช้งานง่ายระหว่างโมเดล Markov ที่ซ่อนอยู่และฟิลด์สุ่มแบบมีเงื่อนไข
ฉันเข้าใจว่า HMM (โมเดลมาร์กมาร์คอฟ) เป็นรุ่นทั่วไปและ CRF เป็นรุ่นที่จำแนกได้ ฉันยังเข้าใจว่า CRFs (เขตสุ่มแบบมีเงื่อนไข) ได้รับการออกแบบและใช้งานอย่างไร สิ่งที่ฉันไม่เข้าใจก็คือพวกเขาแตกต่างจาก HMM อย่างไร ฉันอ่านว่าในกรณีของ HMM เราสามารถจำลองสถานะต่อไปของเราบนโหนดก่อนหน้าโหนดปัจจุบันและความน่าจะเป็นการเปลี่ยนแปลง แต่ในกรณีของ CRF เราสามารถทำสิ่งนี้ได้และสามารถเชื่อมต่อจำนวนโหนดด้วยกันเพื่อสร้างการอ้างอิง หรือบริบท ฉันแก้ไขที่นี่หรือไม่

1
ความแตกต่างระหว่างโมเดล Markov ที่ซ่อนอยู่กับตัวกรองอนุภาค (และตัวกรองคาลมาน)
นี่คือคำถามเก่าของฉัน ฉันอยากถามว่ามีใครรู้ถึงความแตกต่าง (ถ้ามีความแตกต่างใด ๆ ) ระหว่าง Hidden Markov models (HMM) และ Particle Filter (PF) หรือไม่และเป็นผลจาก Kalman Filter หรือในกรณีที่เราใช้อัลกอริทึมใด ฉันเป็นนักเรียนและฉันต้องทำโครงการ แต่ก่อนอื่นฉันต้องเข้าใจบางสิ่ง ดังนั้นตามบรรณานุกรมทั้งสองรัฐอวกาศรุ่นรวมทั้งที่ซ่อนอยู่ (หรือแฝงหรือสังเกต) รัฐ ตามที่ Wikipedia (Hidden_Markov_model) “ใน HMM พื้นที่สถานะของตัวแปรที่ซ่อนอยู่นั้นไม่ต่อเนื่องในขณะที่การสังเกตตัวเองสามารถแยกออกจากกัน (โดยทั่วไปจะเกิดจากการกระจายแบบแบ่งหมวดหมู่) หรือต่อเนื่อง (โดยทั่วไปมาจากการแจกแจงแบบเกาส์) โมเดลมาร์คอฟที่ซ่อนยังสามารถวางนัยเพื่ออนุญาตให้มีพื้นที่ของรัฐอย่างต่อเนื่อง ตัวอย่างของแบบจำลองเหล่านั้นคือสิ่งที่กระบวนการมาร์คอฟเหนือตัวแปรที่ซ่อนอยู่เป็นระบบพลวัตเชิงเส้นที่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรที่เกี่ยวข้องและที่ที่ตัวแปรที่ซ่อนอยู่ ในกรณีง่าย ๆ เช่นระบบพลวัตเชิงเส้นที่กล่าวถึงการอนุมานที่แน่นอนนั้นง่ายต่อการใช้งาน (ในกรณีนี้ใช้ตัวกรองคาลมาน); อย่างไรก็ตามโดยทั่วไปการอนุมานที่แน่นอนใน HMMs ที่มีตัวแปรแฝงต่อเนื่องเป็นไปไม่ได้และต้องใช้วิธีการโดยประมาณ” แต่สำหรับฉันมันค่อนข้างสับสน ... ในคำง่ายๆนี้หมายถึงการติดตาม (จากการวิจัยเพิ่มเติมที่ฉันได้ทำไป): ใน HMM พื้นที่รัฐสามารถเป็นได้ทั้งที่ไม่ต่อเนื่องหรือต่อเนื่อง นอกจากนี้ยังมีข้อสังเกตที่ตัวเองสามารถเป็นได้ทั้งที่ไม่ต่อเนื่องหรือต่อเนื่อง นอกจากนี้ …

2
Hidden Markov Model เทียบกับ Markov Transition Model เทียบกับ State-Space Model …?
สำหรับวิทยานิพนธ์ปริญญาโทของฉันฉันกำลังทำงานเพื่อพัฒนาแบบจำลองทางสถิติสำหรับการเปลี่ยนระหว่างสถานะต่าง ๆ ที่กำหนดโดยสถานะทางเซรุ่มวิทยา สำหรับตอนนี้ฉันจะไม่ให้รายละเอียดมากเกินไปในบริบทนี้เนื่องจากคำถามของฉันเป็นเรื่องทั่วไป / ทางทฤษฎี อย่างไรก็ตามปรีชาญาณของฉันคือฉันควรใช้ Hidden Markov Model (HMM); ปัญหาที่ฉันเจอในขณะที่ฉันอ่านวรรณกรรมและการวิจัยพื้นฐานอื่น ๆ ที่จำเป็นในการสร้างแบบจำลองของฉันคือความสับสนเกี่ยวกับคำศัพท์และความแตกต่างที่แน่นอนระหว่างแบบจำลองกระบวนการที่ซ่อนอยู่ประเภทต่างๆ ฉันเพียง แต่ตระหนักถึงสิ่งที่แตกต่างอย่างชัดเจน (ตัวอย่างมา) ยิ่งกว่านั้นฉันคิดว่าอย่างน้อยจากสิ่งที่ฉันได้เห็นในวรรณคดีมีคำศัพท์ที่ไม่ได้มาตรฐานที่สร้างขึ้นจากการสร้างแบบจำลองนี้ ดังนั้นฉันหวังว่าผู้คนจะช่วยให้ฉันเข้าใจคำศัพท์บางส่วนให้ฉันได้ ฉันมีคำถามจำนวนหนึ่ง แต่ฉันเดาว่าเป็นหนึ่งหรือสองคนได้รับคำตอบที่น่าพอใจส่วนที่เหลือจะกลายเป็น disentangled ฉันหวังว่านี่จะไม่ยืดยาวเกินไป หากผู้ดำเนินรายการต้องการให้ฉันแยกส่วนนี้ออกเป็นหลายโพสต์ ไม่ว่าในกรณีใดฉันใส่คำถามตัวหนาแล้วตามด้วยรายละเอียดของคำถามที่ฉันค้นพบระหว่างการค้นหาวรรณกรรม ดังนั้นในลำดับที่ไม่มี: 1) "รูปแบบกระบวนการที่ซ่อนอยู่" คืออะไร? ฉันทำงานภายใต้ความประทับใจว่า "แบบจำลองกระบวนการซ่อนเร้น" เป็นคำศัพท์ในร่มที่สามารถใช้อธิบายแบบจำลองทางสถิติหลายประเภทคำอธิบายความน่าจะเป็นทั้งหมดของข้อมูลอนุกรมเวลาที่สร้างขึ้นโดย "ระบบการซ้อนทับกัน" อาจซ่อนกระบวนการเชิงเส้น "([1]) อันที่จริง [2] กำหนด "แบบจำลองกระบวนการซ่อนเร้น" เป็น "คำทั่วไปหมายถึงทั้งแบบพื้นที่รัฐหรือแบบจำลองมาร์คอฟที่ซ่อนอยู่" [1] ดูเหมือนจะอนุมานได้ว่าแบบจำลองของมาร์คอฟที่ซ่อนอยู่เป็นรูปแบบย่อยของแบบจำลองกระบวนการที่ซ่อนไว้ซึ่งมุ่งเน้นไปที่การอนุมานในสถานะไบนารี ความหมายพื้นฐานดูเหมือนว่าสำหรับฉันว่าโมเดลกระบวนการที่ซ่อนอยู่เป็นลักษณะทั่วไปของโมเดลมาร์คอฟที่ซ่อนอยู่ บางครั้งฉันเห็น "แบบจำลองกระบวนการที่ซ่อนอยู่" และวลี " สัญชาตญาณในส่วนของฉันนี้ถูกต้องหรือไม่? ถ้าไม่มีใครมีการอ้างอิงที่ชัดเจนกว่าวิธีการเหล่านี้หรือไม่ …

4
การฝึกอบรมแบบซ่อนมาร์คอฟโมเดลการฝึกอบรมหลายครั้ง
ฉันใช้งาน HMM แบบแยกตามบทช่วยสอนนี้ http://cs229.stanford.edu/section/cs229-hmm.pdf บทช่วยสอนนี้และอื่น ๆ พูดถึงการฝึกอบรม HMM ตามลำดับการสังเกตเสมอ จะเกิดอะไรขึ้นเมื่อฉันมีลำดับการฝึกซ้อมหลายครั้ง ฉันควรเรียกใช้พวกมันตามลำดับหรือไม่ อีกทางเลือกหนึ่งคือการเชื่อมต่อลำดับที่หนึ่งและฝึกบนนั้น แต่ฉันจะมีการเปลี่ยนสถานะจากจุดสิ้นสุดของลำดับหนึ่งไปยังจุดเริ่มต้นของลำดับถัดไปซึ่งไม่ใช่ของจริง

2
อะไรคือความแตกต่างระหว่างอัลกอริทึม Baum-Welch และการฝึกอบรม Viterbi?
ฉันกำลังใช้การฝึกอบรม Viterbiสำหรับปัญหาการแบ่งส่วนภาพ ฉันต้องการทราบว่าข้อดี / ข้อเสียของการใช้อัลกอริทึม Baum-Welch แทนการฝึกอบรม Viterbi

1
การใช้ HMM ในด้านการเงินเชิงปริมาณ ตัวอย่างของ HMM ที่ทำงานเพื่อตรวจจับเทรนด์ / จุดเปลี่ยน?
ฉันกำลังค้นหาโลกมหัศจรรย์ของ "Hidden Markov Models" ที่เรียกว่า "ระบอบการปกครองแบบจำลองการสลับ" ฉันต้องการปรับ HMM ใน R เพื่อตรวจหาแนวโน้มและจุดเปลี่ยน ฉันต้องการสร้างแบบจำลองทั่วไปให้ได้มากที่สุดเพื่อให้สามารถทดสอบได้ในหลาย ๆ ราคา ใครช่วยแนะนำกระดาษได้บ้าง ฉันได้เห็น (และอ่าน) (มากกว่า) น้อย แต่ฉันกำลังมองหารูปแบบเรียบง่ายที่ใช้งานง่าย ยังแนะนำแพ็คเกจ R อะไรอีกบ้าง? ฉันเห็นว่ามีคนจำนวนมากกำลังทำอืม ฉันซื้อหนังสือ "Hidden Markov models สำหรับซีรี่ส์เวลา: บทนำโดยใช้ R" มาดูกันว่ามีอะไรอยู่ในนั้น;) เฟร็ด

3
thresholding รุ่น Markov ที่ซ่อนอยู่
ฉันได้พัฒนาระบบแนวคิดสำหรับการรู้จำเสียงโดยใช้ mfcc และรุ่นมาร์คอฟที่ซ่อนอยู่ มันให้ผลลัพธ์ที่มีแนวโน้มเมื่อฉันทดสอบระบบด้วยเสียงที่รู้จัก แม้ว่าระบบเมื่อมีการป้อนข้อมูลเสียงที่ไม่รู้จักส่งคืนผลลัพธ์ด้วยการจับคู่ที่ใกล้เคียงที่สุดและคะแนนไม่ได้แตกต่างกันในการคิดค้นมันเป็นเสียงที่ไม่รู้จักเช่น: ฉันได้ฝึกอบรมมาร์คอฟที่ซ่อนอยู่ 3 ตัวสำหรับการพูดหนึ่งสำหรับน้ำที่ออกมาจากก๊อกน้ำและอีกอันสำหรับเคาะบนโต๊ะ จากนั้นฉันจะทดสอบพวกเขาเกี่ยวกับข้อมูลที่มองไม่เห็นและรับผลลัพธ์ต่อไปนี้: input: speech HMM\knocking: -1213.8911146444477 HMM\speech: -617.8735676792728 HMM\watertap: -1504.4735097322673 So highest score speech which is correct input: watertap HMM\knocking: -3715.7246152783955 HMM\speech: -4302.67960438553 HMM\watertap: -1965.6149147201534 So highest score watertap which is correct input: knocking HMM\filler -806.7248912250212 HMM\knocking: -756.4428782636676 HMM\speech: -1201.686687761133 HMM\watertap: -3025.181144273698 So …

3
โมเดลมาร์คอฟที่ซ่อนอยู่เทียบกับเครือข่ายประสาทเทียม
ปัญหาการป้อนข้อมูลตามลำดับใดที่เหมาะสมที่สุดสำหรับแต่ละปัญหา มิติข้อมูลเข้ากำหนดว่าการจับคู่แบบใดดีกว่า ปัญหาที่ต้องใช้ "หน่วยความจำที่ยาวนานกว่า" เหมาะกว่าสำหรับ LSTM RNN หรือไม่ขณะที่ปัญหาเกี่ยวกับรูปแบบอินพุตที่เป็นวงจร (ตลาดหุ้น, สภาพอากาศ) จะแก้ไขได้ง่ายขึ้นโดย HMM ดูเหมือนว่ามีการทับซ้อนกันมากมาย ฉันอยากรู้ว่าความแตกต่างที่ลึกซึ้งนั้นมีอยู่ระหว่างสองสิ่งนี้อย่างไร

1
ฉันจะฝึกอบรม HMM เพื่อการจัดหมวดหมู่ได้อย่างไร
ดังนั้นฉันเข้าใจว่าเมื่อคุณฝึกฝน HMM สำหรับการจัดประเภทแนวทางมาตรฐานคือ: แยกชุดข้อมูลของคุณออกเป็นชุดข้อมูลสำหรับแต่ละชั้นเรียน ฝึกหนึ่ง HMM ต่อคลาส ในชุดทดสอบเปรียบเทียบความเป็นไปได้ของแต่ละรุ่นเพื่อจำแนกแต่ละหน้าต่าง แต่ฉันจะฝึก HMM ในแต่ละชั้นได้อย่างไร ฉันเพิ่งต่อข้อมูลที่เกี่ยวข้องกับหนึ่งคลาสเข้าด้วยกันหรือไม่ แต่ไม่ใช่ข้อมูลอนุกรมเวลาหมายถึงการเรียงลำดับ - และถ้าฉันทำอย่างนั้นฉันกำลังบอกว่าจุดข้อมูลบางอย่างต่อเนื่องกันเมื่อพวกเขาไม่ได้? เพื่อให้เป็นรูปธรรมมากขึ้นฉันมีข้อมูล EEG ซึ่งเป็นเมทริกซ์ 96xT ที่ฉันมีเวกเตอร์ฟีเจอร์ 96 เวกเตอร์ซึ่งเป็นความหนาแน่นสเปกตรัมพลังงานของความถี่ที่แตกต่างกันจากช่องสัญญาณที่แตกต่างกันและ T คือระยะเวลาของสัญญาณ สิ่งนี้สามารถแบ่งออกเป็นหน้าต่างที่ฉันรู้จากโปรโตคอลทดลอง (ข้อมูลมีป้ายกำกับ) ดังนั้นฉันจึงสามารถรวบรวมเมทริกซ์ 96 * t สำหรับแต่ละชั้นเรียนได้ โดยที่ t น้อยกว่า T และระบุขนาดของแต่ละหน้าต่าง จากนั้นฉันจะฝึก HMM กับข้อมูลนี้ได้อย่างไร ถ้ามันช่วยให้ฉันพยายามใช้ชุดเครื่องมือ pmtk3 แต่ฉันเปิดให้ใช้อะไรก็ได้จริง ๆ - มันแค่ต้องสามารถจัดการกับการสังเกตที่มีคุณค่าจริง ๆ เพราะความหนาแน่นสเปกตรัมพลังงานนั้นไม่ต่อเนื่องกัน (กล่องเครื่องมือ MATLAB เริ่มต้นเท่านั้นที่สามารถจัดการได้ …

1
เกณฑ์สำหรับการเลือกโมเดล“ ดีที่สุด” ในโมเดลมาร์คอฟที่ซ่อนอยู่
ฉันมีชุดข้อมูลอนุกรมเวลาที่ฉันพยายามจัดวางแบบซ่อนมาร์คอฟ (HMM) เพื่อประเมินจำนวนสถานะแฝงในข้อมูล รหัสหลอกของฉันสำหรับทำสิ่งนี้มีดังต่อไปนี้: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } ตอนนี้ในรูปแบบการถดถอยปกติ BIC มีแนวโน้มที่จะชอบรูปแบบที่น่าสังเวชมากที่สุด แต่ในกรณีของ HMM ฉันไม่แน่ใจว่ามันคือสิ่งที่ทำ มีใครบ้างที่ทราบว่าเกณฑ์ BIC ของ HMM ประเภทใดมีแนวโน้มเป็นจริง? ฉันยังสามารถได้รับ AIC และค่าความน่าจะเป็นเช่นกัน เนื่องจากฉันพยายามที่จะอนุมานจำนวนจริงของรัฐเป็นหนึ่งในเกณฑ์เหล่านี้ "ดีกว่า" เพื่ออื่น ๆ สำหรับวัตถุประสงค์นี้หรือไม่

1
การคำนวณช่วงความเชื่อมั่นผ่าน bootstrap จากการสังเกต
bootstrap ในรูปแบบมาตรฐานสามารถใช้ในการคำนวณช่วงความเชื่อมั่นของสถิติโดยประมาณหากการสังเกตนั้นเป็น iid I. Visser และคณะ ใน " Confidence Intervals สำหรับพารามิเตอร์ Markov Model ที่ซ่อนอยู่ " ใช้ bootstrap แบบพารามิเตอร์เพื่อคำนวณ CIs สำหรับพารามิเตอร์ HMM อย่างไรก็ตามเมื่อเราใส่ HMM ตามลำดับการสังเกตเราได้สันนิษฐานไว้แล้วว่าการสังเกตนั้นขึ้นอยู่กับ (ในทางตรงกันข้ามกับโมเดลผสม) ฉันมีสองคำถาม: สมมติฐาน iid ทำอะไรกับ bootstrap? เราสามารถเพิกเฉยต่อข้อกำหนดของ id ใน bootstrap แบบพารามิเตอร์ได้หรือไม่? Visser และคณะ วิธีการสั้น ๆ ดังนี้: สมมติเรามีลำดับสังเกตผลมาจากการสุ่มตัวอย่างอืมกับชุดจริง แต่ไม่รู้จักของพารามิเตอร์\Y=o1,o2,...,onY=o1,o2,...,onY=o_1,o_2,...,o_nθ=θ1,θ2,...,θlθ=θ1,θ2,...,θl\theta=\theta_1,\theta_2,...,\theta_l พารามิเตอร์สามารถประมาณได้โดยใช้อัลกอริทึม EM:θ^=θ^1,θ^2,...,θ^lθ^=θ^1,θ^2,...,θ^l\hat{\theta}=\hat{\theta}_1,\hat{\theta}_2,...,\hat{\theta}_l ใช้ HMM โดยประมาณเพื่อสร้างตัวอย่าง bootstrap ขนาด :nnnY∗=o∗1,o∗2,...,o∗nY∗=o1∗,o2∗,...,on∗Y^*=o^*_1,o^*_2,...,o^*_n …

2
จำนวนพารามิเตอร์ในโมเดลมาร์คอฟ
ฉันต้องการใช้ BIC สำหรับการเลือกรุ่น HMM: BIC = -2*logLike + num_of_params * log(num_of_data) ดังนั้นฉันจะนับจำนวนพารามิเตอร์ในโมเดล HMM ได้อย่างไร พิจารณา HMM แบบ 2 สถานะง่ายๆโดยที่เรามีข้อมูลต่อไปนี้: data = [1 2 1 1 2 2 2 1 2 3 3 2 3 2 1 2 2 3 4 5 5 3 3 2 6 6 5 6 4 …

6
โมเดลมาร์คอฟที่ซ่อนอยู่พร้อมอัลกอริทึม Baum-Welch โดยใช้ python
ฉันกำลังมองหาการใช้งานหลาม (ในหลามบริสุทธิ์หรือห่อสิ่งที่มีอยู่) ของ HMM และ Baum-Welch ความคิดบางอย่าง? ฉันเพิ่งค้นหาใน google และฉันพบวัสดุที่น่าสงสารจริง ๆ ที่เกี่ยวกับเทคนิคการเรียนรู้ของเครื่องอื่น ๆ ทำไม?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.