เกณฑ์สำหรับการเลือกโมเดล“ ดีที่สุด” ในโมเดลมาร์คอฟที่ซ่อนอยู่


12

ฉันมีชุดข้อมูลอนุกรมเวลาที่ฉันพยายามจัดวางแบบซ่อนมาร์คอฟ (HMM) เพื่อประเมินจำนวนสถานะแฝงในข้อมูล รหัสหลอกของฉันสำหรับทำสิ่งนี้มีดังต่อไปนี้:

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

ตอนนี้ในรูปแบบการถดถอยปกติ BIC มีแนวโน้มที่จะชอบรูปแบบที่น่าสังเวชมากที่สุด แต่ในกรณีของ HMM ฉันไม่แน่ใจว่ามันคือสิ่งที่ทำ มีใครบ้างที่ทราบว่าเกณฑ์ BIC ของ HMM ประเภทใดมีแนวโน้มเป็นจริง? ฉันยังสามารถได้รับ AIC และค่าความน่าจะเป็นเช่นกัน เนื่องจากฉันพยายามที่จะอนุมานจำนวนจริงของรัฐเป็นหนึ่งในเกณฑ์เหล่านี้ "ดีกว่า" เพื่ออื่น ๆ สำหรับวัตถุประสงค์นี้หรือไม่

คำตอบ:


11

ฉันสมมติว่าที่นี่ว่าตัวแปรส่งออกของคุณเป็นหมวดหมู่ แต่อาจไม่เป็นเช่นนั้น แม้ว่าโดยทั่วไปแล้วเมื่อฉันเห็น HMM ใช้แล้วจำนวนสถานะจะทราบล่วงหน้าแทนที่จะเลือกจากการปรับแต่ง พวกเขามักจะสอดคล้องกับตัวแปรที่เข้าใจดีที่เกิดขึ้นที่ไม่ได้สังเกต แต่นั่นไม่ได้หมายความว่าคุณไม่สามารถทดสอบได้

ความเสี่ยงในการใช้ BIC (และ AIC) คือว่าค่าkสำหรับจำนวนของพารามิเตอร์อิสระในโมเดลเพิ่มขึ้นเป็นสองเท่ากับจำนวนสถานะเนื่องจากคุณมีเมทริกซ์ความน่าจะเป็นช่วงการเปลี่ยนภาพพร้อมพารามิเตอร์ Px (P-1) (สำหรับรัฐ P ) และความน่าจะเป็นผลลัพธ์สำหรับแต่ละหมวดหมู่ของผลลัพธ์ที่ระบุในแต่ละรัฐ ดังนั้นหากการคำนวณ AIC และ BIC อย่างเหมาะสมkควรจะเพิ่มขึ้นอย่างรวดเร็ว

หากคุณมีข้อมูลเพียงพอฉันอยากจะแนะนำวิธีที่นุ่มนวลกว่าในการปรับจำนวนสถานะเช่นการทดสอบในตัวอย่างที่เก็บไว้ คุณอาจต้องการดูสถิติความน่าจะเป็นและดูด้วยสายตาว่าอะไรเป็นจุด นอกจากนี้หากข้อมูลของคุณมีขนาดใหญ่โปรดจำไว้ว่าสิ่งนี้จะผลักดัน BIC ให้เป็นรูปแบบที่เล็กลง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.