สมมติว่าผมมีชุดของอิสระสังเกต univariate กันกระจายและสองสมมติฐานเกี่ยวกับวิธีการถูกสร้าง:
: มาจากการแจกแจงแบบเกาส์เดียวโดยไม่ทราบค่าเฉลี่ยและความแปรปรวน
: มาจากการผสมผสานของสอง Gaussians ที่ไม่ทราบค่าเฉลี่ยความแปรปรวนและสัมประสิทธิ์การผสม
หากฉันเข้าใจอย่างถูกต้องนี่เป็นแบบจำลองที่ซ้อนกันเนื่องจากแบบจำลองที่หมายถึงสามารถอธิบายได้ในแง่ของหากคุณ จำกัด พารามิเตอร์ของ Gaussians ทั้งสองให้เหมือนกันหรือ จำกัด สัมประสิทธิ์การผสมให้เป็นศูนย์สำหรับหนึ่งในสอง Gaussians
ดังนั้นดูเหมือนว่าคุณจะสามารถใช้อัลกอริทึม EM เพื่อประเมินพารามิเตอร์ของแล้วใช้ทฤษฎีบทของวิลก์สเพื่อพิจารณาว่าโอกาสของข้อมูลภายใต้นั้นสูงกว่าของอย่างมีนัยสำคัญไม่ มีความเชื่อเล็กน้อยในข้อสันนิษฐานว่าอัลกอริทึม EM จะมาบรรจบกันกับความเป็นไปได้สูงสุดที่นี่ แต่เป็นสิ่งที่ฉันยินดีทำ
ฉันลองสิ่งนี้ในการจำลอง monte carlo โดยสมมติว่ามีอิสระมากกว่า 3 องศา H 0 (ค่าเฉลี่ยและความแปรปรวนสำหรับ Gaussian ที่สองและพารามิเตอร์การผสม) เมื่อฉันจำลองข้อมูลจาก H 0ฉันได้รับการแจกแจงแบบ P-value ที่ไม่สม่ำเสมอและได้รับการเสริมคุณค่าสำหรับค่า P ขนาดเล็ก (หาก EM ไม่ได้มาบรรจบกันกับความเป็นไปได้สูงสุดที่แท้จริงจะมีสิ่งตรงกันข้ามเกิดขึ้นแน่นอน) เกิดอะไรขึ้นกับการประยุกต์ใช้ทฤษฎีบทของวิลก์สที่สร้างอคตินี้