ฉันมีการกระจายของค่านิยมแบบ bimodal อย่างชัดเจนซึ่งฉันพยายามที่จะปรับให้เหมาะสม ข้อมูลสามารถเข้ากันได้ดีกับทั้ง 2 ฟังก์ชั่นปกติ (bimodal) หรือฟังก์ชั่นปกติ 3 อย่าง นอกจากนี้ยังมีเหตุผลทางกายภาพที่เป็นไปได้สำหรับการปรับข้อมูลด้วย 3
ยิ่งมีการแนะนำพารามิเตอร์มากเท่าใดความพอดีที่สมบูรณ์แบบก็จะยิ่งมากขึ้นเช่นเดียวกับค่าคงที่ที่เพียงพอหนึ่งสามารถ " พอดีช้าง "
นี่คือการกระจายตัวพอดีกับผลรวมของ 3 เส้นโค้ง (Gaussian):
เหล่านี้คือข้อมูลสำหรับการฟิต ฉันไม่แน่ใจว่าควรใช้แบบทดสอบแบบใดเพื่อตรวจสอบความเหมาะสม ข้อมูลประกอบด้วย 91 คะแนน
1 ฟังก์ชั่นปกติ:
- RSS: 1.06231
- X ^ 2: 3.1674
- F.Test: 0.3092
2 ฟังก์ชั่นปกติ:
- RSS: 0.010939
- X ^ 2: 0.053896
- F.Test: 0.97101
3 ฟังก์ชั่นปกติ:
- RSS: 0.00536
- X ^ 2: 0.02794
- F.Test: 0.99249
การทดสอบทางสถิติที่ถูกต้องที่สามารถนำมาใช้เพื่อกำหนดว่าแบบทดสอบใดที่เหมาะที่สุด เห็นได้ชัดว่าฟังก์ชั่นปกติ 1 แบบไม่เพียงพอ ดังนั้นฉันจะแยกแยะระหว่าง 2 และ 3 ได้อย่างไร
เพื่อเพิ่มฉันส่วนใหญ่ทำเช่นนี้กับ Excel และ Python เล็กน้อย ฉันยังไม่คุ้นเคยกับ R หรือภาษาทางสถิติอื่น ๆ
R
เส้นทาง) มีการกล่าวถึงเกณฑ์การเลือกแบบจำลองบางอย่างในคำตอบนี้ ในที่สุดคุณอาจต้องการพิจารณาวิธีการรวมกลุ่มซึ่งฉันกล่าวถึงสั้น ๆ ในคำตอบนี้ซึ่งยังมีลิงค์ไปยังข้อมูลที่มุ่งเน้นงูหลาม คุณสามารถค้นหารายละเอียดเพิ่มเติมเกี่ยวกับการเลือกรุ่นและค่าเฉลี่ยในคำตอบนี้