คำถามเริ่มต้น:
ฉันต้องการทดสอบว่าชุดข้อมูลที่แยกกันสองชุดนั้นมาจากการแจกแจงแบบเดียวกันหรือไม่ แนะนำให้ทำการทดสอบ Kolmogorov-Smirnov กับฉัน
Conover ( สถิติ nonparametric ในทางปฏิบัติ , 3d) ดูเหมือนจะบอกว่าการทดสอบ Kolmogorov-Smirnov สามารถนำมาใช้เพื่อจุดประสงค์นี้ได้ แต่พฤติกรรมของมันคือ "อนุรักษ์นิยม" ด้วยการแจกแจงแบบแยกส่วนและฉันไม่แน่ใจว่าสิ่งที่นี่หมายถึงอะไร
ความคิดเห็นของ DavidR สำหรับคำถามอื่นกล่าวว่า "... คุณยังสามารถทำการทดสอบระดับαตามสถิติ KS แต่คุณจะต้องค้นหาวิธีอื่นเพื่อให้ได้ค่าวิกฤตเช่นการจำลอง"
รุ่นของ ks.test () ในแพคเกจ dgof การ R ( บทความ , Cran ) เพิ่มความสามารถบางอย่างที่ไม่ได้อยู่ในรุ่นเริ่มต้นของ ks.test () ในแพคเกจสถิติ เหนือสิ่งอื่นใด dgof :: ks.test รวมถึงพารามิเตอร์นี้:
simulate.p.value: ตรรกะที่ระบุว่าจะคำนวณค่า p โดยการจำลอง Monte Carlo สำหรับการทดสอบความดีแบบพอดีที่ไม่ต่อเนื่องเท่านั้น
simulate.p.value = T มีจุดประสงค์เพื่อบรรลุสิ่งที่ DavidR เสนอหรือไม่?
แม้ว่าจะเป็นฉันไม่แน่ใจว่าฉันสามารถใช้ dgof :: ks.test เพื่อทดสอบสองตัวอย่างได้หรือไม่ ดูเหมือนว่าจะมีเพียงการทดสอบสองตัวอย่างสำหรับการแจกแจงแบบต่อเนื่อง:
ถ้า y เป็นตัวเลขจะมีการทดสอบสองตัวอย่างของสมมติฐานว่างที่ x และ y ถูกดึงออกมาจากการแจกแจงแบบต่อเนื่องเดียวกัน
อีกวิธีหนึ่ง y สามารถเป็นสตริงอักขระการตั้งชื่อฟังก์ชันการแจกแจงแบบต่อเนื่อง (สะสม) (หรือฟังก์ชันดังกล่าว) หรือฟังก์ชัน ecdf (หรือวัตถุของคลาส stepfun) ที่ให้การกระจายแบบไม่ต่อเนื่อง ในกรณีเหล่านี้การทดสอบหนึ่งตัวอย่างดำเนินไปด้วยค่า Null ซึ่งฟังก์ชันการแจกแจงที่สร้าง x คือการแจกแจง y ...
(รายละเอียดความเป็นมา: การพูดอย่างเคร่งครัดการแจกแจงพื้นฐานของฉันนั้นต่อเนื่อง แต่ข้อมูลมีแนวโน้มที่จะอยู่ใกล้กับจุดหนึ่งจุดมาก ๆ แต่ละจุดเป็นผลลัพธ์ของการจำลองและมีค่าเฉลี่ย 10 หรือ 20 จำนวนจริงระหว่าง -1 และ 1. ในตอนท้ายของการจำลองตัวเลขเหล่านั้นเกือบจะใกล้เคียงกับ. 9 หรือ -9 เสมอดังนั้นค่าเฉลี่ยของกลุ่มประมาณสองสามค่าและฉันถือว่าพวกมันไม่ต่อเนื่องการจำลองนั้นซับซ้อนและฉันไม่มี เหตุผลที่จะคิดว่าข้อมูลเป็นไปตามการกระจายที่รู้จักกันดี)
แนะนำ?