ฉันสามารถใช้ Kolmogorov-Smirnov เพื่อเปรียบเทียบการแจกแจงเชิงประจักษ์สองแบบได้หรือไม่?


16

มันเป็นการดีหรือไม่ที่จะใช้การทดสอบความดีแบบพอดีของ Kolmogorov-Smirnov เพื่อเปรียบเทียบการแจกแจงเชิงประจักษ์สองครั้งเพื่อพิจารณาว่าพวกมันดูเหมือนว่ามาจากการแจกแจงพื้นฐานเดียวกันแทนที่จะเปรียบเทียบการกระจายเชิงประจักษ์หนึ่งไปสู่การแจกแจงอ้างอิงที่ระบุล่วงหน้าหรือไม่

ให้ฉันลองถามอีกวิธีนี้ ฉันรวบรวมตัวอย่าง N จากการแจกจ่ายในที่เดียว ฉันรวบรวมตัวอย่าง M ที่สถานที่อื่น ข้อมูลมีความต่อเนื่อง (แต่ละตัวอย่างเป็นจำนวนจริงระหว่าง 0 ถึง 10 พูด) แต่ไม่แจกแจงตามปกติ ฉันต้องการทดสอบว่าตัวอย่าง N + M เหล่านี้ทั้งหมดมาจากการแจกแจงพื้นฐานเดียวกันหรือไม่ มันเหมาะสมที่จะใช้การทดสอบ Kolmogorov-Smirnov เพื่อจุดประสงค์นี้หรือไม่?

F0NF1MF0F1D=supx|F0(x)F1(x)|D

(ฉันอ่านที่อื่นว่าการทดสอบ Kolmogorov-Smirnov สำหรับความดีของพอดีไม่ถูกต้องสำหรับการกระจายโดยสิ้นเชิงแต่ฉันยอมรับว่าฉันไม่เข้าใจสิ่งนี้หมายความว่าหรือทำไมมันอาจจะเป็นจริงนั่นหมายความว่าวิธีการเสนอของฉันไม่ดี )

หรือคุณแนะนำอย่างอื่นแทน


ฉันสงสัยว่าตามความเห็นของ @ Glen_b ที่นี่ ( stats.stackexchange.com/questions/362/ หรือไม่ ) เราไม่ควรใช้การทดสอบ KS เพื่อเปรียบเทียบการแจกแจงเชิงประจักษ์เพราะไม่ควรใช้การทดสอบ KS เมื่อมีการประมาณพารามิเตอร์ (? )
russellpierce

คำตอบ:


19

นั่นคือตกลงและค่อนข้างสมเหตุสมผล มันถูกเรียกว่าสองตัวอย่างการทดสอบ Kolmogorov-Smirnov การวัดความแตกต่างระหว่างฟังก์ชันการแจกแจงสองฟังก์ชันโดย supnorm นั้นสมเหตุสมผลเสมอ แต่เพื่อทำการทดสอบอย่างเป็นทางการคุณต้องการทราบการแจกแจงภายใต้สมมติฐานที่ว่าทั้งสองตัวอย่างมีความเป็นอิสระและแต่ละ iid จากการแจกแจงพื้นฐานเดียวกัน การพึ่งพาทฤษฎีซีมโทติคตามปกติคุณจะต้องมีความต่อเนื่องของการแจกแจงแบบพื้นฐาน (ไม่ใช่การแจกแจงเชิงประจักษ์) ดูหน้า Wikipedia ที่ลิงก์ไปด้านบนสำหรับรายละเอียดเพิ่มเติม

ks.testพี


8
ใน R คุณสามารถทำ bootstrapped KS test sekhon.berkeley.edu/matching/ks.boot.htmlซึ่งกำจัดความต้องการที่ต่อเนื่อง
Dr G

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.