“ ไม่ควรมีความสัมพันธ์” ในการทดสอบ Kolmgorov-Smirnov หนึ่งตัวอย่างใน R


12

ฉันจะใช้การทดสอบ Kolmogorov-Smirnov เพื่อทดสอบความปกติของ MYDATA ใน R นี่เป็นตัวอย่างของสิ่งที่ฉันทำ

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

นี่คือผลลัพธ์ R ให้ฉัน:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

ฉันคิดว่ามีปัญหา "ความสัมพันธ์" หมายถึงอะไรในคำเตือนนี้


2
ทำไมคุณต้องการทดสอบตามปกติ ในกรณีส่วนใหญ่การทดสอบภาวะปกติของตัวแปร นั้นไม่มีประโยชน์เลยแม้ว่าการทดสอบภาวะปกติของเศษซากหลังจากการถดถอยอาจมีความสำคัญ
EdM

2
แม้จะไม่มีความสัมพันธ์การทดสอบ KS ไม่ใช่การทดสอบสำหรับค่านิยมทั่วไป แต่เป็นการแจกแจงที่ระบุอย่างสมบูรณ์ (คุณกำลังประเมินค่าเฉลี่ยและค่า sd จากข้อมูล) ค่า p ของคุณจะไร้สาระ ค้นหาเว็บไซต์ของเราสำหรับการอ้างอิงถึงการทดสอบ
Lilliefors

คำตอบ:


10

คุณมีสองปัญหาที่นี่:

การทดสอบ KS นั้นใช้สำหรับการกระจายอย่างต่อเนื่องและดังนั้น MYDATA ไม่ควรมีความสัมพันธ์ใด ๆ (ค่าซ้ำ)

ทฤษฎีพื้นฐานของการทดสอบ KS ไม่อนุญาตให้คุณประเมินพารามิเตอร์ของการกระจายจากข้อมูลที่คุณได้ทำ ความช่วยเหลือสำหรับ ks.test อธิบายสิ่งนี้


ทำไมks.testในกรณีที่สองตัวอย่างต้องการความสัมพันธ์ที่จะถูกลบออกจากทั้งสองxและy? ฉันหมายถึงฉันไม่มีความสัมพันธ์ในxและy( unique(x)และunique(y)) แต่เวกเตอร์สองตัวมีค่าเหมือนกัน ไม่ควรพิจารณาความสัมพันธ์ระหว่างค่านิยมทั้งในxและในy?
Nemesi

@Nemesi หากคุณมีคำถามใหม่โปรดถามโดยใช้ปุ่มถามคำถาม
mdewey

ฉันคิดว่ามันไม่เพียงพอที่จะเป็นคำถามที่แตกต่าง แต่นี่คือ: stats.stackexchange.com/questions/389151/…
Nemesi

5

ตามที่อธิบายโดย @mdewey การทดสอบ KS ไม่เหมาะเมื่อประเมินพารามิเตอร์จากข้อมูล คุณสามารถใช้รหัสต่อไปนี้ซึ่งขึ้นอยู่กับการทดสอบ Anderson-Darling สำหรับความเป็นมาตรฐานและไม่ต้องการให้คุณจัดหาค่าเฉลี่ยและ stddev การทดสอบนี้มีความแม่นยำมากกว่าการทดสอบ Lilliefors

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

"ความแม่นยำ" อาจเป็นการค้นหาที่แคบ แต่เข้าใจผิด ในทั้งสองกรณีแอปพลิเคชันส่วนใหญ่ของการทดสอบอย่างใดอย่างหนึ่งเหล่านี้จะไร้ประโยชน์ที่เลวร้ายที่สุดและในกรณีส่วนใหญ่ทำให้เข้าใจผิด ผู้คนมักถูกสอนให้ใช้โดยบุคคลที่มีความเข้าใจผิด ๆ เกี่ยวกับสมมติฐานเกี่ยวกับวิธีการถดถอย ฉันสรุปความอ่อนแอสัมพัทธ์ของการทดสอบ KS จะทำให้จริง "ดี" ที่จะใช้ทางเลือกที่มีประสิทธิภาพมากขึ้นเนื่องจากผลของมันจะมีโอกาสน้อยที่จะทำให้เข้าใจผิดกับผู้ใช้ไร้เดียงสา
DWIN
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.