ฉันมีความยากลำบากในการเข้าใจการตีความของการทดสอบ KS ตัวอย่าง 2 ตัวและมันแตกต่างจากการทดสอบแบบปกติระหว่าง 2 กลุ่ม
ให้บอกว่าฉันมีชายและหญิงทำงานบางอย่างและฉันรวบรวมคะแนนจากงานนั้น เป้าหมายสูงสุดของฉันคือการพิจารณาว่าเพศชายและเพศหญิงปฏิบัติงานต่างกันหรือไม่
สิ่งหนึ่งที่ฉันทำได้คือทดสอบระหว่าง 2 กลุ่ม อีกสิ่งหนึ่งที่ฉันทำได้คือคำนวณ ECDF สำหรับชายและหญิงพล็อตและทำการทดสอบ KS 2 ตัวอย่าง ฉันจะได้รับสิ่งนี้:
การทดสอบ KS
สมมติฐานว่างสำหรับการทดสอบ KS คือการแจกแจงคะแนนต่อเนื่อง 2 ชุดมาจากประชากรเดียวกัน
เมื่อทำการทดสอบ KS ฉันได้รับ: D = 0.18888, p-value = 0.04742
ก่อนอื่นฉันต้องการตรวจสอบว่าการตีความผลลัพธ์ของฉันถูกต้อง ที่นี่ฉันจะปฏิเสธสมมติฐานว่างและบอกว่าการแจกแจงคะแนนชายและหญิงมาจากประชากรที่แตกต่างกัน หรือกล่าวอีกนัยหนึ่งการกระจายของคะแนนชายและหญิงนั้นแตกต่างกัน
โดยเฉพาะอย่างยิ่งเพศชายมักจะมีโอกาสสูงที่จะได้คะแนนต่ำกว่าในงานนี้และนั่นคือความแตกต่างระหว่าง 2 เพศที่ฉันตีความจากเนื้อเรื่อง
t-test
ตอนนี้ที่การทดสอบจะทดสอบความแตกต่างระหว่างชายและหญิงหมายถึงตัวแปรคะแนน
ให้จินตนาการถึงกรณีที่การแสดงของผู้ชายนั้นแย่กว่าผู้หญิงในงานนี้ ในกรณีดังกล่าวการกระจายของคะแนนชายจะมุ่งไปที่ค่าเฉลี่ยต่ำในขณะที่การแจกแจงคะแนนหญิงจะอยู่กึ่งกลางค่าเฉลี่ยสูง สถานการณ์นี้จะสอดคล้องกับพล็อตด้านบนเนื่องจากผู้ชายจะมีโอกาสสูงที่จะได้รับคะแนนต่ำกว่า
หากการทดสอบเสื้อยืดออกมามีนัยสำคัญฉันจะสรุปได้ว่าคะแนนผู้หญิงโดยเฉลี่ยสูงกว่าเพศชายอย่างมีนัยสำคัญ หรือในแง่ของประชากรคะแนนหญิงมาจากประชากรที่มีค่าเฉลี่ยสูงกว่าประชากรชายซึ่งฟังดูคล้ายกับข้อสรุปของแคนซัสว่ามาจากประชากรที่แตกต่างกัน
ความแตกต่างคืออะไร?
ดังนั้นข้อสรุปฉันจะวาดทั้งใน KS และกรณีทดสอบ t เหมือนกัน เพศชายทำงานได้ไม่ดีเมื่อเทียบกับเพศหญิง ดังนั้นประโยชน์ของการใช้การทดสอบหนึ่งการทดสอบอื่น ๆ คืออะไร? มีความรู้ใหม่ที่คุณสามารถได้รับจากการใช้การทดสอบ KS หรือไม่?
วิธีที่ฉันเห็นมันเพศผู้ที่มีการกระจายอยู่กึ่งกลางที่มีค่าเฉลี่ยต่ำและผู้หญิงที่อยู่ตรงกลางที่มีค่าเฉลี่ยสูงคือสิ่งที่ทำให้การทดสอบ t สำคัญ แต่ด้วยความจริงเดียวกันนี้ผู้ชายจะมีโอกาสสูงกว่าในการทำคะแนนให้ต่ำลงซึ่งจะทำให้พล็อตมีลักษณะเหมือนด้านบนและให้การทดสอบ KS ที่สำคัญ ดังนั้นผลลัพธ์ของการทดสอบทั้งสองมีสาเหตุที่เหมือนกัน แต่อาจมีใครโต้แย้งได้ว่าการทดสอบ KS นั้นคำนึงถึงมากกว่าวิธีการแจกแจงและพิจารณารูปร่างของการกระจายตัวด้วย แต่มันเป็นไปได้ที่จะแยกสาเหตุ ของการทดสอบ KS ที่สำคัญจากเพียงผลการทดสอบ?
ดังนั้นค่าในการดำเนินการทดสอบ KS มากกว่าที่ทดสอบคืออะไร? และสมมุติว่าฉันสามารถทำตามสมมติฐานของการทดสอบ t สำหรับคำถามนี้ได้