Kolmogorov – Smirnov test กับ t-test


14

ฉันมีความยากลำบากในการเข้าใจการตีความของการทดสอบ KS ตัวอย่าง 2 ตัวและมันแตกต่างจากการทดสอบแบบปกติระหว่าง 2 กลุ่ม

ให้บอกว่าฉันมีชายและหญิงทำงานบางอย่างและฉันรวบรวมคะแนนจากงานนั้น เป้าหมายสูงสุดของฉันคือการพิจารณาว่าเพศชายและเพศหญิงปฏิบัติงานต่างกันหรือไม่

สิ่งหนึ่งที่ฉันทำได้คือทดสอบระหว่าง 2 กลุ่ม อีกสิ่งหนึ่งที่ฉันทำได้คือคำนวณ ECDF สำหรับชายและหญิงพล็อตและทำการทดสอบ KS 2 ตัวอย่าง ฉันจะได้รับสิ่งนี้:

ป้อนคำอธิบายรูปภาพที่นี่

การทดสอบ KS

สมมติฐานว่างสำหรับการทดสอบ KS คือการแจกแจงคะแนนต่อเนื่อง 2 ชุดมาจากประชากรเดียวกัน

เมื่อทำการทดสอบ KS ฉันได้รับ: D = 0.18888, p-value = 0.04742

ก่อนอื่นฉันต้องการตรวจสอบว่าการตีความผลลัพธ์ของฉันถูกต้อง ที่นี่ฉันจะปฏิเสธสมมติฐานว่างและบอกว่าการแจกแจงคะแนนชายและหญิงมาจากประชากรที่แตกต่างกัน หรือกล่าวอีกนัยหนึ่งการกระจายของคะแนนชายและหญิงนั้นแตกต่างกัน

โดยเฉพาะอย่างยิ่งเพศชายมักจะมีโอกาสสูงที่จะได้คะแนนต่ำกว่าในงานนี้และนั่นคือความแตกต่างระหว่าง 2 เพศที่ฉันตีความจากเนื้อเรื่อง

t-test

ตอนนี้ที่การทดสอบจะทดสอบความแตกต่างระหว่างชายและหญิงหมายถึงตัวแปรคะแนน

ให้จินตนาการถึงกรณีที่การแสดงของผู้ชายนั้นแย่กว่าผู้หญิงในงานนี้ ในกรณีดังกล่าวการกระจายของคะแนนชายจะมุ่งไปที่ค่าเฉลี่ยต่ำในขณะที่การแจกแจงคะแนนหญิงจะอยู่กึ่งกลางค่าเฉลี่ยสูง สถานการณ์นี้จะสอดคล้องกับพล็อตด้านบนเนื่องจากผู้ชายจะมีโอกาสสูงที่จะได้รับคะแนนต่ำกว่า

หากการทดสอบเสื้อยืดออกมามีนัยสำคัญฉันจะสรุปได้ว่าคะแนนผู้หญิงโดยเฉลี่ยสูงกว่าเพศชายอย่างมีนัยสำคัญ หรือในแง่ของประชากรคะแนนหญิงมาจากประชากรที่มีค่าเฉลี่ยสูงกว่าประชากรชายซึ่งฟังดูคล้ายกับข้อสรุปของแคนซัสว่ามาจากประชากรที่แตกต่างกัน

ความแตกต่างคืออะไร?

ดังนั้นข้อสรุปฉันจะวาดทั้งใน KS และกรณีทดสอบ t เหมือนกัน เพศชายทำงานได้ไม่ดีเมื่อเทียบกับเพศหญิง ดังนั้นประโยชน์ของการใช้การทดสอบหนึ่งการทดสอบอื่น ๆ คืออะไร? มีความรู้ใหม่ที่คุณสามารถได้รับจากการใช้การทดสอบ KS หรือไม่?

วิธีที่ฉันเห็นมันเพศผู้ที่มีการกระจายอยู่กึ่งกลางที่มีค่าเฉลี่ยต่ำและผู้หญิงที่อยู่ตรงกลางที่มีค่าเฉลี่ยสูงคือสิ่งที่ทำให้การทดสอบ t สำคัญ แต่ด้วยความจริงเดียวกันนี้ผู้ชายจะมีโอกาสสูงกว่าในการทำคะแนนให้ต่ำลงซึ่งจะทำให้พล็อตมีลักษณะเหมือนด้านบนและให้การทดสอบ KS ที่สำคัญ ดังนั้นผลลัพธ์ของการทดสอบทั้งสองมีสาเหตุที่เหมือนกัน แต่อาจมีใครโต้แย้งได้ว่าการทดสอบ KS นั้นคำนึงถึงมากกว่าวิธีการแจกแจงและพิจารณารูปร่างของการกระจายตัวด้วย แต่มันเป็นไปได้ที่จะแยกสาเหตุ ของการทดสอบ KS ที่สำคัญจากเพียงผลการทดสอบ?

ดังนั้นค่าในการดำเนินการทดสอบ KS มากกว่าที่ทดสอบคืออะไร? และสมมุติว่าฉันสามารถทำตามสมมติฐานของการทดสอบ t สำหรับคำถามนี้ได้


t-test แบบดั้งเดิมนั้นมีขนาดเล็กกว่าการวิเคราะห์ข้อมูลแบบเบย์ลองดู "การคาดคะเนแบบเบย์ของ John Kruschke แทนที่การทดสอบแบบ t" indiana.edu/~kruschke/BEST/BEST.pdf
Vladislavs Dovgalecs

ฉันไม่แน่ใจว่าการทดสอบ KS นั้นเกี่ยวข้องกับวิธีการแบบเบย์อย่างไร?
Simon

เพียงหยุดใช้ KS และ t-test
Vladislavs Dovgalecs

4
@xeon หากคุณจะสร้างข้อความที่แข็งแกร่งเช่นนี้คุณก็ควรให้การสนับสนุนพวกเขาดีกว่า คำแนะนำของคุณจะไม่มีประโยชน์ในการยกตัวอย่างความแตกต่างในคำตอบของฉัน ทำไมคนเราควรละทิ้งแนวทางที่ชัดเจนในการจำแนกความแตกต่างนี้ในการแจกแจงแก่คนที่ไม่ชอบ?
Glen_b -Reinstate Monica

1
@Glen_b นั่นเป็นเหตุผลที่เขียนความคิดเห็นไม่ใช่คำตอบ อาจเป็น OP ไม่ได้อ่านกระดาษที่ดีมาก btw; ฉันแค่อยากจะแนะนำ แต่ฉันเห็นด้วยว่าฉันออกแถลงการณ์ที่แรงเกินไปและประพฤติตัวหยิ่งน้อย ฉันขอโทษที่เป็นคนหยาบคาย จะไม่เกิดขึ้นอีก
Vladislavs Dovgalecs

คำตอบ:


19

เป็นตัวอย่างของสาเหตุที่คุณต้องการใช้ตัวอย่าง Kolmogorov-Smirnov สองตัวอย่าง:

ลองนึกภาพว่าค่าเฉลี่ยประชากรคล้ายกัน แต่ความแปรปรวนแตกต่างกันมาก การทดสอบ Kolmogorov-Smirnov สามารถเลือกความแตกต่างนี้ได้ แต่การทดสอบ t ไม่สามารถทำได้

หรือลองนึกภาพว่าการแจกแจงมีวิธีการที่คล้ายกันและ sd แต่ตัวผู้มีการกระจาย bimodal (สีแดง) ในขณะที่ตัวเมีย (สีน้ำเงิน) ไม่มี:

ป้อนคำอธิบายรูปภาพที่นี่

ผู้ชายและผู้หญิงทำงานต่างกันหรือไม่? ใช่ - ตัวผู้มีแนวโน้มที่จะทำคะแนนประมาณ 7.5-8 หรือ 12.5-13 ในขณะที่ตัวเมียมักจะทำคะแนนไปทางกลางมากขึ้น (ใกล้ 10 หรือมากกว่านั้น) แต่จะรวมกลุ่มกันน้อยกว่าค่าสองค่า เพศชายมักจะทำคะแนนใกล้กับ

ดังนั้น Kolmogorov-Smirnov สามารถค้นหาความแตกต่างทั่วไปในการแจกแจงได้มากกว่าแบบทดสอบ t


อ่าเข้าใจแล้ว ฉันขอขยายตรรกะนั้นและบอกว่าถ้าการทดสอบแบบ t มีความสำคัญการทดสอบ KS ก็น่าจะมีความสำคัญเช่นกันอย่างไรก็ตามอาจเป็นเพราะความแตกต่างเฉลี่ยและ / หรือความแตกต่างอื่น ๆ ทดสอบยากไหม ดังนั้นการทดสอบ KS มีประโยชน์จริง ๆ ในกรณีที่ไม่มีความแตกต่างระหว่างสองกลุ่มเท่านั้นหรือไม่?
Simon

t-test มีความอ่อนไหวต่อความแตกต่างของค่าเฉลี่ยมากขึ้น (โดยเฉพาะอย่างยิ่งถ้าการกระจายของประชากรใกล้เคียงปกติโดยมีค่าเบี่ยงเบนมาตรฐานใกล้เคียงกัน) การทดสอบ KS นั้นยากที่จะตีความ แต่ฉันจะไม่เห็นด้วยกับประโยคสุดท้ายของคุณ คุณอาจมีความแตกต่างเล็กน้อยในวิธีการที่มาพร้อมกับความแตกต่างอื่น ๆ t-test มีความแตกต่างในการแจ้งให้ทราบเท่านั้นในขณะที่การทดสอบ KS สามารถแจ้งให้ทราบได้จากความแตกต่างอื่น ๆ ลองนึกภาพตัวอย่างด้านบน แต่ในกรณีที่มีการเปลี่ยนแปลงเล็กน้อยเช่นกัน t-test อาจไม่สามารถรับความแตกต่างได้อย่างง่ายดายเช่นเดียวกับการทดสอบ KS
Glen_b -Reinstate Monica

@Glen_b: ถูกต้องไหมที่จะบอกว่า KS ทดสอบว่าการแจกแจงนั้นเท่ากันหรือไม่ในขณะที่การทดสอบ t-test ว่าการแจกแจงนั้นมีค่าเฉลี่ยเท่ากันหรือไม่

@fcop ใช่และไม่ใช่; จากสมมติฐานและภายใต้ค่าว่าง t-test ความแปรปรวนที่เท่ากันโดยทั่วไปคือการทดสอบตัวตนของการแจกแจงเช่นกัน - มันเป็นเรื่องทั่วไปของทางเลือก (รวมกับสมมติฐาน) ที่ทำให้พวกมันแตกต่าง แน่นอนว่าเราสามารถ (และโดยทั่วไปแล้ว) ใช้การทดสอบเมื่อสมมติฐานของพวกเขาไม่ได้นำมาใช้และจากนั้นเราจะดูพฤติกรรมของพวกเขามากขึ้นภายใต้โมฆะและทางเลือก t-test นั้นมีแนวโน้มที่จะอ่อนไหวต่อการเปลี่ยนแปลงค่าเฉลี่ยภายใต้ทางเลือกในขณะที่ KS นั้นค่อนข้างอ่อนไหวต่อทางเลือกในวงกว้างมาก
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.