ฉันจะทดสอบได้อย่างไรว่าการแจกแจงสองแบบ (ไม่ปกติ) แตกต่างกันอย่างไร


13

ฉันได้อ่านเกี่ยวกับการทดสอบของนักเรียนแล้ว แต่ดูเหมือนว่าจะใช้งานได้เมื่อเราสามารถสันนิษฐานได้ว่าการแจกแจงดั้งเดิมจะกระจายอยู่ตามปกติ ในกรณีของฉันพวกเขาไม่แน่นอน

นอกจากนี้หากฉันมีการแจกแจง 13 ครั้งฉันต้องทำแบบ13^2ทดสอบหรือไม่?

นี่คือตัวอย่างของการแจกแจงสองครั้ง  มีการแจกแจง 13 รายการ


@Glen_b ข้อมูลไม่ต่อเนื่อง ช่วงค่าตั้งแต่ -2 ถึง 2
Martin Velez

คำตอบ:


19

มีหลายความรู้สึกที่ "มันขึ้นอยู่กับ"

(ข้อกังวลที่อาจเกิดขึ้นอย่างหนึ่งคือดูเหมือนว่าข้อมูลต้นฉบับอาจจะไม่ต่อเนื่องซึ่งควรได้รับการชี้แจง)

  1. ขึ้นอยู่กับขนาดของกลุ่มตัวอย่างความไม่ธรรมดาอาจไม่เป็นประเด็นใหญ่เท่ากับการทดสอบที สำหรับตัวอย่างขนาดใหญ่อย่างน้อยก็มีระดับความแข็งแกร่งที่ดีโดยทั่วไป - อัตราความผิดพลาดประเภทที่ 1 ไม่ควรได้รับผลกระทบมากเกินไปหากอยู่ไม่ไกลจากปกติ พลังงานอาจมีปัญหามากขึ้นกับก้อยหนัก

  2. หากคุณกำลังมองหาความแตกต่างของการแจกแจงความดีแบบสองตัวอย่างของการทดสอบแบบพอดีเช่นการทดสอบ Kolmogorov-Smirnov สองตัวอย่างอาจเหมาะสม (แม้ว่าการทดสอบอื่น ๆ อาจทำได้แทน)

  3. หากคุณกำลังมองหาความแตกต่างของประเภทสถานที่ตั้งในตระกูลที่ตั้งหรือความแตกต่างของสเกลในตระกูลสเกลหรือแม้แต่แค่ความสัมพันธ์แบบ P (X> Y)> P (Y> X) ความสัมพันธ์แบบ Wilcoxon-Mann-Whitney การทดสอบตัวอย่างสองรายการอาจเหมาะสม

  4. คุณอาจพิจารณาการทดสอบการสุ่มตัวอย่างเช่นการเปลี่ยนรูปหรือการทดสอบ bootstrap หากคุณสามารถหาสถิติที่เหมาะสมสำหรับประเภทของความแตกต่างที่คุณต้องการให้มีความไว

นอกจากนี้หากฉันมีการแจกแจง 13 ครั้งฉันจำเป็นต้องทำการทดสอบ 13 ^ 2 หรือไม่

ดีไม่มี

ประการแรกคุณไม่จำเป็นต้องทดสอบกับและกับ (การเปรียบเทียบครั้งที่สองซ้ำซ้อน)AB BA

ประการที่สองคุณไม่จำเป็นต้องทดสอบVSAA

ทั้งสองสิ่งนั้นตัดการเปรียบเทียบตามจำนวนคู่จาก 169 เป็น 78

ประการที่สามมันจะเป็นเรื่องปกติมากขึ้น (แต่ไม่ใช่ภาคบังคับ) ในการทดสอบรวมสำหรับความแตกต่างใด ๆและจากนั้นอาจจะดูความแตกต่างแบบคู่ในการทดสอบแบบคู่หลังแบบเฉพาะกิจถ้าโมฆะตัวแรกถูกปฏิเสธ

ตัวอย่างเช่นแทนที่ Wilcoxon-Mann-Whitney เช่นเดียวกับข้อ 3 ข้างต้นหนึ่งอาจทำการทดสอบ Kruskal-Wallis ซึ่งมีความอ่อนไหวต่อความแตกต่างของตำแหน่งระหว่างกลุ่ม

นอกจากนี้ยังมีตัวอย่าง k-sample ของการทดสอบ Kolmogorov-Smirnovและการทดสอบที่คล้ายคลึงกันของความดีงามอีกสองตัวอย่างของการทดสอบแบบพอดีอาจมีอยู่หรือถูกสร้างขึ้น

นอกจากนี้ยังมีการทดสอบการสุ่มตัวอย่างรุ่น k-sample และการทดสอบ t (เช่น ANOVA ซึ่งอาจไม่เป็นไรหากขนาดตัวอย่างมีขนาดใหญ่พอสมควร)


มันจะดีจริงๆที่จะได้รับข้อมูลเพิ่มเติมเกี่ยวกับสิ่งที่เรากำลังเผชิญอยู่และความแตกต่างที่คุณสนใจมากที่สุด หรือล้มเหลวนั้นเพื่อดู QQ แปลงของตัวอย่างบางส่วน


(+1) เช่นเดียวกับที่เพิ่มว่าการทดสอบ WMW มีการตีความเป็นการทดสอบสำหรับการปกครองแบบสุ่มถ้าคุณพร้อมที่จะสมมติว่าประชากร CDF ไม่ข้าม คน IMO มักจะต้องการสิ่งนั้นมากกว่าหากพวกเขารู้
Scortchi - Reinstate Monica

1
@Scortchi - ใช่ มันยังมีการตีความอื่น ๆ เช่นกัน; มากที่สุดในวงกว้างจะเป็นการทดสอบของ{2} ในทางกลับกันผู้คนควรตระหนักถึงคุณสมบัติที่ไม่ไวต่อความรู้สึก P(X<Y)12
Glen_b -Reinstate Monica

@Glen_b ข้อมูลไม่ต่อเนื่อง ค่าอยู่ในช่วง -2 ถึง 2
Martin Velez

ว้าว - ข้อมูลสำคัญ! พวกมันถูกผูกไว้กับช่วงนั้นหรือไม่ (2.1 เป็นไปไม่ได้) หรือเกิดขึ้นว่าค่านั้นอยู่ในช่วงนั้นหรือไม่?
Glen_b -Reinstate Monica

พวกมันถูก จำกัด ขอบเขตไว้
Martin Velez

5

ใช่ฉันคิดว่าคุณไม่สามารถทำได้ดีกว่าการทดสอบการกระจายแต่ละครั้งกับคนอื่น ๆ ...

หากคิดว่าคำถามของคุณเกี่ยวข้องกับเรื่องนี้: การเปรียบเทียบการแจกแจง 2 แบบ

คุณแนะนำให้คุณใช้การทดสอบ Kolmogorov-Sminorv หรือการทดสอบCramér-Von Mises พวกเขาทั้งสองแบบทดสอบเพียงพอมาก

ในRฟังก์ชั่นks.testในแพคเกจสถิติดำเนินการครั้งแรก cramerคนที่สองสามารถพบได้ในแพคเกจเช่น

หากต้องการเรียนรู้เกี่ยวกับการทดสอบทั้งสองนี้: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion


2

คุณสามารถลองการวิเคราะห์ความแปรปรวนทางเดียว Kruskal – Wallis

"ใช้สำหรับเปรียบเทียบตัวอย่างมากกว่าสองตัวอย่างที่เป็นอิสระหรือไม่เกี่ยวข้อง"

การละเมิดปกติใน ANOVA ถูกกล่าวถึงใน
Rutherford แนะนำ Anova และ Ancova: แนวทาง GLM 9.1.2 การละเมิด Normality

บรรทัดแรกมี "แม้ว่าแหล่งข้อมูลส่วนใหญ่จะรายงาน ANOVA ... ว่ามีความแข็งแกร่งเมื่อเทียบกับการละเมิดข้อสันนิษฐานทั่วไป ... "


ขอบคุณ! ดูเหมือนว่าเราควรทำการทดสอบนี้ก่อนทำการเปรียบเทียบแบบเป็นคู่
Martin Velez
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.