ขนาดตัวอย่างที่เล็กและไม่สมดุลสำหรับสองกลุ่ม - จะทำอย่างไร?


10

ฉันมีข้อมูลสำหรับสองกลุ่ม (ตัวอย่างเช่น) ฉันต้องการเปรียบเทียบ แต่ขนาดตัวอย่างทั้งหมดมีขนาดเล็ก (n = 29) และไม่สมดุลอย่างยิ่ง (n = 22 vs n = 7)

ข้อมูลเหล่านี้ยากต่อการรวบรวมและมีราคาแพงดังนั้นในขณะที่ 'รวบรวมข้อมูลเพิ่มเติม' เนื่องจากวิธีการแก้ปัญหาที่ชัดเจนนั้นไม่มีประโยชน์ในกรณีนี้

มีการวัดตัวแปรที่แตกต่างกันจำนวนหนึ่ง (วันที่ออกเดินทางวันที่เดินทางมาถึงระยะเวลาของการย้ายถิ่นเป็นต้น) ดังนั้นจึงมีการทดสอบหลายรายการซึ่งบางส่วนของผลต่างนั้นแตกต่างกันมาก (ตัวอย่างขนาดเล็กที่มีความแปรปรวนสูงกว่า)

ในขั้นต้นเพื่อนร่วมงานได้ทำการทดสอบแบบ t บนข้อมูลเหล่านี้และบางรายการมีนัยสำคัญทางสถิติกับ P <0.001 และอีกอันไม่สำคัญกับ P = 0.069 ตัวอย่างบางส่วนถูกแจกจ่ายตามปกติ แต่บางกลุ่มก็ไม่ได้ การทดสอบบางอย่างเกี่ยวข้องกับการออกเดินทางครั้งใหญ่จากความแปรปรวน 'เท่ากัน'

ฉันมีคำถามหลายข้อ:

  1. การทดสอบ t เหมาะสมที่นี่ ถ้าไม่ทำไม สิ่งนี้ใช้เฉพาะกับการทดสอบที่สมมติฐานของความปกติและความเสมอภาคของผลต่างมีความพึงพอใจหรือไม่
  2. ทางเลือกที่เหมาะสมคืออะไร บางทีการทดสอบการเปลี่ยนรูป?
  3. ความแปรปรวนไม่เท่ากันทำให้เกิดข้อผิดพลาด Type I ได้อย่างไร แต่อย่างไร และขนาดตัวอย่างที่เล็กและไม่สมดุลนั้นมีผลกระทบอย่างไรกับข้อผิดพลาด Type I

คำตอบ:


11

การทดสอบ T ที่ถือว่ามีความแปรปรวนเท่ากันของประชากรสองคนนั้นไม่ถูกต้องเมื่อประชากรสองคนมีความแปรปรวนต่างกันและแย่กว่าสำหรับขนาดตัวอย่างที่ไม่เท่ากัน หากขนาดตัวอย่างที่เล็กที่สุดคือขนาดที่มีความแปรปรวนสูงสุดการทดสอบจะมีข้อผิดพลาด Type I ที่สูงเกินจริง ในทางกลับกันเวอร์ชันของ Welch-Satterthwaite ของ t-test นั้นไม่ถือว่ามีความแปรปรวนเท่ากัน หากคุณกำลังคิดว่าการทดสอบการเปลี่ยนแปลงของ Fisher-Pitman มันจะถือว่ามีความแปรปรวนเท่ากัน (ถ้าคุณต้องการอนุมานวิธีที่ไม่เท่ากันจากค่า p ต่ำ)

มีอีกหลายสิ่งที่คุณอาจต้องการคิดถึง:

(1) ถ้าความแปรปรวนไม่ชัดเจนคุณยังคงสนใจในความแตกต่างระหว่างค่าเฉลี่ยหรือไม่

(2) การคาดคะเนผลกระทบอาจมีประโยชน์กับคุณมากกว่าค่า p หรือไม่

(3) คุณต้องการพิจารณาลักษณะหลายตัวแปรของข้อมูลของคุณมากกว่าแค่ทำการเปรียบเทียบแบบหลายตัวแปรหรือไม่?


สวัสดี Scortchi ขอบคุณสำหรับการตอบกลับของคุณ ฉันได้พิจารณาคำถามที่คุณโพสต์แล้ว:
DeanP

2
(1) ทั้งความแปรปรวนและค่าเฉลี่ยสามารถให้ข้อมูลสำหรับการศึกษาของเรา (เช่นวันที่ย้ายออกอาจจะมีความหมายสำหรับประชากรหนึ่งคนในภายหลังและช่วงในวันที่ออกเดินทางนั้นแปรปรวนมากขึ้น)
DeanP

3
(1) เพิ่งกล่าวถึงเพราะผู้คนมักจะเห็นความแตกต่างที่ไม่เท่ากันเพียงอย่างเดียวเป็นปัญหาทางเทคนิคและลืมมันเป็นข้อเท็จจริงที่น่าสนใจในสิทธิของตนเอง
Scortchi - Reinstate Monica

2
(2) ประเด็นของฉันคือยิ่งกว่านั้นรายการของค่า p โดยทั่วไปมีประโยชน์น้อยกว่ารายการของการประเมินขนาดของเอฟเฟกต์ โดยเฉพาะอย่างยิ่งกับกลุ่มตัวอย่างขนาดเล็กช่วงความเชื่อมั่นสามารถแสดงได้ว่าขนาดผลกระทบของความสำคัญในทางปฏิบัติยังคงสอดคล้องกับข้อมูลแม้ว่าค่า p-value จะสูงหรือไม่
Scortchi - Reinstate Monica

2
(3) ฉันกำลังคิดถึงตัวแปรอิสระหนึ่งตัว (กลุ่ม) และตัวแปรตาม (การโยกย้าย & c.): ความแตกต่างที่น่าสนใจระหว่างกลุ่มอาจเป็นการเปลี่ยนแปลงความสัมพันธ์ระหว่างตัวแปรตาม ขั้นตอนแรกจะเป็นเมทริกซ์ที่ดีที่มี boxplots หรือ dotplots เปรียบเทียบแต่ละ dv ระหว่างกลุ่มตามแนวทแยงมุม & scatterplots สำหรับ dvs แต่ละคู่ (แยกกลุ่มอีกครั้ง) ในเซลล์อื่น และตามจริงแล้วสำหรับการวิเคราะห์เชิงสำรวจที่มีขนาดตัวอย่างเล็ก ๆ นั่นอาจเป็นขั้นตอนสุดท้าย
Scortchi - Reinstate Monica

1

ข้อแรกอย่างที่ Scortchi ชี้ให้เห็นแล้วการทดสอบ T นั้นไม่เหมาะกับข้อมูลของคุณมากนักเนื่องจากสมมติฐานในการกระจายข้อมูล

จนถึงจุดที่สองของคุณฉันจะเสนอทางเลือกอื่นสำหรับการทดสอบ T หากความสนใจของคุณเป็นเรื่องเกี่ยวกับความจริงเท่านั้นหากการแจกแจงตัวอย่างสองตัวอย่างของคุณเท่ากันหรือไม่คุณสามารถลองใช้การทดสอบผลรวมอันดับวิลคอกซันรุ่นสองด้านได้ การทดสอบยศรวมของ Wilcoxon เป็นการทดสอบที่ไม่ใช้พารามิเตอร์ การทดสอบประเภทนี้มีประโยชน์อย่างยิ่งหากคุณไม่แน่ใจเกี่ยวกับการเผยแพร่ข้อมูลของคุณ

มันมีคำตอบที่แน่นอนของการทดสอบสำหรับตัวอย่างขนาดเล็กและสำหรับกลุ่มใหญ่ นอกจากนี้ยังมีแพ็คเกจ Rซึ่งตระหนักถึงการทดสอบยศรวมของ Wilcoxon

เนื่องจากเป็นการทดสอบแบบไม่มีพารามิเตอร์และยังรองรับขนาดตัวอย่างขนาดเล็กการทดสอบจึงเหมาะสำหรับกรณีทดสอบของคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.