วิธีการทดสอบความแตกต่างระหว่างสองกลุ่มหมายถึงเมื่อข้อมูลไม่กระจายตามปกติ?

19

ฉันจะกำจัดรายละเอียดและการทดลองทางชีวภาพทั้งหมดและเสนอราคาเพียงปัญหาในมือและสิ่งที่ฉันทำทางสถิติ ฉันอยากจะรู้ว่ามันถูกต้องหรือไม่และจะทำอย่างไรต่อไป หากข้อมูล (หรือคำอธิบายของฉัน) ไม่ชัดเจนเพียงพอฉันจะพยายามอธิบายให้ดีขึ้นโดยแก้ไข

สมมติว่าฉันมีสองกลุ่ม / สังเกต X และ Y มีขนาด $N_x=215$ และ $N_y=40$ 40ฉันต้องการทราบว่าค่าเฉลี่ยของการสังเกตทั้งสองนี้เท่ากันหรือไม่ คำถามแรกของฉันคือ:

หากสมมติฐานเป็นที่พอใจจะต้องใช้การทดสอบสองตัวอย่างพารามิเตอร์ที่นี่? ฉันถามสิ่งนี้เพราะจากความเข้าใจของฉันมันมักจะใช้เมื่อขนาดเล็ก?
ฉันพล็อตฮิสโทแกรมของทั้ง X และ Y และพวกมันไม่ได้กระจายตามปกติซึ่งเป็นหนึ่งในสมมติฐานของการทดสอบสองตัวอย่าง ความสับสนของฉันคือว่าฉันคิดว่าพวกเขาเป็นสองประชากรและนั่นคือเหตุผลที่ฉันตรวจสอบการกระจายปกติ แต่ฉันกำลังจะทำการทดสอบสองตัวอย่าง ... นี่ถูกไหม?
จากทฤษฎีบทขีด จำกัด กลางฉันเข้าใจว่าถ้าคุณทำการสุ่มตัวอย่าง (โดยมี / ไม่มีการซ้ำซ้อนขึ้นอยู่กับขนาดประชากรของคุณ) หลาย ๆ ครั้งและคำนวณค่าเฉลี่ยของตัวอย่างในแต่ละครั้งมันจะกระจายโดยประมาณปกติ และค่าเฉลี่ยของตัวแปรสุ่มนี้จะเป็นการประมาณค่าเฉลี่ยของประชากรที่ดี ดังนั้นฉันจึงตัดสินใจทำทั้ง X และ Y 1,000 ครั้งและได้รับตัวอย่างและฉันกำหนดตัวแปรสุ่มให้กับค่าเฉลี่ยของแต่ละตัวอย่าง พล็อตนั้นกระจายตามปกติอย่างมาก ค่าเฉลี่ยของ X และ Y เท่ากับ 4.2 และ 15.8 (ซึ่งเหมือนกับประชากร + - 0.15) และความแปรปรวนเท่ากับ 0.95 และ 12.11
ฉันทำการทดสอบ t-test สำหรับการสังเกตทั้งสองนี้ (1,000 จุดข้อมูลแต่ละจุด) ด้วยความแปรปรวนที่ไม่เท่ากันเนื่องจากมันแตกต่างกันมาก (0.95 และ 12.11) และสมมติฐานว่างถูกปฏิเสธ
มันสมเหตุสมผลหรือไม่? นี่เป็นวิธีที่ถูกต้อง / มีความหมายหรือการทดสอบซีสองตัวอย่างนั้นเพียงพอหรือผิดทั้งหมดหรือไม่?
ฉันยังได้ทำการทดสอบแบบวิลคอกซันแบบไม่มีพารามิเตอร์เพื่อให้แน่ใจว่า (บน X และ Y ดั้งเดิม) และสมมติฐานว่างก็ถูกปฏิเสธเช่นกัน ในกรณีที่วิธีการก่อนหน้านี้ของฉันผิดอย่างสิ้นเชิงฉันคิดว่าการทดสอบแบบไม่มีพารามิเตอร์นั้นดียกเว้นกำลังทางสถิติ

ในทั้งสองกรณีวิธีการที่แตกต่างกันอย่างมีนัยสำคัญ อย่างไรก็ตามฉันต้องการทราบว่าวิธีใดวิธีหนึ่งหรือทั้งสองอย่างผิดพลาด / ผิดทั้งหมดหรือไม่ถ้าเป็นเช่นนั้นทางเลือกคืออะไร?

— อรุณ
แหล่งที่มา

21

แนวคิดที่ว่า t-test นั้นมีไว้สำหรับกลุ่มตัวอย่างขนาดเล็กเท่านั้น ใช่มันถูกพัฒนามาสำหรับตัวอย่างเล็ก ๆ แต่ไม่มีอะไรในทฤษฎีที่แยกความแตกต่างเล็ก ๆ จากใหญ่ ในวันก่อนที่คอมพิวเตอร์เป็นเรื่องธรรมดาสำหรับการทำสถิติตาราง t มักจะขึ้นไปประมาณ 30 องศาของความเป็นอิสระและปกติจะใช้เกินกว่าที่เป็นประมาณใกล้กระจาย t นี่คือเพื่อความสะดวกในการรักษาขนาดของโต๊ะทีเหมาะสม ตอนนี้กับคอมพิวเตอร์เราสามารถทำการทดสอบแบบทีสำหรับขนาดตัวอย่างใดก็ได้ (แม้ว่าสำหรับกลุ่มตัวอย่างขนาดใหญ่มากความแตกต่างระหว่างผลลัพธ์ของการทดสอบซีกับการทดสอบทีมีขนาดเล็กมาก) แนวคิดหลักคือการใช้การทดสอบทีเมื่อใช้ตัวอย่างเพื่อประเมินค่าเบี่ยงเบนมาตรฐานและการทดสอบซีหากการเบี่ยงเบนมาตรฐานประชากรเป็นที่รู้จัก (หายากมาก)

ทฤษฎีขีด จำกัด กลางช่วยให้เราใช้การอนุมานทฤษฎีปกติ (การทดสอบ t ในกรณีนี้) แม้ว่าประชากรจะไม่กระจายตามปกติตราบใดที่ขนาดตัวอย่างมีขนาดใหญ่พอ นี่หมายความว่าการทดสอบของคุณเป็นค่าประมาณ (แต่ด้วยขนาดตัวอย่างของคุณการประเมินจะดีมาก)

การทดสอบ Wilcoxon ไม่ใช่การทดสอบวิธีการ (เว้นแต่คุณจะรู้ว่าประชากรนั้นสมมาตรอย่างสมบูรณ์ ถ้าค่าเฉลี่ยเป็นประเด็นหลักที่น่าสนใจการทดสอบ t น่าจะเป็นวิธีที่ดีกว่าในการพูด

เนื่องจากความเบี่ยงเบนมาตรฐานของคุณแตกต่างกันมากและรูปร่างไม่ปกติและอาจแตกต่างจากกันความแตกต่างของค่าเฉลี่ยอาจไม่ใช่สิ่งที่น่าสนใจที่สุดที่เกิดขึ้นที่นี่ คิดเกี่ยวกับวิทยาศาสตร์และสิ่งที่คุณต้องการจะทำอย่างไรกับผลลัพธ์ของคุณ มีการตัดสินใจในระดับประชากรหรือระดับบุคคลหรือไม่? ลองนึกถึงตัวอย่างนี้: คุณกำลังเปรียบเทียบยา 2 ตัวกับโรคหนึ่งยากับตัวอย่างครึ่งหนึ่งเสียชีวิตทันทีอีกครึ่งหนึ่งหายในประมาณหนึ่งสัปดาห์ สำหรับยา B ทุกคนรอดชีวิตและหายดี แต่เวลาในการฟื้นตัวนานกว่าหนึ่งสัปดาห์ ในกรณีนี้คุณจะสนใจจริงๆว่าเวลาในการกู้คืนสั้นลงหรือไม่? หรือแทนที่ครึ่งที่ตายใน A ด้วยการใช้เวลานานในการกู้คืน (นานกว่าใครในกลุ่ม B)

— เกร็กสโนว์
แหล่งที่มา

ขอบคุณเกรก ฉันคิดว่าไม่มีอะไรผิดปกติกับขั้นตอนการทำ se? ฉันเข้าใจว่าฉันอาจไม่ได้ถามคำถามที่ถูกต้อง แต่ข้อกังวลของฉันมีความเท่าเทียมกันเกี่ยวกับการทดสอบทางสถิติ / ขั้นตอนและทำความเข้าใจกับตัวอย่างที่สอง ฉันจะตรวจสอบว่าฉันถามคำถามที่ถูกต้องและกลับมาพร้อมคำถามหากมี บางทีถ้าฉันอธิบายปัญหาทางชีวภาพมันจะช่วยให้มีคำแนะนำเพิ่มเติม ขอบคุณอีกครั้ง.

— อรุณ

5

นอกจากคำตอบที่ครอบคลุมของเกร็กแล้วหนึ่งข้อ

ถ้าฉันเข้าใจคุณอย่างถูกต้องประเด็นที่ 3 ของคุณจะระบุขั้นตอนต่อไปนี้:

$n$ $X$
$m$ $n$
ทำซ้ำ 1,000 ครั้งนี้บันทึกวิธีที่เกี่ยวข้อง
$X$

ทีนี้สมมติฐานของคุณคือ, นั่นหมายความว่าทฤษฎีบทขีด จำกัด กลางมีไว้และตัวแปรสุ่มที่สอดคล้องกันจะกระจายตามปกติ

บางทีเรามาดูคณิตศาสตร์ที่อยู่เบื้องหลังการคำนวณของคุณเพื่อระบุข้อผิดพลาด:

เราจะโทรหาตัวอย่างของคุณ $X$ $X_1,\ldots,X_n$ $X_1,\ldots, X_n\sim X$ $m$ $k$

Y_{k} = \frac{1}{m} \sum_{i = 1}^{m} X_{μ_{i}^{k}}

$Y_k=\frac{1}{m}\sum_{i=1}^m X_{\mu^k_{i}}$

$\mu^k_i$ $n$ $i$

\frac{1}{1000} \sum_{k = 1}^{1000} \frac{1}{m} \sum_{i = 1}^{m} X_{μ_{i}^{k}}

$\frac{1}{1000}\sum_{k=1}^{1000} \frac{1}{m}\sum_{i=1}^m X_{\mu^k_{i}}$

$X_i$ $1000m$ $1000m$ $X_i$ ด้วยน้ำหนักแบบสุ่ม

อย่างไรก็ตามทฤษฎีบทขีด จำกัด กลางระบุว่าผลรวมของตัวแปรสุ่มอิสระจำนวนมากเป็นเรื่องปกติ (ซึ่งส่งผลให้ยังเป็นค่าเฉลี่ยประมาณปกติ)

ยอดรวมของคุณด้านบนไม่ได้สร้างตัวอย่างอิสระ คุณอาจมีน้ำหนักแบบสุ่ม แต่นั่นไม่ได้ทำให้ตัวอย่างของคุณเป็นอิสระเลย ดังนั้นขั้นตอนที่เขียนใน 3 จึงไม่ถูกกฎหมาย

$t$

— Thilo
แหล่งที่มา

ขอขอบคุณ. ดูเหมือนว่าการทดสอบ t จะดูแลปัญหาโดยใช้ CLT (จากคำตอบของ greg ที่ฉันมองข้ามไป) ขอบคุณสำหรับการชี้ให้เห็นและคำอธิบายที่ชัดเจนของ 3) ซึ่งเป็นสิ่งที่ฉันอยากรู้ ฉันจะต้องใช้เวลามากขึ้นในการเข้าใจแนวคิดเหล่านี้

— อรุณ

2

โปรดทราบว่า CLT ทำงานได้ดีแตกต่างกันไปขึ้นอยู่กับการกระจายในมือ (หรือยิ่งแย่กว่านั้นค่าที่คาดหวังหรือความแปรปรวนของการกระจายไม่มีอยู่ - CLT นั้นไม่ถูกต้อง) หากมีข้อสงสัยคุณควรสร้างการแจกแจงที่มีลักษณะคล้ายกับที่คุณสังเกตเห็นและจำลองการทดสอบโดยใช้การแจกแจงนี้สองสามร้อยครั้ง คุณจะรู้สึกถึงคุณภาพของอุปกรณ์ที่ใช้ในการประมาณ CLT

— Thilo