วิธีการทดสอบความแตกต่างระหว่างสองกลุ่มหมายถึงเมื่อข้อมูลไม่กระจายตามปกติ?


19

ฉันจะกำจัดรายละเอียดและการทดลองทางชีวภาพทั้งหมดและเสนอราคาเพียงปัญหาในมือและสิ่งที่ฉันทำทางสถิติ ฉันอยากจะรู้ว่ามันถูกต้องหรือไม่และจะทำอย่างไรต่อไป หากข้อมูล (หรือคำอธิบายของฉัน) ไม่ชัดเจนเพียงพอฉันจะพยายามอธิบายให้ดีขึ้นโดยแก้ไข

สมมติว่าฉันมีสองกลุ่ม / สังเกต X และ Y มีขนาดNx=215และNy=40 40 ฉันต้องการทราบว่าค่าเฉลี่ยของการสังเกตทั้งสองนี้เท่ากันหรือไม่ คำถามแรกของฉันคือ:

  1. หากสมมติฐานเป็นที่พอใจจะต้องใช้การทดสอบสองตัวอย่างพารามิเตอร์ที่นี่? ฉันถามสิ่งนี้เพราะจากความเข้าใจของฉันมันมักจะใช้เมื่อขนาดเล็ก?

  2. ฉันพล็อตฮิสโทแกรมของทั้ง X และ Y และพวกมันไม่ได้กระจายตามปกติซึ่งเป็นหนึ่งในสมมติฐานของการทดสอบสองตัวอย่าง ความสับสนของฉันคือว่าฉันคิดว่าพวกเขาเป็นสองประชากรและนั่นคือเหตุผลที่ฉันตรวจสอบการกระจายปกติ แต่ฉันกำลังจะทำการทดสอบสองตัวอย่าง ... นี่ถูกไหม?

  3. จากทฤษฎีบทขีด จำกัด กลางฉันเข้าใจว่าถ้าคุณทำการสุ่มตัวอย่าง (โดยมี / ไม่มีการซ้ำซ้อนขึ้นอยู่กับขนาดประชากรของคุณ) หลาย ๆ ครั้งและคำนวณค่าเฉลี่ยของตัวอย่างในแต่ละครั้งมันจะกระจายโดยประมาณปกติ และค่าเฉลี่ยของตัวแปรสุ่มนี้จะเป็นการประมาณค่าเฉลี่ยของประชากรที่ดี ดังนั้นฉันจึงตัดสินใจทำทั้ง X และ Y 1,000 ครั้งและได้รับตัวอย่างและฉันกำหนดตัวแปรสุ่มให้กับค่าเฉลี่ยของแต่ละตัวอย่าง พล็อตนั้นกระจายตามปกติอย่างมาก ค่าเฉลี่ยของ X และ Y เท่ากับ 4.2 และ 15.8 (ซึ่งเหมือนกับประชากร + - 0.15) และความแปรปรวนเท่ากับ 0.95 และ 12.11
    ฉันทำการทดสอบ t-test สำหรับการสังเกตทั้งสองนี้ (1,000 จุดข้อมูลแต่ละจุด) ด้วยความแปรปรวนที่ไม่เท่ากันเนื่องจากมันแตกต่างกันมาก (0.95 และ 12.11) และสมมติฐานว่างถูกปฏิเสธ
    มันสมเหตุสมผลหรือไม่? นี่เป็นวิธีที่ถูกต้อง / มีความหมายหรือการทดสอบซีสองตัวอย่างนั้นเพียงพอหรือผิดทั้งหมดหรือไม่?

  4. ฉันยังได้ทำการทดสอบแบบวิลคอกซันแบบไม่มีพารามิเตอร์เพื่อให้แน่ใจว่า (บน X และ Y ดั้งเดิม) และสมมติฐานว่างก็ถูกปฏิเสธเช่นกัน ในกรณีที่วิธีการก่อนหน้านี้ของฉันผิดอย่างสิ้นเชิงฉันคิดว่าการทดสอบแบบไม่มีพารามิเตอร์นั้นดียกเว้นกำลังทางสถิติ

ในทั้งสองกรณีวิธีการที่แตกต่างกันอย่างมีนัยสำคัญ อย่างไรก็ตามฉันต้องการทราบว่าวิธีใดวิธีหนึ่งหรือทั้งสองอย่างผิดพลาด / ผิดทั้งหมดหรือไม่ถ้าเป็นเช่นนั้นทางเลือกคืออะไร?

คำตอบ:


21

แนวคิดที่ว่า t-test นั้นมีไว้สำหรับกลุ่มตัวอย่างขนาดเล็กเท่านั้น ใช่มันถูกพัฒนามาสำหรับตัวอย่างเล็ก ๆ แต่ไม่มีอะไรในทฤษฎีที่แยกความแตกต่างเล็ก ๆ จากใหญ่ ในวันก่อนที่คอมพิวเตอร์เป็นเรื่องธรรมดาสำหรับการทำสถิติตาราง t มักจะขึ้นไปประมาณ 30 องศาของความเป็นอิสระและปกติจะใช้เกินกว่าที่เป็นประมาณใกล้กระจาย t นี่คือเพื่อความสะดวกในการรักษาขนาดของโต๊ะทีเหมาะสม ตอนนี้กับคอมพิวเตอร์เราสามารถทำการทดสอบแบบทีสำหรับขนาดตัวอย่างใดก็ได้ (แม้ว่าสำหรับกลุ่มตัวอย่างขนาดใหญ่มากความแตกต่างระหว่างผลลัพธ์ของการทดสอบซีกับการทดสอบทีมีขนาดเล็กมาก) แนวคิดหลักคือการใช้การทดสอบทีเมื่อใช้ตัวอย่างเพื่อประเมินค่าเบี่ยงเบนมาตรฐานและการทดสอบซีหากการเบี่ยงเบนมาตรฐานประชากรเป็นที่รู้จัก (หายากมาก)

ทฤษฎีขีด จำกัด กลางช่วยให้เราใช้การอนุมานทฤษฎีปกติ (การทดสอบ t ในกรณีนี้) แม้ว่าประชากรจะไม่กระจายตามปกติตราบใดที่ขนาดตัวอย่างมีขนาดใหญ่พอ นี่หมายความว่าการทดสอบของคุณเป็นค่าประมาณ (แต่ด้วยขนาดตัวอย่างของคุณการประเมินจะดีมาก)

การทดสอบ Wilcoxon ไม่ใช่การทดสอบวิธีการ (เว้นแต่คุณจะรู้ว่าประชากรนั้นสมมาตรอย่างสมบูรณ์ ถ้าค่าเฉลี่ยเป็นประเด็นหลักที่น่าสนใจการทดสอบ t น่าจะเป็นวิธีที่ดีกว่าในการพูด

เนื่องจากความเบี่ยงเบนมาตรฐานของคุณแตกต่างกันมากและรูปร่างไม่ปกติและอาจแตกต่างจากกันความแตกต่างของค่าเฉลี่ยอาจไม่ใช่สิ่งที่น่าสนใจที่สุดที่เกิดขึ้นที่นี่ คิดเกี่ยวกับวิทยาศาสตร์และสิ่งที่คุณต้องการจะทำอย่างไรกับผลลัพธ์ของคุณ มีการตัดสินใจในระดับประชากรหรือระดับบุคคลหรือไม่? ลองนึกถึงตัวอย่างนี้: คุณกำลังเปรียบเทียบยา 2 ตัวกับโรคหนึ่งยากับตัวอย่างครึ่งหนึ่งเสียชีวิตทันทีอีกครึ่งหนึ่งหายในประมาณหนึ่งสัปดาห์ สำหรับยา B ทุกคนรอดชีวิตและหายดี แต่เวลาในการฟื้นตัวนานกว่าหนึ่งสัปดาห์ ในกรณีนี้คุณจะสนใจจริงๆว่าเวลาในการกู้คืนสั้นลงหรือไม่? หรือแทนที่ครึ่งที่ตายใน A ด้วยการใช้เวลานานในการกู้คืน (นานกว่าใครในกลุ่ม B)


ขอบคุณเกรก ฉันคิดว่าไม่มีอะไรผิดปกติกับขั้นตอนการทำ se? ฉันเข้าใจว่าฉันอาจไม่ได้ถามคำถามที่ถูกต้อง แต่ข้อกังวลของฉันมีความเท่าเทียมกันเกี่ยวกับการทดสอบทางสถิติ / ขั้นตอนและทำความเข้าใจกับตัวอย่างที่สอง ฉันจะตรวจสอบว่าฉันถามคำถามที่ถูกต้องและกลับมาพร้อมคำถามหากมี บางทีถ้าฉันอธิบายปัญหาทางชีวภาพมันจะช่วยให้มีคำแนะนำเพิ่มเติม ขอบคุณอีกครั้ง.
อรุณ

5

นอกจากคำตอบที่ครอบคลุมของเกร็กแล้วหนึ่งข้อ

ถ้าฉันเข้าใจคุณอย่างถูกต้องประเด็นที่ 3 ของคุณจะระบุขั้นตอนต่อไปนี้:

  • nX
  • mn
  • ทำซ้ำ 1,000 ครั้งนี้บันทึกวิธีที่เกี่ยวข้อง
  • X

ทีนี้สมมติฐานของคุณคือ, นั่นหมายความว่าทฤษฎีบทขีด จำกัด กลางมีไว้และตัวแปรสุ่มที่สอดคล้องกันจะกระจายตามปกติ

บางทีเรามาดูคณิตศาสตร์ที่อยู่เบื้องหลังการคำนวณของคุณเพื่อระบุข้อผิดพลาด:

เราจะโทรหาตัวอย่างของคุณ X X1,,XnX1,,XnXmk

Yk=1mi=1mXμik

μikni

11000k=110001mi=1mXμik

Xi1000m1000mXiด้วยน้ำหนักแบบสุ่ม

อย่างไรก็ตามทฤษฎีบทขีด จำกัด กลางระบุว่าผลรวมของตัวแปรสุ่มอิสระจำนวนมากเป็นเรื่องปกติ (ซึ่งส่งผลให้ยังเป็นค่าเฉลี่ยประมาณปกติ)

ยอดรวมของคุณด้านบนไม่ได้สร้างตัวอย่างอิสระ คุณอาจมีน้ำหนักแบบสุ่ม แต่นั่นไม่ได้ทำให้ตัวอย่างของคุณเป็นอิสระเลย ดังนั้นขั้นตอนที่เขียนใน 3 จึงไม่ถูกกฎหมาย

t


ขอขอบคุณ. ดูเหมือนว่าการทดสอบ t จะดูแลปัญหาโดยใช้ CLT (จากคำตอบของ greg ที่ฉันมองข้ามไป) ขอบคุณสำหรับการชี้ให้เห็นและคำอธิบายที่ชัดเจนของ 3) ซึ่งเป็นสิ่งที่ฉันอยากรู้ ฉันจะต้องใช้เวลามากขึ้นในการเข้าใจแนวคิดเหล่านี้
อรุณ

2
โปรดทราบว่า CLT ทำงานได้ดีแตกต่างกันไปขึ้นอยู่กับการกระจายในมือ (หรือยิ่งแย่กว่านั้นค่าที่คาดหวังหรือความแปรปรวนของการกระจายไม่มีอยู่ - CLT นั้นไม่ถูกต้อง) หากมีข้อสงสัยคุณควรสร้างการแจกแจงที่มีลักษณะคล้ายกับที่คุณสังเกตเห็นและจำลองการทดสอบโดยใช้การแจกแจงนี้สองสามร้อยครั้ง คุณจะรู้สึกถึงคุณภาพของอุปกรณ์ที่ใช้ในการประมาณ CLT
Thilo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.