วิธีการทดสอบ bootstrap เพื่อเปรียบเทียบค่าเฉลี่ยของสองตัวอย่าง?


12

ฉันมีตัวอย่างที่บิดเบี้ยวสองตัวอย่างและพยายามใช้การบูตสแตรปเพื่อเปรียบเทียบค่าเฉลี่ยของพวกเขาโดยใช้สถิติที

ขั้นตอนที่ถูกต้องในการทำคืออะไร?


กระบวนการที่ฉันใช้

ฉันกังวลเกี่ยวกับความเหมาะสมของการใช้ข้อผิดพลาดมาตรฐานของข้อมูลต้นฉบับ / การสังเกตในขั้นตอนสุดท้ายเมื่อฉันรู้ว่านี่ไม่ใช่การกระจายแบบปกติ

นี่คือขั้นตอนของฉัน:

  • Bootstrap - สุ่มเลือกตัวอย่างพร้อมเปลี่ยน (N = 1,000)
  • คำนวณเสื้อสถิติสำหรับแต่ละบูตเพื่อสร้างเสื้อกระจาย:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • ประมาณค่าช่วงความเชื่อมั่น t โดยรับและ1 - α / 2เปอร์เซ็นต์ของการแจกแจงแบบ tα/21α/2
  • รับช่วงความมั่นใจผ่าน:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    SE=σX12/n+σX22/n
  • ดูที่ช่วงความมั่นใจลดลงเพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญในวิธีการ (เช่นไม่ใช่ศูนย์)

ฉันได้ดูผลรวมของอันดับ Wilcoxon ด้วย แต่ก็ไม่ได้ให้ผลลัพธ์ที่สมเหตุสมผลมากนักเนื่องจากการกระจายตัวที่เบ้อย่างหนัก (เช่น 75th == 95th เปอร์เซ็นไทล์) ด้วยเหตุนี้ฉันจึงต้องการสำรวจ bootstrapped t-test เพิ่มเติม

ดังนั้นคำถามของฉันคือ:

  1. นี่เป็นวิธีการที่เหมาะสมหรือไม่?
  2. มันเหมาะสมที่จะใช้ SE ของข้อมูลที่สังเกตได้หรือไม่เมื่อฉันรู้ว่ามันเบ้อย่างหนัก?

ซ้ำกันที่เป็นไปได้: วิธีใดที่เป็นที่ต้องการการทดสอบการทดสอบการบูตหรือการทดสอบตามตำแหน่งที่ไม่ใช่พารามิเตอร์


ตัวอย่างมีขนาดใหญ่แค่ไหน?
Michael M

@Michael Mayer ประมาณ 800
CatsLoveJazz

คำตอบ:


16

ฉันจะทำการทดสอบ bootstrap ปกติ:

  • คำนวณค่าสถิติในข้อมูลของคุณและเก็บไว้
  • เปลี่ยนข้อมูลเช่นว่าสมมติฐานว่างเป็นจริง ในกรณีนี้ให้ลบค่าเฉลี่ยในกลุ่ม 1 สำหรับกลุ่ม 1 และเพิ่มค่าเฉลี่ยโดยรวมแล้วทำเช่นเดียวกันสำหรับกลุ่ม 2 วิธีการที่ค่าเฉลี่ยของทั้งสองกลุ่มจะเป็นค่าเฉลี่ยโดยรวม
  • ใช้ตัวอย่างบูตสแตรปจากชุดข้อมูลนี้อาจอยู่ในลำดับ 20,000
  • คำนวณ t-statistic ในแต่ละตัวอย่าง bootstrap เหล่านี้ การกระจายตัวของสถิติ t เหล่านี้เป็นการประมาณการบูตของการกระจายตัวตัวอย่างของสถิติ t ในข้อมูลที่เบ้ของคุณหากสมมติฐานว่างเป็นจริง
  • p(+1)(+1)

คุณสามารถอ่านเพิ่มเติมได้ที่:

  • บทที่ 4 ของเอซีเดวิสันและ DV Hinkley (1997) วิธีการและการประยุกต์ใช้เงินทุนของพวกเขา Cambridge: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์

  • บทที่ 16 ของแบรดลีย์และโรเบิร์ตเอฟรอนเจ Tibshirani (1993) กล่าวถึงเงินทุน Boca Raton: Chapman & Hall / CRC

  • รายการ Wikipedia ในการทดสอบสมมติฐานบูตสแตรป


นี่คือสิ่งที่ฉันกำลังทำอยู่ แต่ดูที่สัดส่วนของจำนวนครั้งที่สถิติเดิมของ t / สถิติคือ = boots bootsed t-statistic มันโอเคที่จะทำการทดสอบแบบทดสอบกับข้อมูลที่เบ้อย่างหนักในตัวอย่างแรก แต่นี่เป็นหนึ่งในเหตุผลที่ฉันต้องการเพิ่มประสิทธิภาพ
CatsLoveJazz

2
ในทางเทคนิคสำหรับการทดสอบบู๊ตสแตรปคุณเพียงแค่ต้องการทดสอบสถิติเพื่อไม่ให้เกิดปัญหา อย่างมีนัยสำคัญ t-test เปรียบเทียบวิธีการและในสื่อข้อมูลที่เบ้มักจะมีความหมายมากกว่าวิธีการ ดังนั้นการทดสอบเปรียบเทียบค่ามัธยฐานแทนค่าเฉลี่ยอาจสมเหตุสมผลมากกว่า อย่างไรก็ตามขึ้นอยู่กับสมมติฐานว่างของคุณซึ่งเป็นทางเลือกของคุณและตัวเลือกของคุณเพียงอย่างเดียว
Maarten Buis

โอเคขอบคุณมันเป็นค่าเฉลี่ยที่เราต้องการทดสอบเนื่องจากผลลัพธ์อื่น ๆ ทั้งหมดของเราอยู่ในรูปแบบนี้
CatsLoveJazz
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.