การทดสอบที่แน่นอนของ Fisher ด้วยน้ำหนัก?


12

ไม่มีใครทราบเกี่ยวกับรูปแบบของการทดสอบที่แน่นอนของฟิชเชอร์ซึ่งคำนึงถึงน้ำหนัก? ยกตัวอย่างเช่นการสุ่มตัวอย่างน้ำหนัก
ดังนั้นแทนที่จะข้ามตาราง 2x2 ปกติจุดข้อมูลทุกจุดจะมีค่า "มวล" หรือ "ขนาด" ชั่งน้ำหนักจุด

ข้อมูลตัวอย่าง:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

การทดสอบที่แน่นอนของ Fisher ใช้ 2x2 cross table นี้:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

หากเราใช้น้ำหนักเป็นจำนวนจุดข้อมูล 'จริง' สิ่งนี้จะส่งผลให้:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

แต่นั่นจะส่งผลให้เกิดความเชื่อมั่นสูงเกินไป จุดข้อมูลหนึ่งเปลี่ยนจาก N / Y เป็น N / N จะสร้างความแตกต่างในสถิติ
นอกจากนี้มันจะไม่ทำงานหากน้ำหนักมีเศษส่วนใด ๆ

คำตอบ:


10

ฉันสงสัยว่าการทดสอบที่แน่นอนและการสุ่มตัวอย่างน้ำหนักนั้นเป็นแนวคิดที่ไม่สอดคล้องกัน ฉันตรวจสอบใน Stata ซึ่งมีสิ่งอำนวยความสะดวกที่ดีสำหรับการสำรวจตัวอย่างและแบบทดสอบที่สมเหตุสมผลและสถิติการทดสอบที่เป็นไปได้ 8 ประการสำหรับอ้างอิงไขว้ที่มีน้ำหนักตัวอย่างไม่รวมการทดสอบที่แน่นอนเช่น Fisher's

รายการคู่มือ Stata ที่เกี่ยวข้อง (สำหรับsvy: tabulate twoway ) ให้คำแนะนำโดยใช้การทดสอบเริ่มต้นในทุกกรณี วิธีการเริ่มต้นนี้จะขึ้นอยู่กับสถิติไคสแควร์ของ Pearson ปกติ อ้าง:

"เพื่ออธิบายถึงการออกแบบการสำรวจสถิติกลายเป็นสถิติ F ที่มีองศาอิสระโดยไม่ต้องใช้การแก้ไขลำดับที่สอง Rao และ Scott (1981, 1984)"

refs:

  • Rao, JNK และ AJ Scott 1981. การวิเคราะห์ข้อมูลเด็ดขาดจากการสำรวจตัวอย่างที่ซับซ้อน: การทดสอบ Chi-squared เพื่อความดีของความพอดีและความเป็นอิสระในตารางแบบสองทาง วารสารสมาคมสถิติอเมริกัน 76: 221–230
  • Rao, JNK และ AJ Scott 1984. ในการทดสอบไคสแควร์สำหรับตารางฉุกเฉินหลายทางที่มีสัดส่วนของเซลล์ประมาณจากข้อมูลการสำรวจ บันทึกสถิติ 12: 46–60

3

คำถามที่น่าสนใจ คุณหมายถึงน้ำหนักอะไร?

ฉันอยากจะลองบู๊ต ... เลือกสถิติที่คุณชอบ (เช่น Fisher's Exact) แล้วคำนวณบนข้อมูลของคุณ จากนั้นกำหนดเซลล์ใหม่ให้กับแต่ละอินสแตนซ์ตามสมมติฐานว่างของคุณและทำซ้ำกระบวนการ 999 ครั้ง นี่ควรให้การกระจายเชิงประจักษ์ที่ดีสำหรับสถิติการทดสอบของคุณภายใต้สมมติฐานว่างและอนุญาตให้คำนวณค่า p ของคุณได้ง่าย!


ขอบคุณ! แต่ฉันหวังว่าสถิติที่เร็วกว่าและเสถียรกว่าในการคำนวณ ...
Michel de Ruiter

2

สิ่งหนึ่งที่รวดเร็วเกี่ยวกับน้ำหนักตัวอย่าง - พวกเขามักจะเป็นวิธีที่จะรวมข้อมูลบางอย่างเกี่ยวกับประชากรที่มีการสุ่มตัวอย่างจาก - แต่โดยทั่วไปแล้วพวกเขาจะขึ้นอยู่กับสถานการณ์ประเภท "ตัวอย่างขนาดใหญ่" (โดยทั่วไปแล้ว ดังนั้นฉันจะจินตนาการว่าน้ำหนักตัวอย่างอาจจะไม่ดีไปกว่าน้ำหนัก อะไรจะดีไปกว่านี้ฉันคิดว่าการใช้ข้อมูลเกี่ยวกับประชากรที่การออกแบบกลุ่มตัวอย่างนั้นยึดโดยตรง

R1,,RkkR1;11,R1;12,R1;21,R1;22,l=1kRl;ijRl;ijrl;iji,jRl;ij=Rl(l=1,,k)

P(Dm)=1P(Dm)=0หากพวกเขาไม่ได้อยู่ในตัวอย่าง อย่างไรก็ตามโดยปกติการออกแบบจะขึ้นอยู่กับข้อมูลมากกว่าข้อมูลที่น่าจะสังเกตได้ แต่โปรดทราบว่ามันเป็นข้อมูลมากกว่าแบบสำรวจต่อสิ่งที่สำคัญ การอนุมานที่ใช้การออกแบบเป็นวิธีที่ค่อนข้างมีประสิทธิภาพในการรวมข้อมูลทั้งหมดเข้ากับการวิเคราะห์ของคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.