ทำไมการทดสอบของ McNemar จึงใช้ไคสแควร์ไม่ใช่การแจกแจงแบบปกติ?


11

ฉันเพิ่งสังเกตเห็นว่าการทดสอบที่ไม่แม่นยำของ McNemar ใช้การแจกแจงแบบ asymptotic ของไคสแควร์อย่างไร แต่เนื่องจากการทดสอบที่แน่นอน (สำหรับตารางกรณีสองกรณี) นั้นขึ้นอยู่กับการแจกแจงทวินามทำไมจึงไม่เป็นเรื่องปกติที่จะแนะนำการประมาณแบบปกติในการแจกแจงทวินาม

ขอบคุณ

คำตอบ:


15

คำตอบที่ใกล้ชิดง่าย:

ลองดูสูตรการทดสอบของ McNemar ให้ละเอียดยิ่งขึ้น

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

สถิติของ McNemar Mคำนวณดังนี้:

M=(bc)2b+c

คำจำกัดความของการด้วย k องศาอิสระคือมันประกอบด้วยผลรวมของกำลังสองของตัวแปรปกติมาตรฐานอิสระ k ถ้าตัวเลข 4 มีขนาดใหญ่พอและและและและสามารถประมาณโดยการแจกแจงแบบปกติ จากสูตรของ M จะเห็นได้ง่ายว่าค่าที่มากพอจะตามมาด้วยการมีอิสระ 1 องศาχ2bcb-cb+cMχ2


แก้ไข: ตามที่ระบุไว้บนความถูกต้องการประมาณปกติจะเทียบเท่าอย่างสมบูรณ์ มันค่อนข้างเล็กน้อยเนื่องจากการโต้เถียงใช้การประมาณb-cโดยการแจกแจงแบบปกติ

รุ่นสองจำนวนที่แน่นอนยังเทียบเท่ากับการทดสอบสัญญาณในแง่ที่ว่าในรุ่นนี้การกระจายทวินามจะใช้ในการเปรียบเทียบbเพื่อ0.5) หรือเราสามารถพูดได้ว่าภายใต้สมมติฐานการกระจายของขสามารถห้วงC)Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

หรือเทียบเท่า:

b(b+c2)b+c2N(0,1)

ซึ่งช่วยลดความยุ่งยากในการ

bcb+cN(0,1)

หรือเมื่อนำตารางทั้งสองด้านเพื่อ\Mχ12

ดังนั้นการประมาณปกติจะใช้ มันเหมือนกับการประมาณχ2


3
ถูกตัอง. การเชื่อมต่อนั้นสามารถมองเห็นได้ชัดเจนขึ้นโดยพิจารณาจาก Sqrt (M) = (bc) / Sqrt (b + c) ใกล้เคียงกับความแปรปรวนของ b เป็น b และความแปรปรวนของ c เป็น c (ตามปกติกับข้อมูลที่นับ) เราจะเห็นว่า Sqrt (M) ดูเหมือนว่าการเปลี่ยนแปลงปกติประมาณ (bc) หารด้วยค่าเบี่ยงเบนมาตรฐาน: ในคำอื่น ๆ มัน ดูเหมือนว่าตัวแปรปกติมาตรฐาน ในความเป็นจริงเราสามารถทำการทดสอบที่เทียบเท่าโดยอ้างอิง Sqrt (M) กับตารางของการแจกแจงแบบปกติมาตรฐาน การยกมันอย่างมีประสิทธิภาพทำให้การทดสอบสมมาตรแบบสองด้าน เห็นได้ชัดว่าสิ่งนี้พังลงถ้าทั้ง b หรือ c มีขนาดเล็ก
whuber

ขอบคุณสำหรับคำตอบที่ใช้งานง่าย Joris ถึงกระนั้นทำไมมันเป็นเรื่องธรรมดามากขึ้นที่จะใช้การประมาณนี้แทนที่จะใช้การประมาณปกติกับการทดสอบทวินามที่แน่นอนของ McNemar
Tal Galili

@Tal: มันเหมือนกัน ดูคำตอบที่ไม่หยุดยั้งและการแก้ไขของฉัน
Joris Meys

จริง - คำถามสุดท้าย ดังนั้นถ้าทั้งคู่เหมือนกัน (และฉันคิดว่าคุณอาจต้องการ "ค่าสัมบูรณ์" รอบ bc) แล้วทำไมผู้คนถึงไปที่การแจกแจงไคแทนที่จะอยู่กับคนธรรมดา? ข้อดีอยู่ที่ไหน
Tal Galili

1
@Tal: คุณรู้ว่าอาร์วางแผน chi2 ด้วยอิสระในระดับหนึ่งคุณจะเห็น
Joris Meys

8

ทั้งสองวิธีจะไม่มาในสิ่งเดียวกันหรือไม่ การแจกแจงไคสแควร์ที่เกี่ยวข้องมีระดับหนึ่งของความอิสระดังนั้นก็คือการกระจายตัวของสแควร์ของตัวแปรสุ่มที่มีการแจกแจงแบบปกติมาตรฐาน ฉันต้องผ่านพีชคณิตเพื่อตรวจสอบซึ่งฉันยังไม่มีเวลาทำตอนนี้ แต่ฉันจะแปลกใจถ้าคุณไม่ได้คำตอบเดียวกันทั้งสองวิธี


ดูคำตอบของฉันสำหรับการทำอย่างละเอียดเพิ่มเติม
Joris Meys

สวัสดี onestop - เนื่องจากทั้งสองเป็นแบบซีมโทติคดังนั้นสำหรับ N ขนาดเล็กพวกเขาอาจให้ผลลัพธ์ที่แตกต่างกันบ้าง ในกรณีเช่นนี้ฉันสงสัยว่าการเลือกที่จะไปกับไคสแควร์เป็นเพราะการประมาณที่ดีกว่าปกติหรือเพราะเหตุผลทางประวัติศาสตร์ (หรืออาจตามที่คุณแนะนำ - พวกเขามักให้ผลลัพธ์เหมือนกัน)
Tal Galili

@Tal: สำหรับ N ที่เล็กกว่าทั้งสองไม่ต้องรอ และดังที่แสดงในการแก้ไขของฉันพวกเขาเหมือนกันทุกประการ
Joris Meys
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.