การทดสอบแบบฟิชเชอร์มีการกระจายแบบใด


11

ในงานของฉันฉันได้เห็นการทดสอบที่แม่นยำของฟิชเชอร์หลายครั้งและฉันสงสัยว่ามันเหมาะกับข้อมูลของฉันมากแค่ไหน เมื่อดูที่หลายแหล่งฉันเข้าใจวิธีคำนวณสถิติ แต่ไม่เคยเห็นคำอธิบายที่ชัดเจนและเป็นทางการของสมมติฐานว่าง

ใครสามารถช่วยอธิบายหรือแนะนำฉันให้อธิบายอย่างเป็นทางการเกี่ยวกับการแจกแจงที่สันนิษฐานได้? จะขอบคุณสำหรับคำอธิบายในแง่ของค่าในตารางฉุกเฉิน


3
ในกรณี 2x2 มันขึ้นอยู่กับการแจกแจง hypergeometric
Glen_b -Reinstate Monica

คำตอบ:


11

ในกรณีสมมติฐานการกระจายจะได้รับโดยอิสระทั้งสองตัวแปรสุ่มทวินามและtheta_2) สมมติฐานคือความเสมอภาค\แต่การทดสอบที่แน่นอนฟิชเชอร์คือการทดสอบเงื่อนไข: มันต้องอาศัยอยู่บนเงื่อนไขการจำหน่ายของรับX_1การแจกแจงนี้เป็นการแจกแจง hypergeometric พร้อมกับพารามิเตอร์ที่ไม่รู้จักหนึ่งตัว: อัตราต่อรองแล้ว สมมติฐานคือ 12×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

การกระจายนี้มีของหน้าวิกิพีเดีย

ในการประเมินด้วย R คุณสามารถใช้สูตรที่กำหนดความน่าจะเป็นแบบมีเงื่อนไข:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

หรือใช้dnoncenhypergeomฟังก์ชั่นของMCMCpackแพคเกจ:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838

ขอบคุณ @Stephane คุณช่วยอธิบายเพิ่มเติมได้ไหมว่าทำไมมันถึงกลายเป็น hypergeometric และพารามิเตอร์คืออะไร
Amit Lavon

2
ขออภัย @AmitLavon ฉันไม่ทราบรายละเอียดเกี่ยวกับการแจกแจงไฮเพอร์เมตริกซ์นี้
Stéphane Laurent

1
@AmitLavon ฉันเพิ่งแก้ไขคำตอบของฉันเพื่อรวมลิงก์ไปยังวิกิพีเดียและรหัส R
Stéphane Laurent

10

ฟิชเชอร์ที่เรียกว่า "แน่นอน" การทดสอบทำให้ชนิดเดียวกันของสมมติฐานที่ลึกซึ้งที่การทดสอบให้χ2

  • ตัวแปรทั้งสองที่ได้รับการประเมินสำหรับการเชื่อมโยงนั้นเป็นตัวแปรที่ไม่มีหรือไม่มีอะไรเช่น polytomous เช่นตาย / ยังมีชีวิตอยู่ในสหรัฐฯ / ยุโรป หากหนึ่งหรือทั้งสองตัวแปรเป็นการทำให้ง่ายขึ้นของความต่อเนื่องพื้นฐานการวิเคราะห์ข้อมูลเด็ดขาดไม่ควรดำเนินการเลย
  • ไม่มีตัวแปรพื้นหลังอื่น ๆ ที่เกี่ยวข้อง ถ้าเป็นตัวแปรผลและเป็นตัวแปรถูกประเมินสำหรับการเชื่อมโยงกับน่าจะเป็นที่เป็นเหมือนกันสำหรับเรื่องกับทุกคงที่xตารางฉุกเฉินถือว่ามีผลบังคับใช้ว่ามีความแตกต่างในการกระจายของไม่มีที่ไม่ได้คิดโดยXตัวอย่างเช่นในการทดลองทางคลินิกแบบสุ่มศึกษาผลของการรักษา A กับ B ต่อความน่าจะเป็นของการเสียชีวิตX Y Y = y X x Y X 2 × 2YXYY=yXxYX2×2การทดสอบตารางความสอดคล้องสมมติว่าทุกเรื่องในการรักษา A มีความน่าจะเป็นของการเสียชีวิตเท่ากัน [ใครบางคนอาจแย้งว่านี่เป็นสมมติฐานที่เข้มงวดเกินไป แต่ตำแหน่งนั้นไม่ยอมรับการสูญเสียพลังงานจากการทำการทดสอบความสัมพันธ์ที่ไม่ได้ทำการปรับ]

การทดสอบของฟิชเชอร์ทำให้สมมติฐานหนึ่งที่ไม่ได้ทำโดยการทดสอบแบบไม่มีเงื่อนไขเช่นการทดสอบของเพียร์สัน : เราสนใจการกระจายแบบ "ปัจจุบัน" ของและนั่นคือเรากำลังปรับความถี่ของหมวดหมู่ผลลัพธ์ สิ่งนี้ไม่สมเหตุสมผลสำหรับการศึกษาในอนาคต การใช้การทดสอบของฟิชเชอร์นำไปสู่การอนุรักษ์ ของมันนั้นโดยเฉลี่ยใหญ่เกินไปเพราะการทดสอบรับรองว่าค่าไม่เล็กเกินไป โดยเฉลี่ยแล้ว Pearsonจะถูกต้องกว่าฟิชเชอร์แม้จะมีความถี่ที่คาดว่าจะต่ำกว่า 5 ในบางเซลล์ X Y Y P P χ 2 Pχ2XYYPPχ2 P


ขอบคุณ @FankankHarrell คุณสามารถให้การอ้างอิงสำหรับการอ้างสิทธิ์ของคุณเกี่ยวกับค่าไค - สแควร์ได้แม่นยำกว่าฟิชเชอร์หรือไม่?
Amit Lavon

1
ดูตัวอย่างciteulike.org/user/harrelfe/tag/fishers-exact-test เรื่องนี้มีการหารือกันในความยาวบน stackexchange
Frank Harrell

ctiteulike เศร้าไปแล้วและดูเหมือนว่า web.archive.org รวบรวมข้อมูลหน้าแรกของบัญชี harrelfe
Glen_b -Reinstate Monica

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.