ทำไมอัตราต่อรองจากสูตรและการตกปลาของ R แตกต่างกันอย่างไร ควรเลือกแบบใด


14

ในตัวอย่างต่อไปนี้

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

ฉันคำนวณอัตราต่อรอง (# 1) "ด้วยตนเอง", 0.600; จากนั้น (# 2) เป็นหนึ่งในผลลัพธ์ของการทดสอบที่แน่นอนของฟิชเชอร์, 0.616

ทำไมฉันไม่ได้รับค่าเดียวกัน

ทำไมการคำนวณอัตราต่อรองมีอยู่หลายวิธีและวิธีเลือกวิธีที่เหมาะสมที่สุด

คำตอบ:


10

จากหน้าช่วยเหลือสำหรับfisher.test():

โปรดทราบว่าจะใช้การประมาณความน่าจะเป็นแบบมีเงื่อนไขสูงสุด (MLE) มากกว่า MLE แบบไม่มีเงื่อนไข (อัตราส่วนอัตราตัวอย่างตัวอย่าง)


3

หากต้องการเพิ่มในการสนทนาที่นี่จะมีประโยชน์ในการถามสิ่งที่ถูกต้องในโอกาส "เงื่อนไข" นี้ การทดสอบแบบฟิชเชอร์นั้นแตกต่างจากการวิเคราะห์หมวดหมู่อื่น ๆ ซึ่งถือว่าระยะขอบทั้งหมดของตารางได้รับการแก้ไขในขณะที่แบบจำลองการถดถอยโลจิสติก (และการทดสอบเพียร์สันไค - สแควร์ที่สอดคล้องกัน .

การทดสอบแบบฟิชเชอร์จึงพิจารณาการแจกแจง hypergeometric เป็นแบบจำลองความน่าจะเป็นสำหรับจำนวนที่สังเกตได้ในแต่ละเซลล์ 4 เซลล์ การกระจาย hypergeometric มีลักษณะเฉพาะที่เนื่องจากการกระจายของอัตราต่อรองเริ่มต้นนั้นไม่ต่อเนื่องคุณจึงมักจะได้รับ OR ที่แตกต่างกันหรือเป็นการประมาณความน่าจะเป็นสูงสุด


2
ฉันไม่คิดว่าคำตอบของคุณทำให้ชัดเจนว่าโอกาสนี้เกิดขึ้นได้อย่างไร หากคุณจำลองกระบวนการสร้างข้อมูลด้วยผลิตภัณฑ์ทวินามบอกว่าคุณจะได้รับโอกาสที่แตกต่างกัน (& MLE) ตามเงื่อนไขในผลรวมทั้งหมดจากสิ่งที่คุณได้รับหากคุณทำแบบจำลองนั้นด้วยการแจกแจง hypergeometric ไม่ใช่ศูนย์กลาง - Wallenius ยอดรวมถือว่าเป็น "คงที่" ในทั้งสองกรณี
Scortchi - Reinstate Monica

1

เพื่อที่จะตอบคำถามที่สองของคุณ Biostats ไม่ใช่มือขวาของฉัน แต่ฉันเชื่อว่าเหตุผลของสถิติอัตราส่วนอัตราต่อรองหลาย ๆ อันก็เพื่ออธิบายการออกแบบการสุ่มตัวอย่างและการออกแบบการทดลอง

ฉันได้พบการอ้างอิงสามรายการที่นี่ที่จะให้ความเข้าใจกับคุณเล็กน้อยว่าทำไมมีความแตกต่างระหว่าง MLE แบบมีเงื่อนไขและไม่มีเงื่อนไขสำหรับอัตราต่อรองเช่นเดียวกับประเภทอื่น ๆ

  1. การประมาณจุดและช่วงเวลาของอัตราส่วนอัตราต่อรองทั่วไปในการรวมกันของตาราง 2 × 2 กับระยะขอบคงที่

  2. ผลของการตั้งค่าต่อการประเมินความเสี่ยงสัมพัทธ์สำหรับตัวอย่างที่จับคู่และแบ่งชั้น

  3. การศึกษาเปรียบเทียบการประมาณค่าความน่าจะเป็นแบบมีเงื่อนไขสูงสุดของอัตราต่อรองทั่วไป


3
มันจะมีประโยชน์ในการสรุปอย่างน้อยสิ่งที่อ้างอิงเหล่านั้นต้องพูด
Scortchi - Reinstate Monica

@Scortchi เห็นด้วย ฉันยุ่งอยู่กับงานและมีโอกาสอ่านเฉพาะหน้าแรกหรือสองหน้าเท่านั้น ฉันจะเพิ่มบทสรุปของทุกสุดสัปดาห์นี้
Jon

@ จอนถ้าคุณทำได้ก็จะเป็นประโยชน์ในการเพิ่มสรุปสั้น ๆ ว่า
Glen_b

@ จอนฉันแค่ถามคำถามเดียว มันเป็น bli ที่เพิ่มคำถามที่สอง 4 ปีหลังจากที่ฉันโพสต์คำถามเดิมของฉัน ฉันไม่ได้ย้อนกลับการแก้ไขที่น่ารำคาญของ bli ในขณะที่คุณอ้างถึงคำถามที่สอง แต่ฉันไม่แน่ใจว่าจะยอมรับคำตอบได้อย่างไร
winerd
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.