ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้:
> soda_gender
f m
n 0 5
y 5 0
เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน
เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
ที่นี่เนื่องจากค่า p คือ 0.007937 เราจะสรุปได้ว่าการบริโภคเพศและโซดานั้นเกี่ยวข้องกัน
ฉันรู้ว่าการทดสอบที่แม่นยำโดยฟิชเชอร์นั้นเกี่ยวข้องกับการกระจาย hypergeomteric ดังนั้นฉันต้องการได้ผลลัพธ์ที่คล้ายกันโดยใช้สิ่งนั้น ในคำอื่น ๆ คุณสามารถดูปัญหานี้ดังนี้มี 10 ลูกโดยที่ 5 ระบุว่าเป็น "ชาย" และ 5 ถูกระบุว่าเป็น "หญิง" และคุณวาดลูกบอล 5 ลูกโดยไม่มีการแทนที่และคุณเห็นลูกบอลชาย 0 ลูก . โอกาสของการสังเกตนี้คืออะไร? เพื่อตอบคำถามนี้ฉันใช้คำสั่งต่อไปนี้:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
คำถามของฉันคือ: 1) ผลลัพธ์ทั้งสองแตกต่างกันอย่างไร 2) มีอะไรผิดปกติหรือไม่เข้มงวดในการให้เหตุผลของฉันข้างต้น?