ฉันพยายามที่จะแก้ปัญหาคำถามต่อไปนี้:
ผู้เล่น A ชนะ 17 จาก 25 เกมในขณะที่ผู้เล่น B ชนะ 8 จาก 20 - มีความแตกต่างอย่างมีนัยสำคัญระหว่างอัตราส่วนทั้งสองหรือไม่?
สิ่งที่ต้องทำใน R ที่อยู่ในใจคือต่อไปนี้:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
ดังนั้นการทดสอบนี้บอกว่าความแตกต่างไม่สำคัญที่ระดับความเชื่อมั่น 95%
เพราะเรารู้ว่าprop.test()
ใช้การประมาณเท่านั้นฉันต้องการทำให้สิ่งที่แน่นอนมากขึ้นโดยใช้การทดสอบทวินามที่แน่นอน - และฉันทำมันทั้งสองวิธี:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
ตอนนี้มันแปลกใช่ไหม? ค่า p จะแตกต่างกันโดยสิ้นเชิงในแต่ละครั้ง! ในทั้งสองกรณีตอนนี้ผลลัพธ์มีความสำคัญ (สูง) แต่ค่า p-ดูเหมือนจะกระโดดไปรอบ ๆ ค่อนข้างส่งเดช
คำถามของฉัน
- ทำไมค่า p ที่แตกต่างกันในแต่ละครั้ง
- วิธีดำเนินการทดสอบทวินามสองส่วนที่แน่นอนใน R อย่างถูกต้อง
prop.test
vschisq.test
) แนวคิดพื้นฐานที่เหมือนกันอยู่ในคำถามนี้ คุณใช้การทดสอบสามแบบที่แตกต่างกันโดยมี "สมมติฐานว่าง" ที่แตกต่างกันในแต่ละตัวอย่างของคุณ