เป็นการยากที่จะมีการถกเถียงทางปรัชญาตรงประเด็นเกี่ยวกับสิ่งต่าง ๆ ที่มีความน่าจะเป็นเกิดขึ้น 0 ครั้ง ดังนั้นฉันจะแสดงตัวอย่างที่เกี่ยวข้องกับคำถามของคุณ
หากคุณมีตัวอย่างอิสระจำนวนมหาศาลสองตัวอย่างจากการแจกแจงแบบเดียวกันตัวอย่างทั้งสองจะยังคงมีความแปรปรวนสถิติที่รวมกัน 2 ตัวอย่าง t จะอยู่ใกล้ แต่ไม่ใช่0 อย่างแน่นอน P-value จะถูกกระจายเป็น
และช่วงความมั่นใจ 95% จะสั้นมากและอยู่กึ่งกลางใกล้Unif(0,1),0.
ตัวอย่างของชุดข้อมูลและการทดสอบ t:
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = rnorm(10^5, 100, 15)
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = -0.41372, df = 2e+05, p-value = 0.6791
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1591659 0.1036827
sample estimates:
mean of x mean of y
99.96403 99.99177
นี่คือผลสรุปจาก 10,000 สถานการณ์ดังกล่าว ก่อนการกระจายของค่า P
set.seed(2019)
pv = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$p.val)
mean(pv)
[1] 0.5007066 # aprx 1/2
hist(pv, prob=T, col="skyblue2", main="Simulated P-values")
curve(dunif(x), add=T, col="red", lwd=2, n=10001)
ถัดไปสถิติการทดสอบ:
set.seed(2019) # same seed as above, so same 10^4 datasets
st = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$stat)
mean(st)
[1] 0.002810332 # aprx 0
hist(st, prob=T, col="skyblue2", main="Simulated P-values")
curve(dt(x, df=2e+05), add=T, col="red", lwd=2, n=10001)
และอื่น ๆ สำหรับความกว้างของ CI
set.seed(2019)
w.ci = replicate(10^4,
diff(t.test(rnorm(10^5,100,15),
rnorm(10^5,100,15),var.eq=T)$conf.int))
mean(w.ci)
[1] 0.2629603
แทบเป็นไปไม่ได้เลยที่จะได้ค่า P ที่เป็นเอกภาพในการทำการทดสอบที่แน่นอนด้วยข้อมูลต่อเนื่องซึ่งเป็นไปตามสมมติฐาน นักสถิติที่ชาญฉลาดจะไตร่ตรองสิ่งที่อาจผิดไปเมื่อเห็นค่า P-1
ตัวอย่างเช่นคุณอาจให้ซอฟต์แวร์สองตัวอย่างที่มีขนาดใหญ่เหมือนกัน การเขียนโปรแกรมจะดำเนินการต่อไปราวกับว่าทั้งสองตัวอย่างเป็นอิสระและให้ผลลัพธ์ที่แปลก แต่ถึงอย่างนั้น CI ก็จะไม่กว้างเท่ากับ 0
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = x1
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = 0, df = 2e+05, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1316593 0.1316593
sample estimates:
mean of x mean of y
99.96403 99.96403