P-value ถูกกำหนดความน่าจะเป็นที่จะได้รับสถิติการทดสอบอย่างน้อยที่สุดเท่าที่จะสังเกตได้โดยสมมติว่าสมมติฐานว่างเป็นจริง ในคำอื่น ๆ
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
และสมมติว่าเราสังเกตค่าสถิติทดสอบ 60 และที่นี่เรารู้จากภาพค่านี้ไม่น่ามาก ดังนั้นฉันต้องการให้ขั้นตอนสถิติที่ฉันใช้ (พูด p-value) เปิดเผยสิ่งนี้ แต่ถ้าเราคำนวณค่า p ตามที่กำหนดเราจะได้ค่าสูงมาก
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
หากฉันไม่ทราบว่าการแจกแจงฉันจะสรุปได้ว่าสิ่งที่ฉันสังเกตคือการสุ่มโดยบังเอิญ แต่เรารู้ว่านี่ไม่เป็นความจริง
ฉันเดาคำถามที่ฉันมีคือ: ทำไมเมื่อคำนวณ p-value เราคำนวณความน่าจะเป็นของค่าต่างๆอย่างน้อยที่สุดเท่าที่สังเกต และถ้าฉันเจอสถานการณ์แบบเดียวกับที่ฉันจำลองไว้ข้างต้นโซลูชันทางเลือกคืออะไร?