การทดสอบของบาร์นาร์ดจะใช้เมื่อไม่ทราบพารามิเตอร์ความรำคาญภายใต้สมมติฐานว่าง
อย่างไรก็ตามในการทดสอบการชิมเลดี้คุณสามารถยืนยันได้ว่าพารามิเตอร์ความรำคาญสามารถตั้งค่าที่ 0.5 ภายใต้สมมติฐานว่าง (ผู้หญิงที่ไม่มีข้อมูลมีความน่าจะเป็น 50% ในการเดาถ้วยอย่างถูกต้อง)
จากนั้นจำนวนการเดาที่ถูกต้องภายใต้สมมติฐานว่างจะกลายเป็นการแจกแจงแบบทวินาม: การเดา 8 ถ้วยด้วยความน่าจะเป็น 50% สำหรับแต่ละถ้วย
ในโอกาสอื่นคุณอาจไม่มีความน่าจะเป็น 50% เล็กน้อยสำหรับสมมติฐานว่าง และถ้าไม่มีระยะขอบคงที่คุณอาจไม่รู้ว่าความน่าจะเป็นนั้นควรเป็นเท่าไหร่ ในกรณีนี้คุณต้องผ่านการทดสอบของบาร์นาร์ด
แม้ว่าคุณจะทำการทดสอบของบาร์นาร์ดในการทดสอบชาชิมเลดี้ก็จะกลายเป็น 50% ต่อไป (หากผลที่ได้คือการคาดเดาที่ถูกต้องทั้งหมด) เนื่องจากพารามิเตอร์ความรำคาญที่มีค่า p สูงที่สุดคือ 0.5 และจะส่งผลการทดสอบทวินาม อันที่จริงแล้วเป็นการรวมกันของการทดสอบสองทวินามหนึ่งสำหรับสี่ถ้วยแรกนมและหนึ่งสำหรับสี่ถ้วยแรกถ้วยชา)
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
ด้านล่างเป็นวิธีการที่จะให้ผลลัพธ์ที่ซับซ้อนมากขึ้น (หากไม่เดาทั้งหมดว่าถูกต้องเช่น 2 ต่อ 4) จากนั้นการนับสิ่งที่เป็นและสิ่งที่ไม่รุนแรงกลายเป็นเรื่องยากขึ้นเล็กน้อย
(โปรดทราบว่าการทดสอบของบาร์นาร์ดใช้ในกรณีของ 4-2 ส่งผลให้พารามิเตอร์ที่สร้างความรำคาญ p = 0.686 ซึ่งคุณอาจโต้แย้งไม่ถูกต้องค่า p สำหรับค่าความน่าจะเป็น 50% ของการตอบรับ 'tea first' จะเท่ากับ 0.08203125 สิ่งนี้จะยิ่งเล็กลงเมื่อคุณพิจารณาภูมิภาคอื่นแทนที่จะเป็นภูมิภาคที่อิงจากสถิติของ Wald แม้ว่าการกำหนดภูมิภาคนั้นไม่ใช่เรื่องง่าย )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)