การวิเคราะห์
เพราะนี่เป็นคำถามเชิงแนวคิดเพื่อความง่ายลองพิจารณาสถานการณ์ที่ช่วงความเชื่อมั่นถูกสร้างขึ้นสำหรับค่าเฉลี่ยโดยใช้ a สุ่มตัวอย่างของขนาดและสุ่มตัวอย่างที่สองใช้ขนาดทั้งหมดมาจากการกระจายแบบปกติเดียวกัน (ถ้าคุณชอบคุณสามารถแทนที่ค่าด้วยค่าจากการแจกแจงของนักเรียนขององศาอิสระการวิเคราะห์ต่อไปนี้จะไม่เปลี่ยนแปลง)[ ˉ x ( 1 ) + Z α / 2 s ( 1 ) / √1−αμx(1)nx(2)m(μ,σ2)Ztn-1
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
โอกาสที่ค่าเฉลี่ยของตัวอย่างที่สองอยู่ใน CI ที่กำหนดโดยอันดับแรกคือ
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
เนื่องจากค่าเฉลี่ยตัวอย่างแรกเป็นอิสระจากค่าเบี่ยงเบนมาตรฐานตัวอย่างแรก (สิ่งนี้ต้องการค่าปกติ) และตัวอย่างที่สองเป็นอิสระจากตัวอย่างแรกความแตกต่างในตัวอย่างหมายถึงเป็นอิสระจาก{(1)} นอกจากนี้สำหรับช่วงเวลานี้สมมาตร2} ดังนั้นการเขียนสำหรับตัวแปรสุ่มและกำลังสองทั้งความไม่เท่าเทียมกันความน่าจะเป็นในคำถามนั้นเท่ากับx¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
กฎแห่งความคาดหมายบอกว่ามีค่าเฉลี่ยและความแปรปรวนของU0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
เนื่องจากเป็นชุดแบบเส้นตรงของตัวแปร Normal จึงมีการกระจายแบบปกติ ดังนั้นเป็นครั้งตัวแปร เรารู้อยู่แล้วว่าเป็นครั้งตัวแปร ดังนั้นคือคูณตัวแปรที่มีการแจกแจง แบบความน่าจะเป็นที่ต้องการได้รับจากการแจกแจงแบบ FUU2σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
อภิปรายผล
กรณีที่น่าสนใจคือเมื่อตัวอย่างที่สองมีขนาดเท่ากับครั้งแรกดังนั้นและมีเพียงและกำหนดความน่าจะเป็น นี่คือคุณค่าของการเป็นพล็อตกับสำหรับnn/m=1nα(1)αn=2,5,20,50
กราฟขึ้นไปค่า จำกัด ในแต่ละเป็นเพิ่มขึ้น ขนาดการทดสอบดั้งเดิมถูกทำเครื่องหมายด้วยเส้นสีเทาแนวตั้ง สำหรับค่า largish ของโอกาส จำกัด สำหรับอยู่ที่ประมาณ\%αnα=0.05n=mα=0.0585%
โดยการทำความเข้าใจขีด จำกัด นี้เราจะตรวจสอบรายละเอียดของตัวอย่างขนาดเล็กและเข้าใจจุดสำคัญของเรื่องได้ดียิ่งขึ้น ในฐานะที่เป็นเติบโตขนาดใหญ่กระจายแนวทางการจัดจำหน่าย ในแง่ของการแจกแจงปกติแบบมาตรฐานความน่าจะเป็นนั้นใกล้เคียงn=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
ยกตัวอย่างเช่นกับ ,และ0.083 ดังนั้นค่าการ จำกัด การบรรลุโดยเส้นโค้งที่เป็นเพิ่มขึ้นจะเป็น1-0.166 คุณสามารถเห็นมันใกล้จะถึงแล้วสำหรับ (ที่โอกาสคือ )α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
สำหรับขนาดเล็กความสัมพันธ์ระหว่างและความน่าจะเป็นเสริม - ความเสี่ยงที่ CI ไม่ครอบคลุมค่าเฉลี่ยที่สอง - เกือบสมบูรณ์แบบเป็นกฎหมายพลังงาน αα วิธีการแสดงนี้ก็คือว่าน่าจะเป็นบันทึกที่สมบูรณ์เกือบจะเป็นฟังก์ชั่นเชิงเส้นของ\ความสัมพันธ์ที่ จำกัด อยู่ที่ประมาณlogα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
ในคำอื่น ๆ ที่มีขนาดใหญ่สำหรับและทุกที่ใกล้ค่าดั้งเดิมของ ,จะใกล้เคียงกับn=mα0.05(1)
1−0.166(20α)0.557.
(เรื่องนี้ทำให้ผมนึกถึงมากของการวิเคราะห์ความซ้ำซ้อนของช่วงความเชื่อมั่นผมโพสต์ที่/stats//a/18259/919 . แท้จริงอำนาจวิเศษที่นั่นเป็นอย่างมากเกือบซึ่งกันและกันของอำนาจเวทมนตร์ ที่นี่ณ จุดนี้คุณควรสามารถตีความการวิเคราะห์นั้นอีกครั้งในแง่ของความสามารถในการทำซ้ำของการทดลอง)1.910.557
ผลการทดลอง
ผลลัพธ์เหล่านี้ได้รับการยืนยันด้วยการจำลองที่ตรงไปตรงมา R
รหัสต่อไปนี้จะคืนค่าความถี่ของการครอบคลุมโอกาสตามที่คำนวณด้วยและคะแนน Z เพื่อประเมินว่าพวกเขาต่างกันเท่าใด The-Z คะแนนโดยทั่วไปจะมีน้อยกว่าในขนาดที่ไม่คำนึงถึง (หรือแม้กระทั่งว่าหรือ CI คำนวณ) แสดงให้เห็นความถูกต้องของสูตร(1)(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))