แถบความเชื่อมั่นสำหรับสาย QQ


14

คำถามนี้ไม่เกี่ยวข้องโดยเฉพาะRแต่ฉันเลือกที่จะใช้Rเพื่ออธิบาย

พิจารณารหัสสำหรับการสร้างวงความเชื่อมั่นรอบ a (ปกติ) qq-line:

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

ฉันกำลังมองหาคำอธิบายของ (หรือทางเลือกลิงก์ไปยังเอกสาร / เอกสารออนไลน์อธิบาย) วิธีสร้างวงความมั่นใจเหล่านี้ (ฉันได้เห็นการอ้างอิงถึง Fox 2002 ในไฟล์ช่วยเหลือของ R แต่น่าเสียดายที่ฉันไม่มีสิ่งนี้ หนังสือมีประโยชน์)

คำถามของฉันจะทำให้ชัดเจนยิ่งขึ้นด้วยตัวอย่าง นี่คือวิธีRคำนวณ CI ของเหล่านี้ (ฉันย่อ / ย่อรหัสที่ใช้car::qqPlot)

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

คำถามคืออะไรคือเหตุผลสำหรับสูตรที่ใช้ในการคำนวณ SE เหล่านี้ (เช่นสายSE<-(b/dnorm(z))*sqrt(P*(1-P)/n))

FWIW สูตรนี้แตกต่างจากสูตรของแถบความเชื่อมั่นปกติที่ ใช้ในการถดถอยเชิงเส้น


2
ฉันคาดว่าจะเกี่ยวข้องกับการกระจายสถิติการสั่งซื้อ และโดยเฉพาะอย่างยิ่งผลเชิงซีมโทติค :X(np)AN(F-1(p),p(1-
X(k)(x)=n!(k-1)!(n-k)![FX(x)]k-1[1-FX(x)]n-kX(x)
X(nพี)~Aยังไม่มีข้อความ(F-1(พี),พี(1-พี)n[(F-1(พี))]2)
Glen_b

4
@Glen_b ถูกต้อง John Foxเขียนในหน้า 35-36: "ข้อผิดพลาดมาตรฐานของสถิติการสั่งซื้อคือโดยที่คือฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่สอดคล้องกับ CDFค่าตามแนวติดตั้งถูกกำหนดโดยความมั่นใจ "ซองจดหมาย" ประมาณ 95% รอบ ๆ เส้นที่มีความเชื่อมั่น " S E ( X ( ฉัน) ) = σX(ผม) P(Z)P(Z)X(ฉัน)=μ+σZฉันX(ฉัน)±2×SE(X(ฉัน))
SE(X(ผม))=σ^พี(Zผม)Pผม(1-Pผม)n
พี(Z)P(Z)X^(ผม)=μ^+σ^ZผมX^(ผม)±2×SE(X(ผม))
COOLSerdash

2
ฉันคิดว่าสิ่งเดียวที่เหลืออยู่ที่เห็นคือประเมินโดยในสมการ COOLSerdash ที่ให้ ( P ( Z ฉัน ) / σ )(F-1(พี))(พี(Zผม)/σ^)
Glen_b -Reinstate Monica

คำตอบ:


6

มันเกี่ยวข้องกับ การแจกแจงสถิติการสั่งซื้อ และโดยเฉพาะอย่างยิ่งผลเชิงซีมโทติค :

X(k)(x)=n!(k-1)!(n-k)![FX(x)]k-1[1-FX(x)]n-kX(x)
X(nพี)~Aยังไม่มีข้อความ(F-1(พี),พี(1-พี)n[(F-1(พี))]2)

ตามที่ COOLSerdash กล่าวถึงในความคิดเห็น John Fox [1] เขียนในหน้า 35-36:

ข้อผิดพลาดมาตรฐานของสถิติการสั่งซื้อคือที่เป็นฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่สอดคล้องกับ CDF(z) ค่าตามแนวติดตั้งจะได้รับโดย{i} ประมาณ 95% ความเชื่อมั่น "ซองจดหมาย" บริเวณเส้นติดตั้งจึง{(i)})X(ผม)

SE(X(ผม))=σ^พี(Zผม)Pผม(1-Pผม)n
พี(Z)P(Z)X^(ผม)=μ^+σ^ZผมX^(ผม)±2×SE(X(ผม))

จากนั้นเราก็ต้องยอมรับว่าประมาณโดยซิก})(F-1(พี))(พี(Zผม)/σ^)

[1] Fox, J. (2008),
การวิเคราะห์การถดถอยเชิงประยุกต์และโมเดลเชิงเส้นทั่วไป, 2 เอ็ด ,
ปราชญ์สิ่งพิมพ์, Inc

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.