ตัวอย่างหนึ่งที่มาถึงใจคือตัวประมาณ GLS บางตัวที่การสังเกตน้ำหนักแตกต่างกันแม้ว่าจะไม่จำเป็นเมื่อพบสมมติฐานของเกาส์ - มาร์คอฟ (ซึ่งนักสถิติอาจไม่ทราบว่าเป็นกรณีนี้
พิจารณากรณีของการถดถอยของyi , i=1,…,nบนค่าคงที่สำหรับภาพประกอบ (พร้อมวางนัยทั่วไปกับตัวประมาณ GLS ทั่วไป) ที่นี่{yi}จะถือว่าเป็นตัวอย่างที่สุ่มจากประชากรที่มีค่าเฉลี่ยμและแปรปรวนσ2 2
จากนั้นเราจะรู้ว่าเป็นเพียง OLS β = ˉ Yค่าเฉลี่ยของกลุ่มตัวอย่าง เพื่อเน้นจุดที่สังเกตแต่ละจะมีน้ำหนักที่มีน้ำหนัก1 / n , เขียนนี้เป็น
β = n Σฉัน= 1 1β^=y¯1/n β^=∑i=1n1nyi.
มันเป็นที่รู้จักกันดีว่าVar(β^)=σ2/nn
ตอนนี้พิจารณาประมาณการซึ่งสามารถเขียนเป็นอีก
β~=∑i=1nwiyi,
ที่น้ำหนักเป็นเช่นที่∑iwi=1 1 สิ่งนี้ทำให้มั่นใจได้ว่าตัวประมาณค่านั้นไม่เอนเอียงเนื่องจาก
E(∑i=1nwiyi)=∑i=1nwiE(yi)=∑i=1nwiμ=μ.
/nสำหรับiทั้งหมด(ซึ่งในกรณีนี้จะลดลงเป็น OLS) ซึ่งสามารถแสดงได้ผ่านลากรองจ์:
ความแปรปรวนจะเกินกว่า OLS ยกเว้นว่าwi=1/ni
L=V(β~)−λ(∑iwi−1)=∑iw2iσ2−λ(∑iwi−1),
wi2σ2wi−λ=0i∂L/∂λ=0∑iwi−1=0λwi=wjwi=1/n
นี่คือภาพประกอบกราฟิกจากการจำลองเล็กน้อยสร้างด้วยโค้ดด้านล่าง:
yiIn log(s) : NaNs produced
wi=(1±ϵ)/n
ที่สามหลังมีประสิทธิภาพสูงกว่าโดยวิธี OLS ไม่ได้บอกเป็นนัย ๆ โดยคุณสมบัติ BLUE (อย่างน้อยไม่ให้ฉัน) เพราะมันไม่ชัดเจนว่าพวกเขาเป็นตัวประมาณค่าเชิงเส้น (หรือฉันรู้ว่า MLE และ Huber เป็นกลาง)
library(MASS)
n <- 100
reps <- 1e6
epsilon <- 0.5
w <- c(rep((1+epsilon)/n,n/2),rep((1-epsilon)/n,n/2))
ols <- weightedestimator <- lad <- mle.t4 <- huberest <- rep(NA,reps)
for (i in 1:reps)
{
y <- rnorm(n)
ols[i] <- mean(y)
weightedestimator[i] <- crossprod(w,y)
lad[i] <- median(y)
mle.t4[i] <- fitdistr(y, "t", df=4)$estimate[1]
huberest[i] <- huber(y)$mu
}
plot(density(ols), col="purple", lwd=3, main="Kernel-estimate of density of OLS and other estimators",xlab="")
lines(density(weightedestimator), col="lightblue2", lwd=3)
lines(density(lad), col="salmon", lwd=3)
lines(density(mle.t4), col="green", lwd=3)
lines(density(huberest), col="#949413", lwd=3)
abline(v=0,lty=2)
legend('topright', c("OLS","weighted","median", "MLE t, 4 df", "Huber"), col=c("purple","lightblue","salmon","green", "#949413"), lwd=3)