ฉันมีรูปแบบเอฟเฟกต์แบบผสม (อันที่จริงแล้วเป็นโมเดลผสมแบบผสมทั่วไป) ที่ให้การคาดการณ์สำหรับไทม์ ในการต่อต้านความสัมพันธ์อัตโนมัติฉันใช้โมเดล corCAR1 เนื่องจากข้อเท็จจริงที่ว่าฉันมีข้อมูลขาดหายไป ข้อมูลควรจะให้โหลดทั้งหมดแก่ฉันดังนั้นฉันต้องรวมช่วงเวลาการทำนายทั้งหมด แต่ฉันควรจะได้รับการประมาณข้อผิดพลาดมาตรฐานของการโหลดทั้งหมดด้วย
หากการคาดคะเนทั้งหมดเป็นอิสระสิ่งนี้สามารถแก้ไขได้อย่างง่ายดายโดย:
กับ
ปัญหาคือค่าที่คาดการณ์มาจากแบบจำลองและข้อมูลดั้งเดิมมีความสัมพันธ์อัตโนมัติ ปัญหาทั้งหมดนำไปสู่คำถามต่อไปนี้:
- ฉันถูกต้องในการสมมติว่า SE ในการทำนายที่คำนวณได้สามารถตีความได้ว่าเป็นรากของความแปรปรวนตามมูลค่าที่คาดหวังของการทำนายนั้นหรือไม่ ฉันมีแนวโน้มที่จะ interprete การทำนายเป็น "การคาดการณ์ความหมาย" และรวมชุดของวิธีการทั้งหมด
- ฉันจะรวมความสัมพันธ์อัตโนมัติในปัญหานี้ได้อย่างไรหรือฉันสามารถสรุปได้อย่างปลอดภัยว่าจะไม่มีผลต่อผลลัพธ์มากเกินไป
นี่เป็นตัวอย่างใน R. ชุดข้อมูลจริงของฉันมีการวัดประมาณ 34,000 ชุดดังนั้นปัญหาความสามารถในการปรับขนาดได้ นั่นคือเหตุผลที่ฉันสร้างแบบจำลองความสัมพันธ์อัตโนมัติภายในแต่ละเดือนมิฉะนั้นการคำนวณจะเป็นไปไม่ได้อีกต่อไป มันไม่ใช่ทางออกที่ถูกต้องที่สุด แต่วิธีที่ถูกต้องที่สุดนั้นไม่สามารถทำได้
set.seed(12)
require(mgcv)
Data <- data.frame(
dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)
Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})
model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)
preds <- predict(model$gam,se=T)
Total <- sum(preds$fit)
แก้ไข:
บทเรียนที่จะเรียนรู้: ขั้นแรกให้ดูตัวอย่างทั้งหมดในไฟล์ช่วยเหลือทั้งหมดก่อนที่จะตื่นตระหนก ในไฟล์ช่วยเหลือของ predict.gam ฉันสามารถค้นหา:
#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################
Xp <- predict(b,newd,type="lpmatrix")
## Xp %*% coef(b) yields vector of predictions
a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)
ซึ่งดูเหมือนจะใกล้เคียงกับสิ่งที่ฉันต้องการจะทำ สิ่งนี้ยังไม่ได้บอกฉันว่ามันทำอย่างไร ฉันสามารถเข้าใจได้ถึงความจริงที่ว่ามันขึ้นอยู่กับเมทริกซ์ตัวทำนายเชิงเส้น ข้อมูลเชิงลึกใด ๆ ยังคงยินดีต้อนรับ