ย้อนกลับเปลี่ยนผลลัพธ์การถดถอยเมื่อสร้างแบบจำลองบันทึก (y)


11

ฉันกระชับถดถอยใน(y) มันถูกต้องหรือไม่กับการประมาณค่าจุดเปลี่ยนกลับ (และช่วงความเชื่อมั่น / การทำนาย) โดยการยกกำลัง? ฉันไม่เชื่อเช่นนั้นเนื่องจากแต่ต้องการความคิดเห็นของผู้อื่นE [ f ( X ) ] f ( E [ X ] )log(y)E[f(X)]f(E[X])

ตัวอย่างด้านล่างของฉันแสดงความขัดแย้งกับการเปลี่ยนรูปด้านหลัง (.239 vs .219)

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
นี่ไม่ใช่ปัญหาที่แก้ไขได้ด้วย gaussian GLMs หรือไม่
generic_user

@ ARM ใช่ฉันเชื่ออย่างนั้น ขอบคุณสำหรับการชี้ให้เห็นว่า อย่างไรก็ตามการใช้ GLM เป็นการยากที่จะได้รับช่วงการคาดการณ์ แต่ฉันคิดว่าฉันสามารถทำงานออกมาได้
เกลน

1
@Glen ทำการค้นหา Duan smearing บนเว็บไซต์นี้
Dimitriy V. Masterov

คำตอบ:


13

มันขึ้นอยู่กับสิ่งที่คุณต้องการได้ในตอนท้าย

ช่วงความเชื่อมั่นสำหรับพารามิเตอร์ที่ถูกแปลงจะแปลงได้ดี ถ้ามันมีความครอบคลุมเล็กน้อยในระดับสเกลบันทึกมันจะมีความครอบคลุมแบบเดิมกลับมาในระดับเดิมเนื่องจากความน่าเชื่อถือของการเปลี่ยนแปลง

ช่วงเวลาการคาดการณ์สำหรับการสังเกตการณ์ในอนาคตก็เปลี่ยนได้ด้วยเช่นกัน

ช่วงเวลาสำหรับค่าเฉลี่ยของมาตราส่วนบันทึกโดยทั่วไปจะไม่ใช่ช่วงเวลาที่เหมาะสมสำหรับค่าเฉลี่ยของมาตราส่วนดั้งเดิม

อย่างไรก็ตามในบางครั้งคุณสามารถประมาณการอย่างสมเหตุสมผลหรือประมาณค่าที่เหมาะสมสำหรับมาตราส่วนดั้งเดิมจากโมเดลบนสเกลบันทึก

อย่างไรก็ตามจำเป็นต้องมีการดูแลหรือคุณอาจจะผลิตประมาณการที่มีคุณสมบัติที่ค่อนข้างน่าแปลกใจ (เป็นไปได้ที่จะสร้างประมาณการที่ไม่มีค่าเฉลี่ยประชากรเอง; นี่ไม่ใช่ความคิดของทุกคนในเรื่องดี

ตัวอย่างเช่นในกรณี lognormal เมื่อคุณยกกำลังกลับมาคุณมีค่าประมาณและคุณอาจทราบว่าค่าเฉลี่ยประชากรคือดังนั้นคุณอาจคิดว่าจะปรับปรุงโดยการปรับขนาดได้โดยการประมาณการของบาง2)exp ( μ i + 1)exp(μi)exp( ^ μ i )exp(1exp(μi+12σ2)exp(μi^)exp(12σ2)

อย่างน้อยที่สุดก็ควรจะได้รับการประเมินที่สอดคล้องกันและแน่นอน asymptotics การกระจายผ่านทฤษฎีบทของ Slutsky (โดยเฉพาะรูปแบบผลิตภัณฑ์) ตราบใดที่เราสามารถประเมินการปรับอย่างสม่ำเสมอ ทฤษฎีการทำแผนที่แบบต่อเนื่องบอกว่าคุณทำได้ถ้าคุณสามารถประมาณอย่างสม่ำเสมอ ... ซึ่งเป็นกรณีนี้σ2

ตราบใดที่เป็นตัวประมาณที่สอดคล้องกันของแล้ว มาบรรจบกับการกระจายของ (โดยการตรวจสอบจะกระจาย asymptotically lognormally ) เนื่องจากจะสอดคล้องกับ , ให้ทำทฤษฏีการทำแผนที่อย่างต่อเนื่องจะสอดคล้องกับและเราจึงมีการประมาณค่าที่สอดคล้องกัน หมายถึงในระดับเดิมσ2ประสบการณ์( ^ μ ฉัน )ประสบการณ์(1σ^2σ2ประสบการณ์( ^ μ ฉัน )ประสบการณ์(1exp(μi^)exp(12σ^2) ^ μ i μiexp( ^ μ i )exp(μi)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

ดูที่นี่

บางโพสต์ที่เกี่ยวข้อง:

การแปลงกลับของโมเดล MLR

การแปลงสภาพกลับ

ช่วงความมั่นใจเปลี่ยนกลับ


1
ขอบคุณฉันดูที่โพสต์ก่อนหน้านี้และในขณะที่ตรัสรู้ยังค่อนข้างสับสนดังนั้นคำถามของฉัน
เกลน

12σ2^

1
E(Y)=0yf(y)dyE ( E X ) X = เข้าสู่ระบบY X Y เสื้อ1 , 2 , . .fE(eX)X=logYXYt1,2,...

1
@ usεr11852ไม่ว่าในกรณีใดกรณีหนึ่งต่อไปนี้คุณนำหรือไปที่คำในความหนาแน่นจากนั้นจึงเติมสี่เหลี่ยมในและนำค่าคงที่เพิ่มเติม (เช่นทั้งหมดยกเว้น normalizing ค่าคงที่สำหรับค่าปกติ) ที่ด้านหน้าของอินทิกรัล (ซึ่งมีอยู่ในนั้น), ปล่อยให้ Gaussian pdf รวมอยู่ในบรรทัดจริง (ด้วยค่าเฉลี่ยที่เปลี่ยนจากเดิม) ซึ่งรวมกันเป็น 1 เหลือเพียงค่าคงที่ที่คุณนำมา ออกด้านหน้า สิ่งนี้เกี่ยวข้องกับอะไรมากกว่าการจัดการพีชคณิตแบบง่าย ๆ ... ctdอีทีx อี . . x 1exetxe...x12
Glen_b

1
CTD ... และจากการที่ -th ขณะดิบ lognormal เป็น2} e μ t + 1teμt+12σ2t2
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.