ประเมินการกระจายการทำนายหลังในการถดถอยเชิงเส้นแบบเบย์


10

ฉันสับสนเกี่ยวกับวิธีการประเมินการกระจายการทำนายหลังสำหรับการถดถอยเชิงเส้นแบบเบย์ผ่านกรณีพื้นฐานที่อธิบายไว้ที่นี่ในหน้า 3 และคัดลอกด้านล่าง

p(y~y)=p(y~β,σ2)p(β,σ2y)

กรณีพื้นฐานคือตัวแบบการถดถอยเชิงเส้น:

y=Xβ+ϵ,yN(Xβ,σ2)

ถ้าเราใช้ทั้งเครื่องแบบก่อนหน้าโดยมีมาตราส่วน-Invก่อนหน้าบนหรือค่าผกผันแกมมาปกติก่อนหน้า (ดูที่นี่ ) การกระจายการทำนายหลังเป็นแบบวิเคราะห์และเป็นนักเรียน t βχ2σ2

แล้วรุ่นนี้ล่ะ?

y=Xβ+ϵ,yN(Xβ,Σ)

เมื่อแต่เป็นที่รู้จักกันในชื่อการกระจายการทำนายหลังเป็นหลายตัวแปรเกาส์ โดยปกติแล้วคุณไม่รู้แต่ต้องประมาณ บางทีคุณอาจพูดว่าเส้นทแยงมุมและทำให้เส้นทแยงมุมเป็นฟังก์ชันของโควาเรียในบางวิธี นี้จะกล่าวถึงในบทที่ถดถอยเชิงเส้นของ Gelman ของคชกรรมวิเคราะห์ข้อมูลyN(Xβ,Σ)ΣΣ

มีรูปแบบการวิเคราะห์สำหรับการแจกแจงการคาดการณ์หลังในกรณีนี้หรือไม่? ฉันสามารถเพียงแค่ประมาณค่าของฉันเป็นนักเรียนหลายตัวแปร? หากคุณประมาณค่าความแปรปรวนมากกว่าหนึ่งการกระจายตัวยังคงเป็นหลายตัวแปรของนักเรียนหรือไม่

ฉันกำลังถามเพราะพูดว่าฉันมีอยู่แล้ว ฉันต้องการทราบว่ามีแนวโน้มที่จะถูกทำนายโดยเช่นการถดถอยเชิงเส้น A, การถดถอยเชิงเส้น B หรือไม่ y~


1
หากคุณมีตัวอย่างหลังจากการแจกแจงหลังคุณสามารถประเมินการกระจายการทำนายด้วยการประมาณ Monte Carlo
niandra82

อ่าขอบคุณฉันสามารถทำเช่นนั้นได้เสมอ ไม่มีสูตรการวิเคราะห์ในกรณีนี้หรือไม่?
bill_e

ลิงก์เสียโดยวิธี คงจะดีมากถ้าคุณรวมการอ้างอิงไว้ด้วยวิธีอื่น
Maxim.K

คำตอบ:


6

หากคุณถือว่าเครื่องแบบอยู่ก่อนหน้าดังนั้นส่วนหลังของคือ ด้วย ในการค้นหาการกระจายแบบทำนายคำเราต้องการข้อมูลเพิ่มเติม ถ้าและเป็นเงื่อนไขที่ไม่ขึ้นอยู่กับได้รับแล้ว แต่โดยทั่วไปแล้วสำหรับรุ่นประเภทนี้และนั้นไม่ได้มีความเป็นอิสระตามเงื่อนไข ββ

β|yN(β^,Vβ).
β^=[XΣ1X]XyandVβ=[XΣ1X]1.
y~N(X~β,Σ~)yβ
y~|yN(X~β^,Σ~+Vβ).
yy~
(yy~)N([XβX~β],[ΣΣ12Σ21Σ~]).
หากเป็นกรณีนี้ สิ่งนี้ถือว่าและเป็นที่รู้กันทั้งหมด ในขณะที่คุณชี้ให้เห็นพวกเขามักจะไม่ทราบและจะต้องมีการประมาณ สำหรับโมเดลทั่วไปที่มีโครงสร้างนี้เช่นอนุกรมเวลาและโมเดลเชิงพื้นที่โดยทั่วไปจะไม่มีรูปแบบปิดสำหรับการแจกแจงทำนาย
y~|yN(X~β^+Σ21Σ1(yXβ^),Σ~Σ21Σ1Σ12).
Σ,Σ12,Σ~

2

ภายใต้นักบวชปรกติที่ไม่ได้ให้ข้อมูลหรือมีหลายตัวแปรคุณมีแบบฟอร์มการวิเคราะห์เป็นการกระจายของนักเรียนหลายตัวแปรสำหรับคลาสสิกการถดถอยแบบหลายตัวแปร ฉันเดาว่าการพัฒนาในเอกสารนี้เกี่ยวข้องกับคำถามของคุณ (คุณอาจชอบภาคผนวก A :-)) ฉันมักจะเปรียบเทียบผลลัพธ์กับการแจกแจงการคาดการณ์หลังที่ได้รับโดยใช้ WinBUGS และรูปแบบการวิเคราะห์: พวกเขาจะเทียบเท่าอย่างแน่นอน ปัญหาจะยากเมื่อคุณมีเอฟเฟกต์แบบสุ่มเพิ่มเติมในโมเดลผสมผลกระทบโดยเฉพาะในการออกแบบที่ไม่สมดุล

โดยทั่วไปแล้วด้วยการถดถอยแบบคลาสสิก y และỹมีความเป็นอิสระตามเงื่อนไข (ส่วนที่เหลือเป็น iid)! แน่นอนถ้าไม่ใช่กรณีนั้นทางออกที่เสนอที่นี่ไม่ถูกต้อง

ใน R (ที่นี่คำตอบสำหรับนักบวชแบบเอกสิทธิ์) สมมติว่าคุณทำโมเดล lm (ชื่อ "model") ของการตอบสนองอย่างใดอย่างหนึ่งในแบบจำลองของคุณและเรียกมันว่า "model" นี่คือวิธีรับการแจกแจงทำนายหลายตัวแปร

library(mvtnorm)
Y = as.matrix(datas[,c("resp1","resp2","resp3")])
X =  model.matrix(delete.response(terms(model)), 
           data, model$contrasts)
XprimeX  = t(X) %*% X
XprimeXinv = solve(xprimex)
hatB =  xprimexinv %*% t(X) %*% Y
A = t(Y - X%*%hatB)%*% (Y-X%*%hatB)
F = ncol(X)
M = ncol(Y)
N = nrow(Y)
nu= N-(M+F)+1 #nu must be positive
C_1 =  c(1  + x0 %*% xprimexinv %*% t(x0)) #for a prediction of the factor setting x0 (a vector of size F=ncol(X))
varY = A/(nu) 
postmean = x0 %*% hatB
nsim = 2000
ysim = rmvt(n=nsim,delta=postmux0,C_1*varY,df=nu) 

ตอนนี้ควิกไทล์ของ ysim คือช่วงค่าเผื่อที่คาดหวังจากการแจกแจงแบบคาดเดาได้คุณสามารถใช้การแจกแจงแบบสุ่มเพื่อทำสิ่งที่คุณต้องการได้โดยตรง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.