การถดถอยแบบเบย์: ทำอย่างไรเมื่อเปรียบเทียบกับการถดถอยแบบมาตรฐาน


57

ฉันมีคำถามบางอย่างเกี่ยวกับการถดถอยแบบเบย์:

  1. ได้รับการถดถอยมาตรฐานY=β0+β1x+ε ε หากฉันต้องการเปลี่ยนสิ่งนี้เป็นการถดถอยแบบเบย์ฉันต้องมีการแจกแจงก่อนหน้าทั้งคู่สำหรับβ0และβ1 (หรือไม่ได้ทำงานด้วยวิธีนี้)?

  2. ในการถดถอยมาตรฐานหนึ่งจะพยายามที่จะลดเหลือที่จะได้รับค่าเดียวสำหรับβ0และβ1 1 สิ่งนี้จะเกิดขึ้นได้อย่างไรในการถดถอยแบบเบย์


ฉันดิ้นรนมากที่นี่:

ด้านหลัง=ก่อน×ความเป็นไปได้

ความน่าจะเป็นมาจากชุดข้อมูลปัจจุบัน (ดังนั้นจึงเป็นพารามิเตอร์การถดถอยของฉัน แต่ไม่ได้เป็นค่าเดียว แต่เป็นการกระจายความเป็นไปได้ใช่มั้ย) ก่อนหน้ามาจากการวิจัยก่อนหน้า (สมมุติว่า) ดังนั้นฉันได้สมการนี้:

Y=β1x+ε

ด้วยβ1เป็นโอกาสหรือหลังของฉัน (หรือนี่เป็นเพียงความผิดทั้งหมด)?

ฉันไม่เข้าใจว่าการถดถอยมาตรฐานเปลี่ยนเป็น Bayes อย่างไร

คำตอบ:


92

แบบจำลองการถดถอยเชิงเส้นอย่างง่าย

Yผม=α+βxผม+ε

สามารถเขียนได้ในรูปแบบของความน่าจะเป็นที่อยู่เบื้องหลัง

μผม=α+βxผมYผม~ยังไม่มีข้อความ(μผม,σ)

คือตัวแปรตามดังนี้กระจายปกติ parametrized โดยเฉลี่ยμ ฉันที่เป็นฟังก์ชั่นเชิงเส้นของX parametrized โดยα , βและค่าเบี่ยงเบนมาตรฐานσ หากคุณประเมินรุ่นดังกล่าวใช้สี่เหลี่ยมน้อยธรรมดาที่คุณจะได้ไม่ต้องกังวลเกี่ยวกับการกำหนดความน่าจะเป็นเพราะคุณกำลังมองหาค่าที่เหมาะสมของα , βพารามิเตอร์โดยการลดข้อผิดพลาดที่กำลังสองของค่าติดตั้งให้เป็นค่าที่คาดการณ์ไว้ ในอีกทางหนึ่งคุณสามารถประมาณโมเดลดังกล่าวโดยใช้การประมาณโอกาสสูงสุดYμผมXα,βσα,βคุณจะมองหาค่าที่ดีที่สุดของพารามิเตอร์โดยการเพิ่มฟังก์ชั่นความน่าจะเป็นสูงสุด

aRก.ม.axα,β,σΠผม=1nยังไม่มีข้อความ(Yผม;α+βxผม,σ)

ที่เป็นฟังก์ชั่นความหนาแน่นของการกระจายปกติประเมินY ฉันจุด parametrized โดยวิธีα + β x ฉันและส่วนเบี่ยงเบนมาตรฐานσยังไม่มีข้อความYผมα+βxผมσ

ในวิธีการแบบเบย์แทนการเพิ่มฟังก์ชั่นโอกาสเพียงอย่างเดียวเราจะถือว่าการแจกแจงก่อนหน้าสำหรับพารามิเตอร์และใช้ทฤษฎีบทแบบเบย์

ด้านหลังαความเป็นไปได้×ก่อน

ฟังก์ชันความน่าจะเป็นเป็นเช่นเดียวกับข้างบน แต่สิ่งที่เปลี่ยนแปลงคือคุณถือว่าการกระจายก่อนหน้านี้บางส่วนสำหรับพารามิเตอร์โดยประมาณและรวมไว้ในสมการα,β,σ

(α,β,σ|Y,X)ด้านหลังαΠผม=1nยังไม่มีข้อความ(Yผม|α+βxผม,σ)ความเป็นไปได้α(α)β(β)σ(σ)ไพรเออร์

"อะไรคือการกระจาย" เป็นคำถามที่แตกต่างกันเนื่องจากมีตัวเลือกไม่ จำกัด จำนวน สำหรับพารามิเตอร์คุณสามารถยกตัวอย่างเช่นสมมติแจกแจงปกติ parametrized โดยบางhyperparametersหรือเสื้อ -distributionถ้าคุณต้องการที่จะคิดหางหนักหรือการกระจายชุดถ้าคุณไม่ต้องการที่จะทำให้สมมติฐานมาก แต่คุณต้องการที่จะคิดว่า พารามิเตอร์สามารถเป็นนิรนัย "อะไรก็ได้ในช่วงที่กำหนด" เป็นต้นสำหรับσคุณต้องสมมติว่ามีการแจกแจงก่อนหน้าบางอย่างที่ถูก จำกัด ให้มีค่ามากกว่าศูนย์แล้วเนื่องจากค่าเบี่ยงเบนมาตรฐานต้องเป็นค่าบวก สิ่งนี้อาจนำไปสู่การกำหนดรูปแบบตามที่แสดงด้านล่างโดย John K. Kruschkeα,βเสื้อσ

การสร้างแบบจำลองการถดถอยเชิงเส้นแบบเบย์

(ที่มา: http://www.indiana.edu/~kruschke/BMLR/ )

ในขณะที่มีโอกาสมากที่สุดที่คุณกำลังมองหาค่าที่ดีที่สุดเพียงครั้งเดียวสำหรับแต่ละพารามิเตอร์ในแนวทาง Bayesian โดยใช้ทฤษฎีบท Bayes คุณจะได้รับการแจกแจงหลังของพารามิเตอร์ ประมาณการสุดท้ายจะขึ้นอยู่กับข้อมูลที่มาจากข้อมูลของคุณและจากไพรเออร์แต่ข้อมูลเพิ่มเติมที่มีอยู่ในข้อมูลของคุณที่มีอิทธิพลน้อยไพรเออร์

โปรดสังเกตว่าเมื่อใช้ชุดนักบวชพวกเขาใช้รูปแบบหลังจากปล่อยค่าคงที่ปกติ สิ่งนี้ทำให้ทฤษฎีบทของเบย์เป็นสัดส่วนกับความน่าจะเป็นฟังก์ชั่นเพียงอย่างเดียวดังนั้นการกระจายด้านหลังจะไปถึงค่าสูงสุดที่จุดเดียวกับค่าประมาณโอกาสสูงสุด สิ่งที่ตามประมาณการภายใต้เครื่องแบบไพรเออร์จะเป็นเช่นเดียวกับโดยใช้สี่เหลี่ยมน้อยสามัญตั้งแต่การลดข้อผิดพลาด Squared สอดคล้องกับการเพิ่มความน่าจะเป็นปกติ(θ)α1

ในการประเมินแบบจำลองด้วยวิธี Bayesian ในบางกรณีคุณสามารถใช้conjugate priorsเพื่อให้การกระจายหลังสามารถใช้งานได้โดยตรง (ดูตัวอย่างที่นี่ ) อย่างไรก็ตามในกรณีส่วนใหญ่การกระจายหลังจะไม่สามารถใช้ได้โดยตรงและคุณจะต้องใช้วิธีมาร์คอฟเชนมอนติคาร์โลเพื่อประเมินแบบจำลอง (ตรวจสอบตัวอย่างของการใช้อัลกอริทึม Metropolis-Hastings เพื่อประเมินพารามิเตอร์ของการถดถอยเชิงเส้น) สุดท้ายหากคุณสนใจเพียงแค่การประมาณค่าพารามิเตอร์คุณสามารถใช้การประมาณค่าด้านหลังสูงสุดเช่น

aRก.ม.axα,β,σ(α,β,σ|Y,X)

สำหรับคำอธิบายโดยละเอียดเพิ่มเติมของการถดถอยโลจิสติกคุณสามารถตรวจสอบโมเดล Loges ของ Bayesian - คำอธิบายที่เข้าใจง่าย? ด้าย.

สำหรับการเรียนรู้เพิ่มเติมคุณสามารถตรวจสอบหนังสือต่อไปนี้:

Kruschke, J. (2014) ทำการวิเคราะห์ข้อมูลแบบเบย์: บทเรียนเกี่ยวกับ R, JAGS และ Stan สื่อวิชาการ

Gelman, A. , Carlin, JB, Stern, HS, และ Rubin, DB (2004) การวิเคราะห์ข้อมูลแบบเบย์ แชปแมน & ฮอล / CRC


2
βผมβผม

2
+1 อีกสิ่งหนึ่งที่อาจเป็นประโยชน์ในการชี้ให้เห็นชัดเจนถึงความสัมพันธ์ระหว่าง Bayesian และ OLS คือวิธีการที่ OLS สามารถเข้าใจได้ว่าเป็นค่าเฉลี่ยด้านหลังภายใต้แฟลตก่อน (อย่างน้อยเท่าที่ฉันเข้าใจ) คงจะดีมากถ้าคุณสามารถอธิบายอย่างละเอียดในคำตอบของคุณ
อะมีบาพูดว่า Reinstate Monica

@ Amoeba เป็นจุดที่ดีฉันจะคิดเกี่ยวกับมัน แต่ในอีกแง่หนึ่งฉันไม่ต้องการที่จะให้คำตอบอย่างเปิดเผยนานเกินไปดังนั้นจึงมีประเด็นที่ต้องพูดถึงรายละเอียด
ทิม

1
@amoeba FYI ฉันได้เพิ่มความคิดเห็นสั้น ๆ เกี่ยวกับเรื่องนั้น
ทิม

22

D=(x1,Y1),...,(xยังไม่มีข้อความ,Yยังไม่มีข้อความ)xRd,YR

W~ยังไม่มีข้อความ(0,σW2ผมd)

W(W1,...,Wd)Tผมdd×d

Yผม~ยังไม่มีข้อความ(WTxผม,σ2)

YผมYJ|W,ผมJ

a=1/σ2=1/σW2a,

พี(W)αประสบการณ์{-2Wเสื้อW}

พี(D|W)αประสบการณ์{-a2(Y-AW)T(Y-AW)}

Y=(Y1,...,Yยังไม่มีข้อความ)TAn×dxผมT

พี(W|D)αพี(D|W)พี(W)

หลังจากการคำนวณจำนวนมากเราพบว่า

พี(W|D)~ยังไม่มีข้อความ(W|μ,Λ-1)

Λ

Λ=aATA+ผมd
μ=aΛ-1ATY

μWMAP

μΛ=aATA+ผมd

μ=(ATA+aผมd)-1ATY

WMLE

WMLE=(ATA)-1ATY

μλ=a

สำหรับการกระจายหลังทำนาย:

พี(Y|x,D)=พี(Y|x,D,W)พี(W|x,D)dW=พี(Y|x,W)พี(W|D)dW

เป็นไปได้ที่จะคำนวณว่า

Y|x,D~ยังไม่มีข้อความ(μTx,1a+xTΛ-1x)

การอ้างอิง: Lunn และคณะ หนังสือ BUGS

สำหรับการใช้เครื่องมือ MCMC เช่น JAGS / Stan check การวิเคราะห์ข้อมูล Does Bayesianของ Kruschke


ขอบคุณ jpneto ฉันรู้สึกว่านี่เป็นคำตอบที่ดี แต่ฉันยังไม่เข้าใจเพราะขาดความรู้ทางคณิตศาสตร์ แต่ฉันจะอ่านอีกครั้งแน่นอนหลังจากได้รับทักษะคณิตศาสตร์
TinglTanglBob

1
นี่เป็นสิ่งที่ดีมาก แต่การสันนิษฐานว่าความแม่นยำเป็นที่รู้จักกันค่อนข้างแปลก ไม่ใช่เรื่องธรรมดาที่จะถือว่าการกระจายแกมม่าผกผันสำหรับความแปรปรวนนั่นคือการแจกแจงแกมม่าเพื่อความแม่นยำหรือไม่?
DeltaIV

W

W~ยังไม่มีข้อความ(0,λ-1ผมd)λ

1
@ DeltaIV: แน่นอนเมื่อเรามีความไม่แน่นอนเกี่ยวกับพารามิเตอร์ที่เราสามารถสร้างแบบจำลองที่มีก่อน ข้อสันนิษฐานของความแม่นยำที่เป็นที่รู้จักคือทำให้การค้นหาโซลูชันการวิเคราะห์ง่ายขึ้น โดยทั่วไปโซลูชันการวิเคราะห์เหล่านั้นเป็นไปไม่ได้และเราต้องใช้การประมาณเช่น MCMC หรือเทคนิคการแปรผันบางอย่าง
jpneto
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.