แบบจำลองการถดถอยเชิงเส้นอย่างง่าย
Yผม= α + βxผม+ ε
สามารถเขียนได้ในรูปแบบของความน่าจะเป็นที่อยู่เบื้องหลัง
μผม= α + βxผมYผม~N( μผม,σ)
คือตัวแปรตามดังนี้กระจายปกติ parametrized โดยเฉลี่ยμ ฉันที่เป็นฟังก์ชั่นเชิงเส้นของX parametrized โดยα , βและค่าเบี่ยงเบนมาตรฐานσ หากคุณประเมินรุ่นดังกล่าวใช้สี่เหลี่ยมน้อยธรรมดาที่คุณจะได้ไม่ต้องกังวลเกี่ยวกับการกำหนดความน่าจะเป็นเพราะคุณกำลังมองหาค่าที่เหมาะสมของα , βพารามิเตอร์โดยการลดข้อผิดพลาดที่กำลังสองของค่าติดตั้งให้เป็นค่าที่คาดการณ์ไว้ ในอีกทางหนึ่งคุณสามารถประมาณโมเดลดังกล่าวโดยใช้การประมาณโอกาสสูงสุดYμผมXα , βσα , βคุณจะมองหาค่าที่ดีที่สุดของพารามิเตอร์โดยการเพิ่มฟังก์ชั่นความน่าจะเป็นสูงสุด
R กรัมm a xα ,β,σΠi = 1nยังไม่มีข้อความ( yผม; α + βxผม, σ)
ที่เป็นฟังก์ชั่นความหนาแน่นของการกระจายปกติประเมินY ฉันจุด parametrized โดยวิธีα + β x ฉันและส่วนเบี่ยงเบนมาตรฐานσยังไม่มีข้อความYผมα + βxผมσ
ในวิธีการแบบเบย์แทนการเพิ่มฟังก์ชั่นโอกาสเพียงอย่างเดียวเราจะถือว่าการแจกแจงก่อนหน้าสำหรับพารามิเตอร์และใช้ทฤษฎีบทแบบเบย์
หลังeli ความน่าจะเป็น× ก่อน
ฟังก์ชันความน่าจะเป็นเป็นเช่นเดียวกับข้างบน แต่สิ่งที่เปลี่ยนแปลงคือคุณถือว่าการกระจายก่อนหน้านี้บางส่วนสำหรับพารามิเตอร์โดยประมาณและรวมไว้ในสมการα , β, σ
ฉ( α , β, σ∣ Y, X)ด้านหลัง∝ ∏i = 1nยังไม่มีข้อความ( yผม∣ α + βxผม, σ)ความเป็นไปได้ฉα( α )ฉβ( β)ฉσ( σ)ไพรเออร์
"อะไรคือการกระจาย" เป็นคำถามที่แตกต่างกันเนื่องจากมีตัวเลือกไม่ จำกัด จำนวน สำหรับพารามิเตอร์คุณสามารถยกตัวอย่างเช่นสมมติแจกแจงปกติ parametrized โดยบางhyperparametersหรือเสื้อ -distributionถ้าคุณต้องการที่จะคิดหางหนักหรือการกระจายชุดถ้าคุณไม่ต้องการที่จะทำให้สมมติฐานมาก แต่คุณต้องการที่จะคิดว่า พารามิเตอร์สามารถเป็นนิรนัย "อะไรก็ได้ในช่วงที่กำหนด" เป็นต้นสำหรับσคุณต้องสมมติว่ามีการแจกแจงก่อนหน้าบางอย่างที่ถูก จำกัด ให้มีค่ามากกว่าศูนย์แล้วเนื่องจากค่าเบี่ยงเบนมาตรฐานต้องเป็นค่าบวก สิ่งนี้อาจนำไปสู่การกำหนดรูปแบบตามที่แสดงด้านล่างโดย John K. Kruschkeα , βเสื้อσ
(ที่มา: http://www.indiana.edu/~kruschke/BMLR/ )
ในขณะที่มีโอกาสมากที่สุดที่คุณกำลังมองหาค่าที่ดีที่สุดเพียงครั้งเดียวสำหรับแต่ละพารามิเตอร์ในแนวทาง Bayesian โดยใช้ทฤษฎีบท Bayes คุณจะได้รับการแจกแจงหลังของพารามิเตอร์ ประมาณการสุดท้ายจะขึ้นอยู่กับข้อมูลที่มาจากข้อมูลของคุณและจากไพรเออร์แต่ข้อมูลเพิ่มเติมที่มีอยู่ในข้อมูลของคุณที่มีอิทธิพลน้อยไพรเออร์
โปรดสังเกตว่าเมื่อใช้ชุดนักบวชพวกเขาใช้รูปแบบหลังจากปล่อยค่าคงที่ปกติ สิ่งนี้ทำให้ทฤษฎีบทของเบย์เป็นสัดส่วนกับความน่าจะเป็นฟังก์ชั่นเพียงอย่างเดียวดังนั้นการกระจายด้านหลังจะไปถึงค่าสูงสุดที่จุดเดียวกับค่าประมาณโอกาสสูงสุด สิ่งที่ตามประมาณการภายใต้เครื่องแบบไพรเออร์จะเป็นเช่นเดียวกับโดยใช้สี่เหลี่ยมน้อยสามัญตั้งแต่การลดข้อผิดพลาด Squared สอดคล้องกับการเพิ่มความน่าจะเป็นปกติฉ( θ ) ∝ 1
ในการประเมินแบบจำลองด้วยวิธี Bayesian ในบางกรณีคุณสามารถใช้conjugate priorsเพื่อให้การกระจายหลังสามารถใช้งานได้โดยตรง (ดูตัวอย่างที่นี่ ) อย่างไรก็ตามในกรณีส่วนใหญ่การกระจายหลังจะไม่สามารถใช้ได้โดยตรงและคุณจะต้องใช้วิธีมาร์คอฟเชนมอนติคาร์โลเพื่อประเมินแบบจำลอง (ตรวจสอบตัวอย่างของการใช้อัลกอริทึม Metropolis-Hastings เพื่อประเมินพารามิเตอร์ของการถดถอยเชิงเส้น) สุดท้ายหากคุณสนใจเพียงแค่การประมาณค่าพารามิเตอร์คุณสามารถใช้การประมาณค่าด้านหลังสูงสุดเช่น
R กรัมm a xα ,β,σฉ( α , β, σ∣ Y, X)
สำหรับคำอธิบายโดยละเอียดเพิ่มเติมของการถดถอยโลจิสติกคุณสามารถตรวจสอบโมเดล Loges ของ Bayesian - คำอธิบายที่เข้าใจง่าย? ด้าย.
สำหรับการเรียนรู้เพิ่มเติมคุณสามารถตรวจสอบหนังสือต่อไปนี้:
Kruschke, J. (2014) ทำการวิเคราะห์ข้อมูลแบบเบย์: บทเรียนเกี่ยวกับ R, JAGS และ Stan สื่อวิชาการ
Gelman, A. , Carlin, JB, Stern, HS, และ Rubin, DB (2004)
การวิเคราะห์ข้อมูลแบบเบย์ แชปแมน & ฮอล / CRC