การถดถอยโลจิสติกสามารถอธิบายเป็นชุดเชิงเส้น
η= β0+ β1X1+ . . . + βkXk
ที่ถูกส่งผ่านฟังก์ชันลิงก์ :ก.
ก.(E(Y) ) = η
โดยที่ฟังก์ชันลิงก์เป็นฟังก์ชันlogit
E( Y| X, β) = p = logit- 1( η)
โดยที่รับเฉพาะค่าในและฟังก์ชัน logit ผกผันจะแปลงชุดค่าผสมเชิงเส้นเป็นช่วงนี้ นี่คือที่การถดถอยโลจิสติกแบบดั้งเดิมสิ้นสุดลง{ 0 , 1 } ηY{ 0 , 1 }η
อย่างไรก็ตามหากคุณจำได้ว่าสำหรับตัวแปรที่รับเฉพาะค่าใน , มากกว่าถือได้ว่าเป็นเบต้า) ในกรณีนี้การส่งออกฟังก์ชั่น logit อาจจะคิดว่าเป็นน่าจะเป็นเงื่อนไขของ "ความสำเร็จ" คือเบต้า) การแจกแจงเบอร์นูลลีเป็นการแจกแจงที่อธิบายความน่าจะเป็นในการสังเกตผลลัพธ์ไบนารีด้วยพารามิเตอร์ดังนั้นเราจึงสามารถอธิบายเป็น{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p YE( Y) = P( Y= 1 ){ 0 , 1 }E( Y| X, β)P( Y= 1 | X, β)P( Y= 1 | X, β)พีY
Yผม∼ Bernoulli ( p )
ดังนั้นด้วยการถดถอยโลจิสติกที่เรามองหาพารามิเตอร์บางที่ togeder กับตัวแปรอิสระรูปแบบการรวมกันเชิงเส้น\ในการถดถอยแบบคลาสสิก (เราถือว่าฟังก์ชันลิงก์เป็นฟังก์ชันตัวตน) อย่างไรก็ตามสำหรับโมเดลที่รับค่าในเราจำเป็นต้องแปลงเพื่อให้พอดี ในช่วงX η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE( Y| X, β) = ηY{ 0 , 1 }η[ 0 , 1 ]
ทีนี้เพื่อประเมินการถดถอยโลจิสติกส์ในแบบเบย์คุณจะได้รับค่าพารามิเตอร์สำหรับเช่นเดียวกับการถดถอยเชิงเส้น (ดูKruschke et al, 2012 ) จากนั้นใช้ฟังก์ชัน logit เพื่อแปลงชุดเชิงเส้นเพื่อใช้ผลลัพธ์เป็นพารามิเตอร์ของการแจกแจงแบบ Bernoulli ที่อธิบายตัวแปรของคุณ ดังนั้นใช่คุณใช้สมการและฟังก์ชันการเชื่อมโยง logit แบบเดียวกับในกรณี frequentionist และส่วนที่เหลือทำงาน (เช่นการเลือกนักบวช) เช่นการประเมินการถดถอยเชิงเส้นแบบเบย์ η P YβผมηพีY
วิธีง่าย ๆ ในการเลือกไพรเออร์คือการเลือกการแจกแจงปกติ ( แต่คุณยังสามารถใช้การแจกแจงอื่น ๆ เช่น - หรือการกระจาย Laplace สำหรับรูปแบบที่มีประสิทธิภาพมากขึ้น) สำหรับ 's กับพารามิเตอร์และที่ตั้งไว้หรือนำ จากไพรเออร์ลำดับชั้น ตอนนี้มีคำจำกัดความของแบบจำลองคุณสามารถใช้ซอฟต์แวร์เช่นJAGSเพื่อทำการจำลองแบบมาร์คอฟเชนมอนติคาร์โลเพื่อให้คุณสามารถประเมินแบบจำลองได้ ด้านล่างฉันโพสต์รหัส JAGS สำหรับรูปแบบโลจิสติกง่าย (ตรวจสอบที่นี่สำหรับตัวอย่างเพิ่มเติม)β i μ i σ 2 iเสื้อβผมμผมσ2ผม
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
อย่างที่คุณเห็นรหัสนี้แปลเป็นคำจำกัดความของโมเดลโดยตรง สิ่งที่ซอฟต์แวร์ไม่สามารถจะดึงค่าจากไพรเออร์ปกติa
และb
จากนั้นจะใช้ค่าเหล่านั้นในการประมาณการp
และในที่สุดก็ใช้ฟังก์ชั่นความน่าจะเป็นที่จะประเมินว่าน่าจะเป็นข้อมูลของคุณได้รับพารามิเตอร์เหล่านั้น (นี้คือเมื่อคุณใช้ Bayes ทฤษฎีบทดูที่นี่สำหรับ คำอธิบายรายละเอียดเพิ่มเติม)
แบบจำลองการถดถอยโลจิสติกขั้นพื้นฐานสามารถขยายไปยังแบบจำลองการพึ่งพาระหว่างตัวทำนายโดยใช้แบบจำลองลำดับชั้น (รวมถึงhyperpriors ) ในกรณีนี้คุณสามารถดึงจากการกระจายแบบหลายตัวแปรปกติที่ทำให้เราสามารถรวมข้อมูลเกี่ยวกับความแปรปรวนร่วมระหว่างตัวแปรอิสระ ΣβผมΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼ M V N ⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥, ⎡⎣⎢⎢⎢⎢⎢σ20σ1 , 0⋮σk , 0σ0 , 1σ21⋮σk , 1......⋱...σ0 , kσ1 , k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
... แต่นี่จะเป็นรายละเอียดดังนั้นเรามาหยุดตรงนี้
ส่วน "Bayesian" ในที่นี้คือการเลือกนักบวชโดยใช้ทฤษฎีบทของ Bayes และกำหนดรูปแบบในเงื่อนไขที่น่าจะเป็น ดูที่นี่สำหรับความหมายของ "รูปแบบเบส์"และนี่คือบางสัญชาตญาณทั่วไปเกี่ยวกับวิธีการแบบเบย์ สิ่งที่คุณสามารถสังเกตเห็นได้คือการกำหนดแบบจำลองนั้นค่อนข้างตรงไปตรงมาและมีความยืดหยุ่นด้วยวิธีการนี้
Kruschke, JK, Aguinis, H. , & Joo, H. (2012) ถึงเวลาแล้ว: วิธีการแบบเบย์สำหรับการวิเคราะห์ข้อมูลในวิทยาศาสตร์ขององค์กร ระเบียบวิธีวิจัยองค์กร, 15 (4), 722-752
Gelman, A. , Jakulin, A. , Pittau, GM, และ Su, Y.-S. (2008) การแจกแจงเริ่มต้นก่อนหน้านี้ที่ให้ข้อมูลอ่อนสำหรับโลจิสติกและโมเดลการถดถอยอื่น ๆ พงศาวดารของสถิติประยุกต์ 2 (4), 1360–1383