เหตุใดจึงใช้การแจกแจงแบบเบต้าบนพารามิเตอร์ Bernoulli สำหรับการถดถอยโลจิสติกแบบลำดับชั้น


13

ฉันกำลังอ่านหนังสือ "Doing Bayesian Data Analysis" ที่ยอดเยี่ยมของ Kruschke อย่างไรก็ตามบทที่เกี่ยวกับการถดถอยโลจิสติกแบบลำดับชั้น (บทที่ 20) ค่อนข้างสับสน

รูปที่ 20.2 อธิบายการถดถอยโลจิสติกแบบลำดับชั้นที่พารามิเตอร์ Bernoulli ถูกกำหนดเป็นฟังก์ชันเชิงเส้นของสัมประสิทธิ์ที่ถูกแปลงผ่านฟังก์ชัน sigmoid นี่น่าจะเป็นวิธีการถดถอยโลจิสติกแบบลำดับชั้นในตัวอย่างส่วนใหญ่ที่ฉันเคยเห็นในแหล่งอื่น ๆ ทางออนไลน์เช่นกัน ตัวอย่างเช่น - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

อย่างไรก็ตามเมื่อตัวทำนายมีค่าน้อยที่สุดเขาจะเพิ่มเลเยอร์ในลำดับชั้น - พารามิเตอร์ Bernoulli ถูกดึงมาจากการแจกแจงแบบเบต้า (รูปที่ 20.5) ด้วยพารามิเตอร์ที่กำหนดโดย mu และ kappa โดยที่ mu คือการแปลง sigmoid ของฟังก์ชันเชิงเส้นของสัมประสิทธิ์ และคัปปาใช้แกมมามาก่อน

ดูเหมือนว่าจะสมเหตุสมผลและคล้ายคลึงกับตัวอย่างการพลิกเหรียญจากบทที่ 9 แต่ฉันไม่เห็นว่าการคาดการณ์เล็กน้อยจะทำอย่างไรกับการเพิ่มการแจกแจงแบบเบต้า เหตุใดจึงไม่ทำเช่นนี้ในกรณีของตัวทำนายเมตริกและทำไมการแจกแจงเบต้าถูกเพิ่มเข้ามาสำหรับตัวทำนายที่ระบุ?

แก้ไข:ชี้แจงเกี่ยวกับรูปแบบที่ฉันหมายถึง ก่อนอื่นโมเดลการถดถอยโลจิสติกพร้อมตัวทำนายเมตริก (ไม่มีเบต้าก่อน) นี่คล้ายกับตัวอย่างอื่น ๆ ของการถดถอยโลจิสติกส์แบบลำดับชั้นเช่นตัวอย่างข้อบกพร่องด้านบน:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

จากนั้นเป็นตัวอย่างที่มีตัวพยากรณ์เล็กน้อย ที่นี่ฉันไม่เข้าใจบทบาทของระดับ "ต่ำกว่า" ของลำดับชั้น (การรวมผลลัพธ์โลจิสติกส์เป็นเบต้าก่อนหน้าสำหรับทวินาม) และสาเหตุที่ควรแตกต่างจากตัวอย่างเมตริก

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

คำตอบ:


9

ทั้งสองแบบที่คุณเปรียบเทียบมีคุณสมบัติภายนอกมากมายและฉันคิดว่าคุณสามารถระบุคำถามของคุณได้ชัดเจนยิ่งขึ้นในบริบทของแบบจำลองที่เรียบง่ายสองแบบต่อไปนี้:

รุ่น 1:

yi|μiBern(μi)μiπ(μi)

รุ่น 2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

คำถามของคุณคือ: (1) การกระจายของเบต้ามีบทบาทอย่างไร และที่เกี่ยวข้อง (2) อย่างไร (ถ้าทั้งหมด) รุ่น 2 แตกต่างจากรุ่น 1 อย่างไร

บนพื้นผิวสิ่งเหล่านี้ดูเหมือนจะเป็นแบบจำลองที่แตกต่างกันไป แต่ในความเป็นจริงการกระจายของในทั้งสองรุ่นนั้นเหมือนกัน การกระจายด้านหลังของในรูปแบบ 1 คือ ในขณะที่การกระจายด้านหลังของในแบบจำลอง 2 คือ: μiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

ดังนั้นความได้เปรียบใด ๆ ที่ได้จากการใช้แบบจำลอง 2 คือการคำนวณ แบบจำลองลำดับชั้นที่มีพารามิเตอร์มากเกินไปเช่นการเพิ่มในรุ่น 2 บางครั้งสามารถปรับปรุงประสิทธิภาพของขั้นตอนการสุ่มตัวอย่างได้ ตัวอย่างเช่นโดยการแนะนำความสัมพันธ์ผันผันตามเงื่อนไขระหว่างกลุ่มของพารามิเตอร์ (ดูคำตอบของ Jack Tanner) หรือแบ่งความสัมพันธ์ระหว่างพารามิเตอร์ที่สนใจ (google "Parameter Expansion")θi


5

เหตุผลสำหรับการวาดภาพพารามิเตอร์ Bernoulli จากการกระจายเบต้าคือว่าเบต้าคือผันไปทวินาม การใช้การแจกแจงก่อนคอนจูเกตช่วยให้โซลูชันแบบปิดเพื่อค้นหาหลัง

แก้ไข: ชี้แจง ทั้งสองรุ่นจะทำงาน แม้แต่กับ MCMC มันก็มีประโยชน์ที่จะมีนักบวชพ้องเพราะมันอนุญาตให้ใช้ตัวอย่างพิเศษสำหรับการแจกแจงประเภทต่าง ๆ ที่มีประสิทธิภาพมากกว่าแซมเพลอร์ทั่วไป ตัวอย่างเช่นดูคู่มือผู้ใช้ JAGS วินาที 4.1.1 และวินาที 4.2


อาจมีบริบทไม่เพียงพอจากหนังสือในคำถามของฉัน แต่การวิเคราะห์เหล่านี้ดำเนินการโดยการสุ่มตัวอย่างจากกิ๊บส์ดังนั้นการแสดงรูปแบบปิดของหลังจึงไม่จำเป็น ในตัวอย่างที่ฉันเชื่อมโยงพารามิเตอร์ bernoulli ไม่ได้รับการแก้ไขเป็นการกระจายแบบเบต้า แต่เกิดขึ้นจากการแปลง sigmoid ของตัวทำนายเชิงเส้นซึ่งมีการกระจายสัมประสิทธิ์ตามปกติ นี่เป็นวิธีที่ Kruschke นำเสนอตัวอย่างก่อนหน้านี้ (ด้วยเครื่องทำนายเมตริก) ในบทนี้เช่นกัน (พารามิเตอร์ bernoulli เป็นเพียงการแปลง sigmoid ของฟังก์ชันเชิงเส้นที่มีสัมประสิทธิ์การแจกแจงแบบปกติ)
4733

@ user4733 Jack Tanner ถูกต้องเกี่ยวกับเบต้าเป็นคอนจูเกตก่อนที่จะตัวอย่าง bernoulli ดูเหมือนว่าเป็นเรื่องบังเอิญมากกว่าที่ได้รับเลือก ใช่คุณอาจทำการสุ่มตัวอย่างกิ๊บส์เพื่อรับการแจกแจงด้านหลัง แต่ในรูปแบบลำดับชั้นมีมากกว่าหนึ่งก่อนที่เกี่ยวข้องและอาจเป็นไปได้ว่าคุณจะใส่ก่อนหน้านี้ในพารามิเตอร์ (พารามิเตอร์สำหรับครอบครัวของการกระจายก่อนหน้านี้) ก่อนหน้านี้หากคุณต้องการก่อนหน้านี้ในบริบทนั้นอาจสะดวกในการใช้งานคอนจูเกตก่อนหน้านี้คำอธิบายบางส่วนของหนังสือเล่มนี้ทำให้เราสับสน
Michael R. Chernick

1
คุณกำลังตัดตอนข้อความเล็กน้อยที่สร้างช่องว่างในความสามารถของเราที่จะเข้าใจสิ่งที่เกิดขึ้น คุณต้องอธิบายรูปแบบและลำดับชั้นของนักบวชที่ดีกว่าสำหรับเราที่จะช่วย (อย่างน้อยสำหรับฉัน)>
Michael R. Chernick

เพิ่มคำอธิบายลงในโมเดลลำดับชั้นที่ฉันกำลังอ้างอิง หวังว่ามันจะช่วย
user4733
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.