วิธีการทั่วไปสำหรับการสร้างโซลูชันที่กระจัดกระจายคือผ่านการประมาณค่า MAP ด้วยค่าเฉลี่ยศูนย์ที่เป็นค่าปกติ
p(xi|σ2i)∼N(0,σ2i)
หากคุณกำหนดค่าก่อนหน้าให้กับซึ่งมีโหมดเป็นศูนย์แล้วโหมดหลังมักจะเบาบาง เกิดขึ้นจากวิธีการนี้โดยการกระจายการผสมชี้แจงσ2iL1
p(σ2i|λ)∼Expo(λ22)
จากนั้นคุณจะได้รับ
log[p(xi|λ)]=−λ|xi|+log[λ2]
ทางเลือกบางอย่างคือพาเรโตคู่ทั่วไป, ครึ่งโคชี, เบต้ากลับหัว ในบางแง่เหล่านี้ดีกว่าบ่วงเพราะพวกเขาไม่ได้ลดค่าขนาดใหญ่ ในความเป็นจริงฉันค่อนข้างแน่ใจว่าคู่ pareto ทั่วไปสามารถเขียนเป็นส่วนผสมของเลขชี้กำลัง นั่นคือเราเขียนแล้ววางแกมมาก่อน เบต้า) เราได้รับ:λ=λip(λi|αβ)
p(xi|αβ)=α2β(1+|xi|β)−(α+1)
โปรดทราบว่าฉันได้รวมค่าคงที่ปกติไว้แล้วเนื่องจากพวกเขาช่วยเลือกพารามิเตอร์ส่วนกลางที่ดี ตอนนี้ถ้าเราใช้การ จำกัด ช่วงจากนั้นเรามีปัญหาที่ซับซ้อนมากขึ้นเนื่องจากเราจำเป็นต้องเปลี่ยนมาตรฐานให้เป็นเรื่องธรรมดา
คุณสมบัติทั่วไปอีกประการหนึ่งของการลงโทษที่ทำให้เกิดการกระจัดกระจายคือพวกมันไม่สามารถหาอนุพันธ์ได้ที่ศูนย์ โดยทั่วไปนี่เป็นเพราะขีด จำกัด ด้านซ้ายและขวาเป็นเครื่องหมายตรงข้าม
สิ่งนี้มีพื้นฐานมาจากผลงานอันยอดเยี่ยมของ Nicolas Polson และ James Scott เกี่ยวกับการผสมผสานความหลากหลายที่พวกเขาใช้เพื่อพัฒนา TIRLS ซึ่งเป็นส่วนขยายที่น้อยที่สุดของสี่เหลี่ยมจัตุรัสที่มีขนาดใหญ่มาก ๆ
เป็นอีกทางเลือกหนึ่งที่คุณสามารถใช้ก่อนหน้านี้ซึ่งกำหนดไว้บนเริม แต่มีโหมดในการกระจายขอบที่ศูนย์ ตัวอย่างหนึ่งคือการแจกแจงดีริชเลต์ด้วยพารามิเตอร์ทั้งหมดระหว่าง 0 ถึง 1 การลงโทษโดยนัยจะมีลักษณะดังนี้:
−∑i=1n−1(ai−1)log(xi)−(an−1)log(1−∑i=1n−1xi)
ไหน<1 อย่างไรก็ตามคุณจะต้องระมัดระวังในการปรับตัวเลขให้เหมาะสมเนื่องจากการลงโทษมีความแปลกประหลาด กระบวนการประมาณที่แข็งแกร่งยิ่งขึ้นคือการใช้ค่าเฉลี่ยหลัง แม้ว่าคุณจะสูญเสียความกระจัดกระจายแน่นอนคุณจะได้รับวิธีการหลังจำนวนมากที่อยู่ใกล้กับศูนย์0<ai<1