แบน, คอนจูเกต, และไฮเปอร์ไพรเมอร์ พวกเขาคืออะไร


15

ฉันกำลังอ่านเกี่ยวกับวิธีการแบบเบย์ในการคำนวณวิวัฒนาการโมเลกุลของหยาง ในหัวข้อที่ 5.2 พูดถึงนักบวช

นี่อาจเป็นการขอให้มีการพูดเกินจริง แต่มีคนอธิบายความแตกต่างระหว่างนักบวชประเภทนี้และวิธีการที่มีผลต่อผลลัพธ์ของการวิเคราะห์ / การตัดสินใจที่ฉันจะทำในระหว่างกระบวนการวิเคราะห์แบบเบย์

(ฉันไม่ใช่นักสถิติและฉันเพิ่งเริ่มออกเดินทางเพื่อเรียนรู้การวิเคราะห์แบบเบย์ดังนั้นยิ่งเป็นคนธรรมดามากเท่าไรก็ยิ่งดี)

คำตอบ:


15

กล่าวง่ายๆคือจะใช้แบบแบน / ไม่มีข้อมูลก่อนเมื่อมีความรู้เพียงเล็กน้อย / ไม่มีข้อมูลและด้วยเหตุนี้มันจึงมีผลกระทบน้อยที่สุดต่อผลลัพธ์ของการวิเคราะห์ของคุณ (เช่นการอนุมานด้านหลัง)

Conjugate distributions คือ Conjugate distributions ที่เป็นมาก่อนและหลังที่เหมือนกันและก่อนหน้านี้เรียกว่า conjugate ก่อน มันได้รับการสนับสนุนสำหรับความสะดวกสบายเกี่ยวกับพีชคณิตโดยเฉพาะอย่างยิ่งเมื่อโอกาสมีการกระจายในรูปแบบของครอบครัวชี้แจง (Gaussian, Beta, ฯลฯ ) สิ่งนี้มีประโยชน์อย่างมากเมื่อทำการจำลองหลังโดยใช้การสุ่มตัวอย่างจากกิ๊บส์

และในที่สุดก็จินตนาการว่าการกระจายก่อนหน้านั้นตั้งอยู่ที่พารามิเตอร์ในโมเดลของคุณอย่างไรก็ตามคุณต้องการเพิ่มระดับความซับซ้อน / ความไม่แน่นอนอีกระดับ จากนั้นคุณจะกำหนดการกระจายก่อนหน้านี้ในพารามิเตอร์ของก่อนหน้านี้ก่อนจึงชื่อไฮเปอร์ -ก่อน

ฉันคิดว่าการวิเคราะห์ข้อมูลแบบเบย์ของ Gelman เป็นการเริ่มต้นที่ดีสำหรับทุกคนที่สนใจเรียนรู้สถิติแบบเบย์ :)


1
สองการรับรองการวิเคราะห์ข้อมูลแบบเบย์
Sycorax พูดว่า Reinstate Monica

14

ในระดับสูงสุดเราสามารถคิดได้ว่านักบวชทุกคนสามารถระบุข้อมูลจำนวนหนึ่งที่นักวิจัยนำมาใช้ในการวิเคราะห์นอกข้อมูลเอง: ก่อนที่จะดูข้อมูลค่าพารามิเตอร์ใดมีแนวโน้มมากขึ้น?

ในยุคมืดของการวิเคราะห์แบบเบย์เมื่อชาวเบย์ได้ต่อสู้กับผู้ใช้บ่อยครั้งมีความเชื่อว่าผู้วิจัยต้องการนำข้อมูลเล็ก ๆ น้อย ๆ มาวิเคราะห์ก่อนหน้านี้ ดังนั้นจึงมีการวิจัยและการถกเถียงมากมายที่อุทิศให้กับการทำความเข้าใจวิธีการแม่นยำก่อนหน้านี้อาจเป็น "ไม่ให้ข้อมูล" ด้วยวิธีนี้ วันนี้ Gelman โต้แย้งกับตัวเลือกอัตโนมัติของนักบวชที่ไม่ใช่นักพูดโดยอัตโนมัติในการวิเคราะห์ข้อมูลแบบเบย์คำอธิบายที่ว่า "noninformative" สะท้อนให้เห็นถึงทัศนคติของเขาที่มีต่อก่อนหน้านี้มากกว่าคุณสมบัติทางคณิตศาสตร์ "พิเศษ" ของก่อนหน้านี้ (ยิ่งไปกว่านั้นมีคำถามในวรรณคดียุคแรกที่ระดับก่อนหน้านี้เป็นแบบ noninformative ฉันไม่คิดว่านี่เป็นสิ่งสำคัญอย่างยิ่งสำหรับคำถามของคุณ แต่เพื่อเป็นตัวอย่างที่ดีของการโต้แย้งนี้จากมุมมองของนักสะสม ของ Gary King, Unifying ระเบียบวิธีทางการเมือง. )

ก่อน "แบน" บ่งชี้ถึงเครื่องแบบก่อนที่ค่าทั้งหมดในช่วงมีแนวโน้มที่เท่าเทียมกัน อีกครั้งมีข้อโต้แย้งที่จะต้องพิจารณาว่าสิ่งเหล่านี้ไม่ใช่ข้อมูลจริงหรือไม่เนื่องจากระบุว่าค่าทั้งหมดมีความเป็นไปได้เท่าเทียมกันในบางประการข้อมูลและอาจมีความอ่อนไหวต่อวิธีการสร้างแบบจำลองพารามิเตอร์ นักบวชแบนมีประวัติอันยาวนานในการวิเคราะห์แบบเบย์ยืดกลับไปที่เบย์และลาปลาส

ก่อนหน้านี้ "คลุมเครือ" จะกระจายอย่างมาก แต่ไม่จำเป็นต้องแบนและเป็นการแสดงออกว่าช่วงของค่าขนาดใหญ่มีความน่าเชื่อถือมากกว่ามุ่งเน้นไปที่มวลความน่าจะเป็นรอบช่วงที่เฉพาะเจาะจง โดยพื้นฐานแล้วมันเป็นสิ่งที่มีความแปรปรวนสูงมาก่อน (ความแปรปรวน "สูง" ใด ๆ ก็ตามในบริบทของคุณ)

Conjugate priors มีคุณสมบัติที่สะดวกสบายที่เมื่อคูณด้วยความน่าจะเป็นที่เหมาะสมพวกมันสร้างนิพจน์แบบปิด ตัวอย่างหนึ่งของสิ่งนี้คือเบต้าก่อนที่มีโอกาสเป็นทวินามหรือแกมม่าก่อนที่มีโอกาสเป็นปัวซอง มีตารางที่เป็นประโยชน์เหล่านี้ทั่วอินเทอร์เน็ตและ Wikipedia ตระกูลชี้แจงมีความสะดวกมากในเรื่องนี้

Conjugate Priors มักจะเป็นตัวเลือก "เริ่มต้น" สำหรับปัญหาบางอย่างเนื่องจากคุณสมบัติที่สะดวกของพวกเขา แต่นี่ไม่ได้หมายความว่าพวกเขาเป็น "ดีที่สุด" เว้นแต่ว่าความรู้ก่อนหน้านี้จะแสดงผ่านทางคอนจูเกตก่อน ความก้าวหน้าในการคำนวณหมายถึงการผันคำกริยานั้นไม่ใช่สิ่งที่คุ้มค่าอย่างที่มันเคยเป็นมาก่อน (cf Gibbs sampling vs NUTS) ดังนั้นเราจึงสามารถทำการอนุมานได้ง่ายขึ้นกับนักบวช nonconjugate โดยไม่มีปัญหามาก

ยังไม่มีข้อความ(μ,σ2)μσ2μσ2


1
นอกจากนี้บางครั้งมันก็ไม่ชัดเจนว่า 'ข้อมูล' คืออะไรและ 'ข้อมูลก่อนหน้า' คืออะไรดูคำตอบของฉันที่stats.stackexchange.com/questions/112451/… สำหรับตัวอย่าง
kjetil b halvorsen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.