การเลือกระหว่างนักบวชเบต้ารุ่นใหม่


17

ฉันกำลังมองหานักบวชที่ไม่รู้เรื่องสำหรับการแจกแจงเบต้าเพื่อทำงานกับกระบวนการทวินาม (Hit / Miss) ในตอนแรกที่ผมคิดเกี่ยวกับการใช้α=1,β=1ที่สร้างเครื่องแบบ PDF, หรือเจฟฟรีย์ก่อนα=0.5,β=0.5 0.5 แต่ฉันกำลังมองหาจริงไพรเออร์ที่มีผลกระทบน้อยที่สุดกับผลหลังและจากนั้นผมคิดเกี่ยวกับการใช้งานที่ไม่เหมาะสมก่อนα=0,β=0 0 ปัญหาตรงนี้คือการกระจายตัวด้านหลังของฉันใช้งานได้ก็ต่อเมื่อฉันมีเพลงฮิตอย่างน้อยหนึ่งเพลง เพื่อเอาชนะสิ่งนี้ฉันจึงคิดถึงการใช้ค่าคงที่ที่น้อยมากเช่นα=0.0001,β=0.0001เพียงเพื่อให้มั่นใจว่าหลังαและβจะ0>0

ไม่มีใครรู้ว่าวิธีนี้เป็นที่ยอมรับ? ฉันเห็นเอฟเฟ็กต์ตัวเลขของการเปลี่ยนแปลงก่อนหน้านี้ แต่มีบางคนให้การแปลความหมายของการใส่ค่าคงที่ขนาดเล็กเช่นนี้ในฐานะนักบวช?


1
สำหรับตัวอย่างขนาดใหญ่ที่มีเพลงฮิตและเพลงขาดหายไปมันสร้างความแตกต่างได้เล็กน้อย สำหรับกลุ่มตัวอย่างขนาดเล็กโดยเฉพาะอย่างยิ่งหากไม่มีอย่างน้อยหนึ่งครั้งและพลาดอย่างใดอย่างหนึ่งมันสร้างความแตกต่างใหญ่; แม้แต่ขนาดของ "ค่าคงที่ที่เล็กมาก" ของคุณก็อาจมีผลกระทบอย่างมาก ฉันจะแนะนำให้ทดลองทางความคิดที่สำคัญสำหรับคุณอาจจะเป็นสิ่งที่ชนิดของหลังทำให้รู้สึกหลังจากที่ขนาดตัวอย่าง : นี้อาจชักชวนให้คุณสิ่งที่เหมือนเจฟฟรีย์เอสก่อนเป็นที่เหมาะสม1
เฮนรี่

มีกระดาษหนึ่งชื่อเคอร์แมนแนะนำ 1/3 & 1/3, b
Björn

`ผลกระทบขั้นต่ำต่อผลลัพธ์หลัง 'หมายความว่าอย่างไร เมื่อเทียบกับอะไร
จะ

ฉันได้ปรับปรุงการจัดรูปแบบและชื่อคำถามของคุณอย่าลังเลที่จะเปลี่ยนกลับหรือเปลี่ยนแปลงการแก้ไข
ทิม

คำตอบ:


33

ก่อนอื่นไม่มีสิ่งที่ไม่เป็นมาก่อนเลย ด้านล่างคุณสามารถดูการกระจายหลังซึ่งเกิดจากนักบวช "uninformative" ห้าคน (อธิบายไว้ด้านล่างพล็อต) ที่ให้ข้อมูลที่แตกต่างกัน ในขณะที่คุณสามารถเห็นได้ชัดเจนทางเลือกของไพรเออร์ "uninformative" ได้รับผลกระทบการกระจายหลังโดยเฉพาะอย่างยิ่งในกรณีที่ข้อมูลที่ตัวเองไม่ได้ให้ข้อมูลมากที่สุด

โปสเตอร์จากนักบวชที่ไม่รู้เรื่อง

"uninformative" ไพรเออร์สำหรับการกระจายเบต้าแบ่งทรัพย์สินที่สิ่งที่นำไปสู่การกระจายสมมาตรและα 1 , β 1ทางเลือกทั่วไป: เป็นเครื่องแบบ (Bayes-Laplace) ก่อน ( α = β = 1 ) ฟรีย์ก่อน ( α = β = 1 / 2 ), "Neutral" ก่อน ( α = β = 1 / 3 ) เสนอโดยเคอร์แมน (2011), Haldane ก่อน ( α = β = 0α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0) หรือประมาณ (บทความ Wikipedia ที่ดี )กับ ε > 0 ) (ดูเพิ่มเติมที่α=β=εε>0

พารามิเตอร์ของการแจกแจงก่อนเบต้ามักถูกพิจารณาว่าเป็น "pseudocounts" ของความสำเร็จ ( ) และความล้มเหลว ( β ) นับตั้งแต่การแจกแจงแบบหลังของรูปแบบเบต้า - ทวินามหลังจากสังเกตความสำเร็จyในnαβYnการทดลองคือ

θ|Y~B(α+Y,β+n-Y)

α,βα=β=1n )

ตั้งแต่แรกเห็น Haldane ก่อนดูเหมือนจะเป็น "ไม่รู้แจ้ง" มากที่สุดเนื่องจากมันนำไปสู่ค่าเฉลี่ยหลังซึ่งเท่ากับค่าประมาณความน่าจะเป็นสูงสุด

α+Yα+Y+β+n-Y=Y/n

Y=0Y=n

มีข้อโต้แย้งมากมายสำหรับและต่อต้านนักบวช "ไม่รู้แจ้ง" (ดู Kerman, 2011; Tuyl et al, 2008) ตัวอย่างเช่นที่กล่าวถึงโดย Tuyl et al

101

ในอีกทางหนึ่งการใช้ชุดนักบวชสำหรับชุดข้อมูลขนาดเล็กอาจมีอิทธิพลมาก (คิดในแง่ของ pseudocounts) คุณสามารถค้นหาข้อมูลเพิ่มเติมและการอภิปรายในหัวข้อนี้ในเอกสารและคู่มือต่างๆ

ขออภัย แต่ไม่มี "ดีที่สุด", "ไม่เป็นทางการมากที่สุด" หรือ "หนึ่งขนาดพอดีกับทั้งหมด" แต่ละคนนำข้อมูลบางอย่างเข้ามาในโมเดล

Kerman, J. (2011) คอนจูเกตแบบ noninformative และให้ข้อมูลคอนจูเกตเบต้าและแกมมาก่อนหน้า วารสารอิเล็กทรอนิกส์สถิติ, 5, 1450-1470

Tuyl, F. , Gerlach, R. และ Mengersen, K. (2008) การเปรียบเทียบ Bayes-Laplace, Jeffreys และ Priors อื่น ๆ นักสถิติชาวอเมริกัน 62 (1): 40-44

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.