หนึ่งจะทำให้การกระจายความน่าจะเป็นก่อนเป็นทางการได้อย่างไร มีกฎของหัวแม่มือหรือเคล็ดลับที่ควรใช้หรือไม่


9

ในขณะที่ฉันชอบคิดว่าฉันมีความเข้าใจอย่างดีเกี่ยวกับแนวคิดของข้อมูลก่อนหน้านี้ในการวิเคราะห์ทางสถิติแบบเบย์และการตัดสินใจ ฉันมีสถานการณ์สองสามอย่างที่เป็นตัวอย่างการต่อสู้ของฉันและฉันรู้สึกว่าพวกเขาไม่ได้รับการกล่าวถึงอย่างถูกต้องในตำราทางสถิติแบบเบย์ที่ฉันได้อ่าน:

สมมติว่าฉันทำแบบสำรวจไม่กี่ปีที่ผ่านมาที่บอกว่า 68% ของผู้คนจะสนใจซื้อผลิตภัณฑ์ ACME ฉันตัดสินใจที่จะเรียกใช้แบบสำรวจอีกครั้ง ในขณะที่ฉันจะใช้ขนาดตัวอย่างเดียวกับครั้งที่แล้ว (พูด, n = 400) ความคิดเห็นของผู้คนมีการเปลี่ยนแปลงตั้งแต่นั้นมา อย่างไรก็ตามหากฉันใช้เป็นรุ่นก่อนหน้ากับการแจกแจงแบบเบต้าซึ่งผู้ตอบแบบสอบถาม 272 จาก 400 คนตอบว่า "ใช่" ฉันจะให้น้ำหนักเท่ากันกับแบบสำรวจที่ฉันวิ่งไปเมื่อสองสามปีก่อน มีกฎง่ายๆที่จะสร้างความไม่แน่นอนที่ยิ่งใหญ่กว่าที่ฉันต้องการก่อนหน้านี้โดยอาศัยอำนาจของข้อมูลที่มีอายุไม่กี่ปี? ฉันเข้าใจว่าฉันสามารถลดค่าก่อนหน้านี้จาก 272/400 เป็น 136/200 แต่สิ่งนี้ให้ความรู้สึกโดยพลการมากและฉันสงสัยว่ามีรูปแบบของการให้เหตุผลบางอย่างหรืออาจเป็นในวรรณกรรม

อีกตัวอย่างหนึ่งสมมติว่าเรากำลังจะทำการทดลองทางคลินิก ก่อนที่จะเริ่มการทดลองเราทำการวิจัยระดับทุติยภูมิซึ่งเราสามารถใช้เป็นข้อมูลก่อนหน้านี้รวมถึงความคิดเห็นของผู้เชี่ยวชาญผลจากการทดลองทางคลินิกก่อนหน้านี้ (จากความเกี่ยวข้องที่แตกต่างกัน) ข้อเท็จจริงทางวิทยาศาสตร์พื้นฐานอื่น ๆ (บางอันไม่ใช่เชิงปริมาณโดยธรรมชาติ) ไปสู่การแจกแจงความน่าจะเป็นก่อนหน้า? เป็นกรณีของการตัดสินใจที่จะเลือกครอบครัวและทำให้ครอบครัวกระจายข้อมูลมากพอที่จะทำให้แน่ใจว่าข้อมูลถูกครอบงำหรือมีงานจำนวนมากเพื่อสร้างการเผยแพร่ก่อนหน้าอย่างเป็นธรรมหรือไม่?


คำตอบ:


4

ความคิดของคุณในการปฏิบัติต่อข้อมูลก่อนหน้าของคุณที่ประสบความสำเร็จ 272 ครั้งในความพยายาม 400 ครั้งนั้นมีเหตุผลที่ชัดเจนพอสมควร

ปัญหาที่คุณจัดการกับปัญหาดังกล่าวคือการประมาณความน่าจะเป็นที่จะประสบความสำเร็จของการทดลองของเบอร์นูลี การแจกแจงแบบเบต้าคือ "คอนจูเกตก่อน" ที่สอดคล้องกัน นักบวชสังยุคดังกล่าวเพลิดเพลินไปกับ "การตีความตัวอย่างที่สมมติขึ้น":θ

เบต้าก่อนหน้าคือ สิ่งนี้สามารถตีความได้ว่าเป็นข้อมูลที่มีอยู่ในตัวอย่างของขนาด (หลวมดังนั้นเนื่องจากไม่จำเป็นต้องเป็นจำนวนเต็ม ) ที่มีสำเร็จ: ดังนั้นหากคุณใช้และสิ่งนี้สอดคล้องกับพารามิเตอร์ก่อนหน้าและ

π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)β01
n_=α0+β02n_α01
π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)n_(α01)
α0+β02=400α01=272α0=273β0=129. "แบ่งครึ่ง" ตัวอย่างจะนำไปสู่พารามิเตอร์ก่อนและ\ทีนี้จำไว้ว่าค่าเฉลี่ยก่อนหน้าและความแปรปรวนก่อนหน้าของการแจกแจงเบต้าจะได้รับโดย การทำให้ตัวอย่างลดลงครึ่งหนึ่งจะทำให้ค่าเฉลี่ยก่อนหน้า (เกือบ) อยู่ที่ไหน:α0=137β0=65
μ=αα+βandσ2=αβ(α+β)2(α+β+1)
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

แต่เพิ่มความแปรปรวนก่อนหน้าจาก

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

ถึง

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

ตามที่ต้องการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.