ทำไม


21

พื้นหลัง

หนึ่งของสินค้าที่อ่อนแอก่อนในความแปรปรวนมากที่สุดคือการผกผันแกมมากับพารามิเตอร์ (Gelman 2006)α=0.001,β=0.001

อย่างไรก็ตามการกระจายนี้มี CI 90% ของประมาณ ][3×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

จากนี้ฉันตีความว่าให้ความน่าจะเป็นต่ำที่ความแปรปรวนจะสูงมากและความน่าจะเป็นต่ำมากที่ความแปรปรวนจะน้อยกว่า 1 P ( σ < 1 | α = 0.001 , β = 0.001 ) = 0.006ผมG(0.001,0.001)P(σ<1|α=0.001,β=0.001)=0.006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

คำถาม

ฉันขาดอะไรไปหรือเปล่า

อัปเดตเพื่อชี้แจงเหตุผลที่ฉันพิจารณา 'ข้อมูล' นี้เป็นเพราะอ้างอย่างยิ่งว่าความแปรปรวนนั้นใหญ่หลวงและสูงกว่าระดับของความแปรปรวนเกือบทุกอย่างที่เคยวัด

การติดตามการวิเคราะห์เมตาของการประมาณค่าความแปรปรวนจำนวนมากจะให้เหตุผลที่เหมาะสมกว่ามาก่อนหรือไม่


การอ้างอิง

Gelman 2006 แจกแจงก่อนสำหรับพารามิเตอร์แปรปรวนในรูปแบบลำดับชั้น การวิเคราะห์แบบเบย์ 1 (3): 515–533


1
ไม่ใช่ "จริง" ไม่ใช่มาก่อนไม่ใช่การกระจาย ดังนั้นจึงไม่มีความน่าจะเป็นก่อนหน้านี้เช่น P (sigma <1)
Stéphane Laurent

คำตอบ:


38

ด้วยการใช้การแจกแจงแกมม่าแบบผกผันเราได้รับ:

พี(σ2|α,β)α(σ2)-α-1ประสบการณ์(-βσ2)

คุณสามารถเห็นได้อย่างง่ายดายว่าถ้าและα 0ดังนั้นแกมมาผกผันจะเข้าหา Jeffreys ก่อน การกระจายนี้เรียกว่า "uninformative" เพราะมันเป็นการประมาณค่าที่เหมาะสมของ Jeffreys ก่อนβ0α0

พี(σ2)α1σ2

ซึ่งไม่ได้เป็นข้อมูลเบื้องต้นสำหรับพารามิเตอร์ของสเกลดูที่หน้า 18 ที่นี่เนื่องจากสิ่งนี้ก่อนหน้าเป็นสิ่งเดียวที่ยังคงไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงของมาตราส่วน (โปรดทราบว่าการประมาณนั้นไม่คงที่) นี้มีความสำคัญไม่แน่นอนของซึ่งแสดงให้เห็นว่ามันเป็นสิ่งที่ไม่เหมาะสมถ้าช่วงของσ 2รวมทั้ง0หรือ∞ แต่กรณีเหล่านี้เป็นเพียงปัญหาในคณิตศาสตร์ - ไม่ใช่ในโลกแห่งความจริง ไม่เคยสังเกตค่าอนันต์สำหรับความแปรปรวนและถ้าความแปรปรวนที่สังเกตเห็นเป็นศูนย์คุณมีข้อมูลสมบูรณ์แบบ! สำหรับคุณสามารถตั้งค่าขีด จำกัด ล่างเท่ากับL > 0และขีด จำกัด บนเท่ากับUเข้าสู่ระบบ(σ2)σ20L>0และการกระจายของคุณเหมาะสมยู<

ในขณะที่มันอาจดูแปลกว่านี่คือ "uninformative" ในที่มันชอบความแปรปรวนขนาดเล็กเพื่อใหญ่ แต่นี่เป็นเพียงระดับเดียว คุณสามารถแสดงให้เห็นว่ามีการกระจายชุดที่ไม่เหมาะสม ดังนั้นสิ่งนี้ก่อนหน้านี้ไม่ได้ให้ประโยชน์กับคนอื่นเข้าสู่ระบบ(σ2)

แม้ว่าจะไม่ได้เกี่ยวข้องโดยตรงกับคำถามของคุณผมจะแนะนำให้ "ดี" ที่ไม่ใช่การกระจายข้อมูลโดยการเลือกขีด จำกัด บนและล่างและUในฟรีย์ก่อนมากกว่าαและβ โดยปกติแล้วข้อ จำกัด สามารถตั้งค่าได้ค่อนข้างง่ายด้วยความคิดเล็กน้อยถึงความหมายของσ 2ในโลกแห่งความเป็นจริง หากเป็นข้อผิดพลาดในปริมาณทางกายภาพบางประเภท - Lต้องไม่เล็กกว่าขนาดของอะตอมหรือขนาดที่เล็กที่สุดที่คุณสามารถสังเกตได้ในการทดลองของคุณ เพิ่มเติมULยูαβσ2Lยูไม่สามารถใหญ่กว่าโลกได้ (หรือดวงอาทิตย์ถ้าคุณต้องการอนุรักษ์นิยมจริงๆ) วิธีนี้คุณจะให้คุณสมบัติไม่แปรเปลี่ยนของคุณและมันง่ายขึ้นก่อนที่จะมีตัวอย่างจาก: Take แล้วค่าจำลองเป็นσ 2 ( ) = ประสบการณ์( Q ( ) )Q()~ยูnผมโอRม.(เข้าสู่ระบบ(L),เข้าสู่ระบบ(ยู))σ()2=ประสบการณ์(Q())


5
+1 สำหรับการตอบคำถามไม่เพียง แต่ยังให้คำแนะนำที่เป็นประโยชน์
whuber

ล.โอก.(σ)

Bอีเสื้อa2(1,1)F1,1Bอีเสื้อa2(0,0)
ความเป็นไปได้ที่จะเกิดขึ้น

1
[0,]σ~อีxพี(ยู(ล.โอก.(L),ล.โอก.(ยู))σ~ยู(L,ยู)
David LeBauer

(0,)α=1,β=1/2

10

มันค่อนข้างใกล้เคียงกับแฟลต ค่ามัธยฐานของมันคือ 1.9 E298 เกือบจะเป็นเลขที่ใหญ่ที่สุดที่สามารถเป็นเลขคณิตแบบลอยตัวที่มีความแม่นยำสองเท่า ในขณะที่คุณชี้ให้เห็นความน่าจะเป็นที่จะกำหนดให้กับช่วงเวลาใด ๆ ที่ไม่ใหญ่มากนั้นเล็กมาก ๆ มันยากที่จะได้รับข้อมูลน้อยกว่านั้น!


ขอบคุณสำหรับคำอธิบายของคุณ ฉันพบปัญหาการลู่เข้าและฉันรู้สึกประหลาดใจที่ตัวแปรที่ฉันทำงานด้วยมีค่าเฉลี่ยอยู่ที่ <1,000 (เช่นถ้ามีอะไร> 1,000 กรัมวัดเป็นกิโลกรัม) และความแปรปรวนอยู่ในลำดับเดียวกันของ ขนาด. ดังนั้นฉันจึงตระหนักว่าฉันต้องการนักบวชมากขึ้นที่รวมข้อมูลนี้แม้ว่าฉันจะไม่เคยมีความรู้มาก่อนเกี่ยวกับคุณค่าของมันหรือวิธีการแบ่งพาร์ติชัน
David LeBauer

ด้านหลังของคุณอาจจะใกล้เคียงกับการใช้สิ่งนี้อย่างไม่เหมาะสม
JMS
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.