วิธีตัวอย่างจากการกระจายแบบไม่ต่อเนื่องในจำนวนเต็มไม่ลบ


10

ฉันมีการกระจายแบบไม่ต่อเนื่องโดยที่เป็นค่าคงที่ที่รู้จัก:α,β

p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,

มีวิธีใดบ้างในการสุ่มตัวอย่างอย่างมีประสิทธิภาพจากการกระจายนี้

คำตอบ:


9

นี่คือการแจกแจงทวินามลบแบบเบต้าโดยมีพารามิเตอร์ในกรณีของคุณโดยใช้สัญลักษณ์ Wikipedia มันยังตั้งชื่อการกระจายBeta-Pascalเมื่อเป็นจำนวนเต็ม ดังที่คุณได้กล่าวไว้ในความคิดเห็นนี่คือการแจกแจงแบบทำนายล่วงหน้าในรูปแบบทวินามลบของเบย์เซียพร้อมกับคอนจูเกตเบต้าก่อนหน้าความน่าจะเป็นที่ประสบความสำเร็จr=1r

ดังนั้นคุณสามารถลิ้มลองได้โดยการสุ่มตัวอย่างตัวแปรแล้วสุ่มตัวอย่างตัวแปรทวินามเชิงลบ (กับในกรณีของคุณที่เป็น เพื่อบอกการกระจายตัวเชิงเรขาคณิต)Beta(α,β)uNB(r,u)r=1

brrการกระจายนี้จะดำเนินการในแพคเกจการ R เก็บตัวอย่างมีชื่อrbeta_nbinom, PMF มีชื่อdbeta_nbinomฯลฯ สัญลักษณ์เป็น , , dตรวจสอบ:a=rc=αd=β

> Alpha <- 2; Beta <- 3
> a <- 1
> all.equal(brr::dbeta_nbinom(0:10, a, Alpha, Beta), beta(Alpha+a, Beta+0:10)/beta(Alpha,Beta))
[1] TRUE

เมื่อมองไปที่โค้ดเราจะเห็นได้ว่ามันเรียกจริง ๆ แล้วว่าการghyperกระจายตัวของSuppDistsแพ็กเกจในตระกูล

brr::rbeta_nbinom
function(n, a, c, d){
  rghyper(n, -d, -a, c-1)
}

ineed การกระจายบีเอ็นบีเป็นที่รู้จักกันเป็นประเภท IVทั่วไปกระจาย hypergeometric ดูความช่วยเหลือจากghyperในSuppDistsแพ็คเกจ ผมเชื่อว่านี้ยังสามารถพบได้ในจอห์นสันและอัลหนังสือUnivariate ไม่ต่อเนื่องกระจาย


คำตอบนี้ดีมาก แต่จะดียิ่งขึ้นถ้าคุณพิสูจน์ว่าความหนาแน่น OP ที่โพสต์นั้นเหมือนกับความหนาแน่นทวินามลบ
Sycorax พูดว่า Reinstate Monica

1
@ user777 ฉันคิดว่าผู้เขียน OP พิสูจน์ด้วยตัวเองในมุมมองของเขาต่อคำตอบของซีอาน
Stéphane Laurent

10

ระบุว่ากำลังลดลงด้วยฉันขอแนะนำให้สร้างชุดรูปแบบและคำนวณผลรวมสะสมจนกว่าสำนึกแล้วเท่ากับที่สอดคล้องkตั้งแต่

Beta(α+1,β+x)Beta(α,β)=αα+β+xβ+x1α+β+x1βα+β
xuU(0,1)
Sk=x=0kBeta(α+1,β+x)Beta(α,β)
Sk>u
k
Rx=Beta(α+1,β+x)Beta(α,β)=αα+β+xβ+x1α+β+x1βα+β=α+β+x1α+β+xβ+x1α+β+x1Rx1=β+x1α+β+xRx1
และการคำนวณสามารถหลีกเลี่ยงการใช้ฟังก์ชันแกมม่าทั้งหมด
Sk=Sk1+Rk

1
(+1) การใช้จะเร่งอย่างมาก งาน Sk=1Γ(a+b)Γ(b+k+1)Γ(b)Γ(a+b+k+1)
whuber

1
เรื่องการแก้ไข: ผมสงสัยว่าการใช้ประโยชน์จากฟังก์ชั่นแกมมาจะยังคงเป็นประโยชน์ในการแก้สำหรับในแง่ของ ,และ\ยกตัวอย่างเช่นหนึ่งสามารถหาประมาณเริ่มต้นไปยังโดยใช้สูตรของสเตอร์ลิงในการประเมินผลของและและจากนั้นขัดที่มีไม่กี่ Newton-Raphson ขั้นตอน จำเป็นต้องประเมิน Log Logma และอนุพันธ์ของมัน แน่นอนว่าถ้าและมีทั้งอินทิกรัลการแก้ปัญหาก็คือรากของพหุนาม - แต่ถึงอย่างนั้นการใช้แกมม่าก็อาจจะเป็นหนทางไป kuαβuΓ(b+k+1)Γ(a+b+k+1)αβ
whuber

1
คำตอบที่ดี! ฉันยอมรับคำตอบที่ได้รับจาก SL เพราะมันทำให้ประเด็นสำคัญ (ไม่ใช่ส่วนหนึ่งของคำถามเดิม) การสุ่มตัวอย่างจากการคาดการณ์หลังนั้นเทียบเท่ากับการสุ่มตัวอย่างพารามิเตอร์จากผู้หลังแล้วทำการสุ่มข้อมูลจากความน่าจะเป็น โดยเฉพาะอย่างยิ่งฟังก์ชั่นการกระจายดังกล่าวข้างต้นคือการทำนายหลังของข้อมูลทางเรขาคณิตที่มีเบต้าก่อนในพารามิเตอร์พีp
jII
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.