การประมาณแบบง่ายของการแจกแจงแบบปัวซองในหางยาว?


10

ฉันต้องการตัดสินใจความจุของตารางเพื่อให้มีราคาต่อรองเหลือน้อยกว่าเพื่อล้นสำหรับโดยสมมติว่าจำนวนรายการตามกฎหมายปัวซองที่กำหนด ความคาดหวังใน{12}]2 - พีพี[ 40 ... 120 ] E [ 10 3 ... 10 12 ]C2pp[40120]E[1031012]

เป็นการดีที่ฉันต้องการจำนวนเต็มต่ำสุดCเช่นที่1-CDF[PoissonDistribution[E],C] < 2^-pได้รับpและE; แต่ฉันพอใจกับบางอย่างที่Cสูงกว่านั้นเล็กน้อย Mathematica นั้นใช้ได้กับการคำนวณแบบแมนนวล แต่ฉันต้องการคำนวณCจากpและEณ เวลารวบรวมซึ่ง จำกัด ฉันเป็นเลขจำนวนเต็ม 64 บิต

ปรับปรุง: ใน Mathematica (รุ่น 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]เป็น1231และดูเหมือนว่าถูกต้อง (ขอบคุณ @Procrastinator); อย่างไรก็ตามผลลัพธ์สำหรับทั้งสองp = 50และp = 60เป็น1250สิ่งที่ผิดในด้านที่ไม่ปลอดภัย (และมีความสำคัญ: การทดสอบของฉันซ้ำเช่นครั้งหรือมากกว่าและฉันต้องการความล้มเหลวโดยรวมน้อยกว่าโดยรวม) ฉันต้องการการประมาณคร่าวๆ แต่ปลอดภัยโดยใช้เลขจำนวนเต็ม 64 บิตเท่านั้นซึ่งมีให้ใน C (++) ณ เวลารวบรวม 2 - 30225230


1
แล้วไงC = Quantile[PoissonDistribution[E],1-2^p]ล่ะ

1
ศัพท์นำของฟังก์ชันความน่าจะเป็นมวลของปัวซองนั้นอยู่ในหาง
พระคาร์ดินัล

1
@Procrastinator: ใช่ที่ใช้งานได้ใน Mathematica (ยกเว้นเครื่องหมายpและปัญหาความแม่นยำและชื่อEและCที่สงวนไว้) แต่ฉันต้องการการประมาณอย่างง่ายของที่อาจหยาบ (แต่ในด้านความปลอดภัย) โดยใช้ arityhmetic จำนวนเต็ม 64- บิตเท่านั้น!
fgrieu

3
Re ปรับปรุง: Mathematica 8 ผลตอบแทนที่ 1262 สำหรับและ 1290 สำหรับpการประมาณปกติอีกครั้ง (@Proc): สิ่งนี้ไม่สามารถคาดได้ว่าจะทำงานได้ดีในก้อยซึ่งมีความสำคัญต่อการคำนวณ p = 60p=50p=60
whuber

1
บางทีคุณควรถาม stackoverflow ฉันไม่คุ้นเคยกับข้อ จำกัด ที่คุณมี ฉันไม่ทราบว่าจะห้ามไม่ให้คุณใช้การจัดสรรหน่วยความจำแบบไดนามิกหรือว่าคุณสามารถใช้การแยกสาขาเพื่อตัดสินใจขนาดของอาร์เรย์หรือค่าใช้จ่ายในการกำหนดอาร์เรย์ซึ่งมีขนาดใหญ่เป็นสองเท่าของขนาดที่คุณต้องการ ของมัน) หากฟังก์ชั่นบางอย่างเช่น (เป็นตัวอย่าง) คุณคำตอบที่แน่นอนคุณจะสามารถดำเนินการประมาณภายใต้ข้อ จำกัด ของคุณหรือไม่? ดูเหมือนว่าปัญหาการเขียนโปรแกรมในขณะนี้ μ+loglogμlogμμ+pμlogμ
Douglas Zare

คำตอบ:


10

การกระจายปัวซงที่มีค่าเฉลี่ยขนาดใหญ่นั้นเป็นเรื่องปกติ แต่คุณต้องระวังว่าคุณต้องการหางที่ถูกผูกไว้และการประมาณปกตินั้นมีความแม่นยำน้อยกว่าตามสัดส่วนใกล้กับก้อย

วิธีการหนึ่งที่ใช้ในคำถาม MOและด้วยการแจกแจงทวินามคือการรับรู้ว่าหางลดลงอย่างรวดเร็วกว่าชุดรูปทรงเรขาคณิตดังนั้นคุณสามารถเขียนขอบเขตบนอย่างชัดเจนเป็นชุดรูปทรงเรขาคณิต

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

บรรทัดที่ 2บรรทัดที่ 3 เกี่ยวข้องกับสูตรของสเตอร์ลิง ในทางปฏิบัติฉันคิดว่าคุณต้องการแก้เป็นตัวเลขโดยใช้การค้นหาแบบไบนารี วิธีการของนิวตันเริ่มต้นด้วยการเดาเริ่มต้นของควรทำงานเช่นกันplog2=log(bound)D=μ+cμ.

ตัวอย่างเช่นด้วยและโซลูชันตัวเลขที่ฉันได้คือ 1384.89 การแจกแจงปัวซงที่มีค่าเฉลี่ยนำค่าจากถึงด้วยความน่าจะเป็นค่าถึงเกิดขึ้นกับความน่าจะเป็นμ = 1000 1000 0p=100μ=100010000138411/2100.06.0138311/299.59.


1
+1 อีกวิธีที่เกี่ยวข้องกับความน่าจะเป็นหางปัวซอง (ทางด้านขวา) กับความน่าจะเป็นหางของการแจกแจงแกมม่า (ทางซ้าย) ซึ่งใกล้เคียง (เหนือ) ประมาณด้วยอานประมาณ
whuber

มีทางยาวไปถึงสิ่งที่ จำกัด เลขคณิตจำนวนเต็ม 64 บิต (ไม่มี exp, log, sqrt .. ) แต่ฉันจะทำงานกับมัน; ขอบคุณทุกคน!
fgrieu

(1) ถึงการภาวนาของการประมาณของสเตอร์ลิง (ซึ่งเป็นที่ไม่เกี่ยวข้อง) นี้เป็นว่าผูกพันฉันเป็น (opaquely) อ้างอิงในความคิดเห็นของฉันไปที่สหกรณ์ (ตัวอย่างเช่นดูที่นี่ )
พระคาร์ดินัล

2

คุณอาจจะเห็นพีHarremoës: ชาร์ปขอบเขตบนน่าจะเป็นหางสำหรับตัวแปรสุ่ม Poisson https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf ไม่เท่าเทียมกันหลักมีดังต่อไปนี้ Letเป็นตัวแปรสุ่ม Poisson กับพารามิเตอร์\ใส่ ให้แสดงถึงฟังก์ชันการแจกแจงสะสมสำหรับกฎหมายปกติมาตรฐาน จากนั้นสำหรับจำนวนเต็มทั้งหมด , ซึ่งเทียบเท่ากับ สำหรับจำนวนเต็มทั้งหมดYλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0. ยิ่งกว่านั้นซึ่งหมายความว่า สำหรับทุกจำนวนเต็ม 0Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


หากคุณสามารถเขียนสมการหลัก (สมมติว่ามีเพียงหนึ่งหรือสอง) ที่จะช่วยในกรณีที่ลิงค์จะตายในบางครั้ง
jbowman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.