ข้อผิดพลาดในการประมาณการกระจายผลรวมสม่ำเสมอ


20

วิธีการที่ไร้เดียงสาวิธีหนึ่งสำหรับการประมาณการแจกแจงแบบปกติคือการเพิ่มตัวแปรสุ่ม IID จำนวน IID ที่กระจายกันอย่างสม่ำเสมอใน[ 0 , 1 ]จากนั้นกลับมาอีกครั้งและดำเนินการใหม่โดยอาศัยทฤษฎีบทขีด จำกัด กลาง ( หมายเหตุด้านข้าง : มีวิธีการที่แม่นยำมากขึ้นเช่นการแปลง Box – Muller ) ผลรวมของ IID100[0,1]U(0,1)ตัวแปรสุ่มเป็นที่รู้จักกันกระจายชุดรวมหรือกระจายเออร์วินฮอลล์

ข้อผิดพลาดมีขนาดใหญ่เพียงใดในการประมาณการกระจายตัวแบบสม่ำเสมอโดยการแจกแจงแบบปกติ

เมื่อใดก็ตามที่คำถามประเภทนี้เกิดขึ้นเพื่อประมาณผลรวมของตัวแปรสุ่มของ IID ผู้คน (รวมถึงฉัน) จะนำทฤษฎีบท Berry - Esseenมาใช้ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพของทฤษฎีขีด จำกัด กลางเนื่องจากช่วงเวลาที่สามมีอยู่:

|Fn(x)Φ(x)|Cρσ3n

ที่เป็นฟังก์ชันการแจกแจงสะสมสำหรับผลรวมของ rescaled IID ตัวแปรสุ่มเป็นสามช่วงเวลาที่แน่นอนกลาง,เป็นส่วนเบี่ยงเบนมาตรฐานและเป็นค่าคงที่แน่นอนซึ่งสามารถนำไปเป็นหรือแม้กระทั่ง1/2FnnρE|(XEX)3|σC11/2

สิ่งนี้ไม่น่าพอใจ สำหรับผมแล้วการประมาณ Berry - Esseen นั้นใกล้เคียงที่สุดกับการแจกแจงทวินามที่ไม่ต่อเนื่องโดยมีข้อผิดพลาดที่ใหญ่ที่สุดคือสำหรับการแจกแจงทวินามแบบสมมาตร ข้อผิดพลาดที่ใหญ่ที่สุดมาที่กระโดดที่ใหญ่ที่สุด อย่างไรก็ตามการกระจายผลรวมสม่ำเสมอไม่มีการข้าม0

การทดสอบแสดงให้เห็นว่าตัวเลข shrinks ข้อผิดพลาดขึ้นอย่างรวดเร็วกว่าnc/n

เมื่อใช้ 1/2 ค่าประมาณการของ Berry – Esseen คือC=1/2

|Fn(x)Φ(x)|121321123n0.650n

ซึ่งสำหรับประมาณ ,และตามลำดับ ความแตกต่างสูงสุดที่เกิดขึ้นจริงสำหรับดูเหมือนจะเป็นประมาณ , 0.00139และ0.000692ตามลำดับซึ่งมีขนาดเล็กกว่ามากและดูเหมือนจะลดลงเป็นc / nแทนที่จะเป็นc / n=10,20,400.2050.1450.103 0.00281n=10,20,400.002810.001390.000692c/nc/n .


7
หากคุณขยายการกระจายของผลรวมในการขยาย Edgeworthคุณจะพบว่าสม่ำเสมอในxเป็นn (เนื่องจาก การกระจายตัวแบบสมมาตร) ดังนั้นc / nฟังดูถูก เนื่องจากo ( n - 1 )Fn(x)=Φ(x)+n1g(x)+o(n1)xnc/no(n1)คำที่ไม่ได้ให้ขอบเขตแม้ว่า ...
MånsT

1
ขอบคุณที่ดูเหมือนว่ามันจะอธิบายรูปแบบสำหรับการแจกแจงอื่น ๆ อีกมากมายเช่นกัน c/n
Douglas Zare

คำตอบ:


17

ให้เป็น iid U ( - b , b )ตัวแปรสุ่มและพิจารณาผลรวมปกติ S n =U1,U2,U(b,b) และที่เกี่ยวข้องจีบบรรทัดฐาน δ n = จีบx R | F n ( x ) - Φ ( x ) |

Sn=3i=1nUibn,
sup ที่ F nคือการกระจายของ S n
δn=supxR|Fn(x)Φ(x)|,
FnSn n

แทรก 1 ( Uspensky ): ต่อไปนี้ถูกผูกไว้ในถือ δ n < 1δn

δn<17.5πn+1π(2π)n+12π3nexp(π2n/24).

พิสูจน์พิสูจน์ดู JV Uspensky (1937), ความน่าจะเป็นทางคณิตศาสตร์เบื้องต้น , นิวยอร์ก: McGraw-Hill, p. 305

นี่คือการปรับปรุงในภายหลังโดย R. Sherman ต่อไปนี้

เลมม่า 2 ( เชอร์แมน ): การปรับปรุงดังต่อไปนี้ในขอบเขตของ Uspensky

δn<17.5πn(π180+17.5πn)eπ2n/24+1(n+1)π(2π)n+12π3neπ2n/24.

หลักฐาน : ดูอาร์เชอร์แมน, ข้อผิดพลาดของการประมาณปกติผลรวมของ N ตัวแปรสุ่ม , Biometrika , ฉบับที่ 58, ไม่มี 2, 396–398

(sinx)/x


2
N=n

@Procrastinator: จับได้ดี
พระคาร์ดินัล

1
2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.