การประมาณปรกติของการแจกแจงปัวซอง


12

ที่นี่ใน Wikipedia บอกว่า:

สำหรับค่าที่มากพอของλ , (พูดλ>1000 ) การแจกแจงแบบปกติที่มีค่าเฉลี่ยλและความแปรปรวนλ (ค่าเบี่ยงเบนมาตรฐานλ ) เป็นค่าประมาณยอดเยี่ยมสำหรับการแจกแจงปัวซอง ถ้าλมากกว่า 10 แล้วการแจกแจงแบบปกติคือการประมาณที่ดีถ้าทำการแก้ไขความต่อเนื่องที่เหมาะสมคือP(Xx),ที่ (ตัวพิมพ์เล็ก) xเป็นจำนวนเต็มไม่เป็นลบจะถูกแทนที่ด้วยP(Xx+0.5).

FPoisson(x;λ)Fnormal(x;μ=λ,σ2=λ)

น่าเสียดายที่นี่ไม่ได้อ้างถึง ฉันต้องการที่จะแสดง / พิสูจน์สิ่งนี้ด้วยความแม่นยำ คุณจะบอกได้อย่างไรว่าการกระจายตัวแบบปกตินั้นเป็นค่าประมาณที่ดีเมื่อλ>1000คุณจะวัดปริมาณการประมาณ 'ยอดเยี่ยม' นี้ได้อย่างไรใช้มาตรการใด

สิ่งที่ไกลที่สุดที่ฉันเคยได้รับกับเรื่องนี้คือที่นี่ที่จอห์นพูดถึงเกี่ยวกับการใช้ทฤษฎีบท Berry - Esseen และใกล้เคียงกับข้อผิดพลาดในสอง CDFs จากสิ่งที่ฉันสามารถดูเขาไม่ได้พยายามที่ค่าใด ๆλ10001000


6
คุณไม่สามารถพิสูจน์ได้โดยไม่กำหนด "ดี" (คุณสามารถพิสูจน์ผลลัพธ์แบบอะซิมโทติค แต่คุณไม่สามารถประกาศว่าเป็น 'ดี' ที่ขนาดตัวอย่างที่ระบุโดยไม่ต้องกำหนดเกณฑ์ของคุณ) คุณสามารถแสดงพฤติกรรมของมันโดยใช้ตัวอย่างโดยตรง (ซึ่งผู้คนจะเห็นว่า 'ดี' ดีแค่ไหน เป็นแสงของตัวเอง) สำหรับคนทั่วไปที่ใช้เกณฑ์ปกติการแก้ไขแบบต่อเนื่องใช้ได้ผลกับตราบใดที่คุณไม่ต้องลงลึกเข้าไปในหาง λ>10
Glen_b -Reinstate Monica

1
(หากต้องการเจาะจงมากขึ้นหากเกณฑ์ของคุณเป็นข้อผิดพลาดที่แน่นอนคุณสามารถบรรลุ 'ดี' ได้ทุกที่ในกลุ่มตัวอย่างขนาดเล็กเช่น 10 แต่คนส่วนใหญ่สนใจเกี่ยวกับบางสิ่งที่ใกล้เคียงกับข้อผิดพลาดสัมพัทธ์)
Glen_b -Reinstate Monica

คำตอบ:


7

สมมติว่าคือ Poisson กับพารามิเตอร์และเป็นเรื่องปกติที่มีค่าเฉลี่ยและความแปรปรวน\มันดูเหมือนว่าฉันว่าการเปรียบเทียบที่เหมาะสมอยู่ระหว่างและfrac12]) เพื่อความเรียบง่ายฉันเขียนนั่นคือเราสนใจเมื่อสอดคล้องกับเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยXλYλPr(X=n)Pr(Y[n12,n+12])n=λ+αλnα

ดังนั้นฉันจึงโกง ฉันใช้ Mathematica ดังนั้นทั้งและเป็นแบบไม่มีส่วนเกี่ยวข้องกับ เป็น\ แต่ความแตกต่างของมันคือ asymptotic กับ ถ้า คุณพล็อตนี้เป็นหน้าที่ของ , คุณจะได้รับโค้งเช่นเดียวกับที่ปรากฏอยู่ในสองรูปสุดท้ายในhttp://www.johndcook.com/blog/normal_approx_to_poisson/Pr(X=n)Pr(Y[n12,n+12])

12πλeα2/2
λ
α(α23)eα2/262πλ
α

นี่คือคำสั่งที่ฉันใช้:

  n = lambda + alpha Sqrt[lambda];
  p1 = Exp[-lambda] lambda^n/n!;
  p2 = Integrate[1/Sqrt[2 Pi]/Sqrt[lambda] Exp[-(x-lambda)^2/2/lambda], {x, n-1/2, n+1/2}];
  Series[p1, {lambda, Infinity, 1}]
  Series[p2, {lambda, Infinity, 1}]

นอกจากนี้ด้วยการทดลองเล็กน้อยดูเหมือนว่าการประมาณ asymptotic ที่ดีกว่าสำหรับคือ6]) จากนั้นข้อผิดพลาดคือ ซึ่งมีขนาดเล็กกว่าPr(X=n)Pr(Y[nα2/6,n+1α2/6])

(5α49α26)eα2/2722πλ3/2
λ

2

Glen_b นั้นถูกต้องในที่ "พอดี" เป็นความคิดส่วนตัว อย่างไรก็ตามถ้าคุณต้องการตรวจสอบว่าการแจกแจงปัวซองของคุณเป็นเรื่องปกติคุณสามารถใช้การทดสอบ Kolmorgov-Smirnov สมมุติฐานกับสมมติฐานว่างเป็น CDF มาจากการแจกแจงโดยสมมติว่า ตัวอย่างของคุณจะมาจากปัวซอง ( ) เนื่องจากคุณไม่ได้ทำการทดสอบตัวอย่าง แต่เป็นการแจกแจงแบบหนึ่งต่ออีกคุณต้องคิดอย่างรอบคอบเกี่ยวกับขนาดตัวอย่างและระดับความสำคัญที่คุณใช้สำหรับการทดสอบสมมติฐานนี้ (เนื่องจากเราไม่ได้ใช้การทดสอบ KS ในแบบปกติ) นั่นคือ:H0:N(λ,λ)λ

  • เลือกตัวแทนขนาดตัวอย่างสมมุติ n และปรับระดับความสำคัญของการทดสอบเป็นค่าปกติเช่น 5%

ตอนนี้คำนวณอัตราข้อผิดพลาด Type II สำหรับการทดสอบนี้โดยสมมติว่าข้อมูลของคุณมาจากปัวซอง ( ) ระดับความพอดีของคุณกับการแจกแจงแบบปกติจะเป็นอัตราข้อผิดพลาด Type II นี้ในแง่ที่ว่าตัวอย่างขนาด n จากการแจกแจงปัวซงของคุณโดยทั่วไปจะได้รับการยอมรับ % ของเวลาโดยการทดสอบปกติ ระดับนัยสำคัญλβ

อย่างไรก็ตามนั่นเป็นเพียงวิธีเดียวที่จะทำให้รู้สึกถึง "ความดีที่เหมาะสม" อย่างไรก็ตามทั้งหมดขึ้นอยู่กับแนวคิดบางอย่างของ "ความดี" ที่คุณจะต้องกำหนดด้วยตัวคุณเอง


2

การได้มาจากการกระจายแบบทวินามอาจทำให้คุณได้รับข้อมูลเชิงลึก

เรามีตัวแปรสุ่มแบบทวินาม

p(x)=(nx)px(1p)nx

สิ่งนี้สามารถคำนวณซ้ำได้;

p(x)=(nx+1)px(1p)p(x1)

หากคุณรักษาสภาพเริ่มต้น;

p(0)=(1p)n

ตอนนี้ให้เราคิดว่ามีขนาดใหญ่และมีขนาดเล็ก แต่ความสำเร็จเฉลี่ยของเป็นค่าคงที่แลมบ์ดา) จากนั้นเราสามารถทำสิ่งต่อไปนี้;npp(x)(np=λ)

P(X=i)=(ni)px(1p)nx

เราใช้ที่np=λ/n

P(X=i)=n!(ni)!i!(λn)i(1λn)ni

เราสลับตัวแปรบางตัวไปรอบ ๆ และประเมินผล

P(X=i)=n(n1)(n2)(ni+1)niλii!(1λn)n(1λn)i

จากแคลคูลัสเรารู้ว่า x นอกจากนี้เรายังรู้ว่าเพราะทั้งด้านบนและด้านล่างมีหลายชื่อปริญญาฉันlimn(1+x/n)n=ex[n(n1)(n2)(ni+1)]/ni1i

สิ่งนี้นำไปสู่ข้อสรุปว่าเมื่อ :n

P(X=i)eλλii!

จากนั้นคุณสามารถตรวจสอบว่าและผ่านคำจำกัดความ เรารู้ว่าการแจกแจงทวินามใกล้เคียงกับค่าปกติภายใต้เงื่อนไขของทฤษฎีบท De Moivre-Laplaceตราบใดที่คุณแก้ไขความต่อเนื่องซึ่งเป็นสาเหตุที่ถูกแทนที่ด้วย .E(X)=λVar(X)=λP(Xx)P(Xx+0.5)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.