วิธีการคำนวณระดับความเชื่อมั่นสำหรับการแจกแจงปัวซอง?


32

ต้องการทราบว่าฉันมั่นใจในของฉันได้อย่างไร ใครรู้วิธีตั้งค่าระดับความเชื่อมั่นสูงและต่ำสำหรับการกระจายปัวซอง?λ

  • การสังเกต ( ) = 88n
  • ค่าเฉลี่ยตัวอย่าง ( ) = 47.18182λ

ความมั่นใจ 95% จะเป็นอย่างไร


คุณอาจลองทำการ bootstrapping ค่าประมาณของคุณ นี่คือบทแนะนำสั้น ๆ เกี่ยวกับการบูตสแตรป
Mark T Patterson

คำตอบ:


27

สำหรับ Poisson ค่าเฉลี่ยและความแปรปรวนมีทั้ง\หากคุณต้องการช่วงความเชื่อมั่นทั่วแลมบ์ดาคุณสามารถคำนวณข้อผิดพลาดมาตรฐานเป็นn}λλ/n

ช่วงความเชื่อมั่น 95 เปอร์เซ็นต์เป็นn}λ^±1.96λ^/n


26
นี่เป็นเรื่องปกติเมื่อมีขนาดใหญ่แล้วปัวซงก็ประมาณพอสมควรโดยการกระจายปกติ สำหรับค่าเล็ก ๆ หรือความเชื่อมั่นที่สูงขึ้นมีช่วงเวลาที่ดีกว่า ดูmath.mcmaster.ca/peter/s743/poissonalpha.htmlสำหรับสองคนพร้อมกับการวิเคราะห์ความครอบคลุมจริงของพวกเขา (ที่นี่ช่วง "แน่นอน" คือ (45.7575, 48.6392) ช่วงเวลา "Pearson" คือ (45.7683, 48.639) และการประมาณปกติให้ (45.7467, 48.617): มันน้อยเกินไป แต่ปิดพอเพราะnλnλ=4152
4152.

4
สำหรับคนอื่น ๆ สับสนเหมือนฉัน: นี่คือคำอธิบายของที่ 1.96 มาจาก
mjibson

2
คุณคำนวณช่วงเวลาที่แน่นอนสำหรับปัญหานี้โดยระบุข้อมูลในเว็บไซต์ที่ได้รับจาก whuber อย่างไร ฉันไม่สามารถติดตามได้เนื่องจากไซต์นั้นระบุว่าจะดำเนินการต่อเมื่อคุณมีตัวอย่างหนึ่งตัวอย่างเท่านั้น บางทีฉันอาจจะไม่เข้าใจสิ่งที่ง่าย แต่การกระจายของฉันมีค่าแลมบ์ดาน้อยกว่า (n) ดังนั้นฉันจึงไม่สามารถใช้การประมาณปกติและฉันไม่รู้วิธีคำนวณค่าที่แน่นอน ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก. ขอบคุณ!

พวกเขากำลังใช้ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยใช่ไหม นั่นคือSE = sig/sqrt(N) = sqrt(lam/N)? สิ่งนี้จะสมเหตุสมผลเนื่องจากค่าเบี่ยงเบนมาตรฐานของค่าเดียวsigบอกเราเกี่ยวกับความน่าจะเป็นในการวาดตัวอย่างแบบสุ่มจากการแจกแจงปัวซงในขณะที่SEตามที่นิยามไว้ข้างต้นบอกเราเกี่ยวกับความเชื่อมั่นlamของเรา
AlexG

17

บทความนี้กล่าวถึง 19 วิธีในการคำนวณช่วงความมั่นใจสำหรับค่าเฉลี่ยของการแจกแจงปัวซง

http://www.ine.pt/revstat/pdf/rs120203.pdf


2
แม้จะมีการแจ้งเตือนของ mod ที่นี่ฉันชอบคำตอบนี้ตามที่เป็นอยู่เพราะมันชี้ให้เห็นว่ามีมติน้อยกว่าทั่วไปเกี่ยวกับวิธีการประเมินระบบปัวซองที่วัดได้
Carl Witthoft

7

นอกเหนือจากคำตอบที่คนอื่นให้ไว้แล้ววิธีการอื่นในการแก้ปัญหานี้ก็สำเร็จได้ด้วยวิธีการตามแบบจำลอง วิธีทฤษฎีบทขีด จำกัด กลางนั้นใช้ได้อย่างแน่นอนและการประเมินแบบ bootstrapped มีการป้องกันจำนวนมากจากปัญหาตัวอย่างและโหมดการสะกดผิดเล็กน้อย

เพื่อประสิทธิภาพที่แท้จริงคุณจะได้รับช่วงความมั่นใจที่ดีขึ้นสำหรับโดยใช้วิธีการถดถอยแบบจำลอง ไม่จำเป็นต้องผ่านการทดลอง แต่การคำนวณอย่างง่ายใน R จะเป็นดังนี้:λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

นี่คือการประมาณช่วงเวลาแบบไม่สมมาตรโปรดจำไว้เนื่องจากพารามิเตอร์ธรรมชาติของปัวซอง glm คืออัตราสัมพัทธ์! นี่เป็นข้อได้เปรียบเนื่องจากมีแนวโน้มที่ข้อมูลการนับจะเอียงไปทางขวา

วิธีการข้างต้นมีสูตรและเป็น:

exp(logλ^±1nλ^)

ช่วงความเชื่อมั่นนี้คือ "มีประสิทธิภาพ" ในแง่ที่ว่ามาจากการประเมินความเป็นไปได้สูงสุดในมาตราส่วนพารามิเตอร์ธรรมชาติ (บันทึก) สำหรับข้อมูลปัวซงและให้ช่วงความมั่นใจที่เข้มงวดกว่าช่วงความเชื่อมั่นที่เข้มงวดกว่า .


+1 ฉันคิดว่าฉันจะใช้คำคุณศัพท์ที่แตกต่างกว่าประสิทธิภาพ (หรือชัดเจนกว่าคุณหมายถึงการคำนวณหรือประสิทธิภาพของรหัสกอล์ฟ) ความคิดเห็นของ whuber ชี้ไปที่ทรัพยากรที่ให้ช่วงเวลาที่แน่นอนและวิธีการ glm นั้นขึ้นอยู่กับผลลัพธ์แบบอะซิมโทติคด้วย (มันเป็นเรื่องทั่วไปมากกว่าดังนั้นฉันชอบแนะนำวิธีการนั้นเช่นกัน)
Andy W

เมื่อพิจารณาถึงเรื่องนี้จริง ๆ แล้วความครอบคลุมที่แน่นอนที่เชื่อมโยงไปยัง (ฉันคิดว่า) ใช้ได้เฉพาะเมื่อคุณระบุโดยไม่ต้องดูข้อมูล ดูการจำลองอย่างรวดเร็วความครอบคลุมที่คำนวณตามค่าที่สังเกตได้ (สำหรับการสังเกตใหม่) นั้นต่ำกว่ามาก จำลองด่วนที่นี่ μ
Andy W

1
อำนาจหน้าที่ของคุณสำหรับสูตรนั้นคืออะไร เราจะมีการอ้างอิงได้ไหม?
pauljohn32

@AndyW: ลิงก์ของคุณไม่ถูกต้องสำหรับการจำลองสถานการณ์อย่างรวดเร็ว
pauljohn32

1
@ pauljohn32 ตรวจสอบข้อความของ Casella Berger โดยเฉพาะอย่างยิ่งในตระกูลเอ็กซ์โพเนนเชียลอัตราการบันทึกเป็นพารามิเตอร์ธรรมชาติ
AdamO

5

ได้รับการสังเกตจากการกระจาย Poisson ,

  • จำนวนเหตุการณ์ที่นับได้คือ n
  • ค่าเฉลี่ย ( ) และความแปรปรวน ( ) เท่ากันλσ2

เป็นขั้นเป็นตอน,

  • ประมาณการค่าเฉลี่ยคือλ^=nλ
  • สมมติว่าเหตุการณ์มีขนาดใหญ่พอ ( ) ข้อผิดพลาดมาตรฐานคือค่าเบี่ยงเบนมาตรฐานซึ่งเราสามารถประมาณได้n>20σ

stderr=σ=λn

ตอนนี้ช่วงความมั่นใจ 95%คือ

I=λ^±1.96 stderr=n±1.96 n

[แก้ไข] การคำนวณบางอย่างขึ้นอยู่กับข้อมูลคำถาม

  • สมมติว่าระบุในคำถามนั้นได้รับการตรวจสอบจากภายนอกหรือมอบให้กับเรานั่นคือข้อมูลที่ดีไม่ใช่การประมาณλ

    ฉันใช้สมมติฐานนี้เนื่องจากคำถามดั้งเดิมไม่ได้ให้บริบทใด ๆ เกี่ยวกับการทดสอบหรือวิธีการรับข้อมูล (ซึ่งมีความสำคัญสูงสุดเมื่อจัดการข้อมูลสถิติ)

  • ช่วงความมั่นใจ 95% สำหรับกรณีนั้น ๆ

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

ดังนั้นเมื่อการวัด (เหตุการณ์ = 88 เหตุการณ์) อยู่นอกช่วงความมั่นใจ 95% เราจึงสรุปได้ว่า

  1. กระบวนการไม่เป็นไปตามกระบวนการปัวซองหรือ

  2. เราได้รับไม่ถูกต้องλ


หมายเหตุสำคัญ : คำตอบที่ได้รับการยอมรับเป็นครั้งแรกข้างต้นเป็นที่ไม่ถูกต้องตามที่มันไม่ถูกต้องระบุว่าข้อผิดพลาดมาตรฐานสำหรับการสังเกต Poisson เป็นn} นั่นคือข้อผิดพลาดมาตรฐานสำหรับกระบวนการค่าเฉลี่ยตัวอย่าง (แบบสำรวจตัวอย่าง)λ/n


1
ยินดีต้อนรับสู่เว็บไซต์! แต่ @Travis "อยากรู้ว่าฉันมั่นใจได้อย่างไรใน " ดังนั้นมันควรจะเป็นช่วงความมั่นใจรอบ ๆ ค่าเฉลี่ยตัวอย่าง นอกจากนี้คุณหมายถึงอะไรเนื่องจากพวกเขาคือ 88 และ 47 ตามลำดับ? n λλnλ
Randel

2
ขอบคุณ! ตอนนี้ฉันได้แก้ไขคำตอบรวมถึงการคำนวณบางอย่างแล้ว คำถามไม่ได้อธิบายว่าและ n ได้รับมาอย่างไรดังนั้นฉันจึงทำการเดาที่มีการศึกษา อย่างที่คุณพูดถ้า n แตกต่างจากมากเกินไปเป็นคำใบ้แรกที่แบบจำลองอาจไม่ใช่ปัวซองหรือการวัดไม่ถูกต้อง วิธีหนึ่งในการตรวจสอบคือการคำนวณช่วงความมั่นใจ 95% อย่างแม่นยำซึ่งในกรณีนี้แสดงให้เห็นว่า n อยู่นอกช่วงเวลา λλλ
jose.angel.jimenez

2
ฉันเชื่อว่าคำตอบของ jose.angel.jiminez ด้านบนไม่ถูกต้องและเกิดจากการอ่านคำถามผิด ๆ โปสเตอร์ต้นฉบับระบุว่า "การสังเกต (n) = 88" - นี่คือจำนวนช่วงเวลาที่สังเกตไม่ใช่จำนวนเหตุการณ์ที่สังเกตโดยรวมหรือต่อช่วง จำนวนเฉลี่ยของเหตุการณ์ต่อช่วงเวลาในตัวอย่าง 88 ช่วงเวลาการสังเกตเป็นแลมบ์ดาที่ได้รับจากโปสเตอร์ต้นฉบับ (ฉันได้รวมสิ่งนี้ไว้ในความคิดเห็นในโพสต์ของ Jose แต่ฉันใหม่เกินไปที่จะอนุญาตให้แสดงความคิดเห็นได้)
user44436

@ user44436 เพิ่มคำตอบที่ควรจะเป็นความคิดเห็น ฉันโพสต์ใหม่เป็นความคิดเห็นเพื่อให้คุณเห็นและเนื่องจากไม่ใช่คำตอบมันอาจถูกลบ: ------- ฉันเชื่อว่าคำตอบของโฮเซ่ด้านบนนั้นไม่ถูกต้องและเกิดจากการอ่านคำถามผิดไป โปสเตอร์ต้นฉบับระบุ Observations (n) = 88 - นี่คือจำนวนช่วงเวลาที่สังเกตไม่ใช่จำนวนเหตุการณ์ที่สังเกตโดยรวมหรือต่อช่วง จำนวนเฉลี่ยของกิจกรรมต่อช่วงเวลาในตัวอย่าง 88 ช่วงเวลาการสังเกตคือแลมบ์ดาที่ได้รับจากโปสเตอร์ต้นฉบับ
Mörre
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.