ความเหมาะสมของการกระจายแบบปัวซอง


9

การทดสอบทางสถิติที่รู้จักกันดีคืออะไรเพื่อวัดความดีของตัวแปรสุ่มที่สังเกตได้เพื่อการแจกแจงปัวซอง? ฉันรู้ว่าการทดสอบ Kolmogorov-Smirnov นั้นเป็นแบบนั้นมีคนอื่นอีกไหม?

คำตอบ:


7

1) มีสองประเด็นกับ Kolmogorov-Smirnov * -

a) ถือว่าการแจกจ่ายถูกระบุอย่างสมบูรณ์โดยไม่มีพารามิเตอร์ที่ประมาณไว้ หากคุณประมาณพารามิเตอร์ KS จะกลายเป็นรูปแบบของการทดสอบ Lilliefors (ในกรณีนี้สำหรับ Poisson-ness) และคุณต้องการค่าวิกฤตที่แตกต่างกัน

b) มันถือว่าการกระจายอย่างต่อเนื่อง

ทั้งส่งผลกระทบต่อการคำนวณค่า p และทั้งคู่ทำให้มีโอกาสน้อยที่จะปฏิเสธ

* (และ Cramer-von Mises และ Anderson Darling และการทดสอบอื่นใดที่ถือว่าเป็นโมฆะต่อเนื่องที่ระบุอย่างสมบูรณ์)

นอกจากว่าคุณจะไม่สนใจการทดสอบที่มีความอนุรักษ์สูง (ไม่ทราบขนาด) คุณจะต้องปรับการคำนวณความสำคัญสำหรับทั้งสองอย่างนี้ การจำลองจะถูกเรียกใช้

2) ในทางกลับกันความดีที่เหมาะสมของวานิลลาไคสแควร์เป็นความคิดที่น่ากลัวเมื่อทำการทดสอบสิ่งที่สั่งตามที่ปัวซองเป็น โดยการเพิกเฉยต่อการสั่งซื้อมันไม่ได้อ่อนไหวต่อทางเลือกที่น่าสนใจมากนัก - มันส่งพลังออกไปกับทางเลือกที่น่าสนใจโดยตรงเช่นการใช้เกินขนาดแทนที่จะใช้พลังงานกับสิ่งต่าง ๆ เช่น 'เกินจำนวนคู่กับตัวเลขคี่' เป็นผลให้พลังของมันต่อทางเลือกที่น่าสนใจโดยทั่วไปจะต่ำกว่าวานิลลา KS แต่ไม่มีการชดเชยอัตราความผิดพลาดประเภทที่ 1 ที่ต่ำกว่ามาก

ฉันคิดว่ามันแย่กว่านี้อีก

3) ในมือจับคุณสามารถแบ่งไค - สแควร์เป็นส่วนประกอบที่เคารพการสั่งซื้อโดยใช้พหุนาม orthogonal และลดส่วนประกอบที่มีลำดับสูงสุดที่น่าสนใจน้อยลง ในกรณีนี้คุณจะต้องใช้พหุนามแบบมุมฉากกับ Poisson pf

นี่เป็นวิธีการที่ใช้ในหนังสือ Rayner และหนังสือเล็ก ๆ น้อย ๆ ของ Best of 1989 ในการทดสอบ Smooth of Goodness of Fit (มีการทดสอบที่ราบรื่นใน R ที่อาจทำให้ชีวิตของคุณง่ายขึ้น)

หรือดูเอกสารเช่นนี้

http://www.jstor.org/discover/10.2307/1403470

4) อย่างไรก็ตามขึ้นอยู่กับสาเหตุที่คุณทำมันอาจจะดีกว่าที่จะพิจารณาทั้งองค์กร ...

การอภิปรายในคำถามเช่นนี้จะนำไปสู่การทดสอบที่ดีที่สุดและมักจะเป็นการทดสอบสมมติฐานโดยทั่วไป:

การทดสอบตามปกติคือ 'ไร้ประโยชน์เป็นหลัก' หรือไม่?

ฉันจะใช้การทดสอบอะไรเพื่อยืนยันว่ามีการกระจายสารตกค้างตามปกติ


4

การทดสอบ KS และการทดสอบอื่น ๆ เช่น Anderson Darling ใช้สำหรับการแจกแจงแบบต่อเนื่อง สำหรับการแจกแจงแบบไม่ต่อเนื่องคุณสามารถใช้การทดสอบแบบพอดีของ Chi-Square ซึ่งขึ้นอยู่กับการเปรียบเทียบเหตุการณ์ #observed กับจำนวนที่คาดหวังตามจำนวนที่คาดหวังสำหรับการแจกจ่ายของคุณ หากพารามิเตอร์เป็นที่รู้จักสำหรับการแจกแจงปัวซองคุณจะใช้อย่างชัดเจนมีโอกาสมากขึ้นที่คุณจะประมาณพารามิเตอร์โดยใช้ MLE ซึ่งจะช่วยลดระดับความอิสระในการทดสอบ Chi-sq ของคุณ ตัวอย่างอยู่ที่นี่ คุณเพียงแค่ปรับให้เข้ากับการกระจายเฉพาะของคุณ: http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.