ฉันมีฮิสโตแกรมข้อมูลการนับต่อไปนี้ และฉันต้องการให้การกระจายแบบไม่ต่อเนื่องกับมัน ฉันไม่แน่ใจว่าฉันควรทำอย่างไร
ฉันควรเพิ่มการแจกแจงแบบแยกส่วนก่อนพูดการแจกแจงลบแบบทวินามบนฮิสโตแกรมเพื่อให้ฉันได้รับพารามิเตอร์การกระจายแบบไม่ต่อเนื่องแล้วเรียกใช้การทดสอบ Kolmogorov – Smirnov เพื่อตรวจสอบค่า p?
ฉันไม่แน่ใจว่าวิธีนี้ถูกต้องหรือไม่
มีวิธีการทั่วไปในการจัดการปัญหาเช่นนี้หรือไม่?
นี่คือตารางความถี่ของข้อมูลการนับ ในปัญหาของฉันฉันมุ่งเน้นเฉพาะการนับที่ไม่ใช่ศูนย์
Counts: 1 2 3 4 5 6 7 9 10
Frequency: 3875 2454 921 192 37 11 1 1 2
UPDATE:ฉันต้องการถาม: ฉันใช้ฟังก์ชัน fitdistr ใน R เพื่อรับพารามิเตอร์สำหรับการปรับข้อมูลให้เหมาะสม
fitdistr(abc[abc != 0], "Poisson")
lambda
1.68147852
(0.01497921)
จากนั้นฉันพล็อตฟังก์ชันความน่าจะเป็นแบบมวลของการแจกแจงแบบปัวซองที่อยู่ด้านบนของฮิสโตแกรม
อย่างไรก็ตามดูเหมือนว่าการกระจาย Poisson ล้มเหลวในการสร้างแบบจำลองข้อมูลการนับ มีอะไรที่ฉันพอจะทำได้บ้าง?
?MASS::fitdistr
เนื่องจากมันอยู่ในการกระจาย R ของคุณ (ดูตัวอย่างสุดท้ายที่ด้านล่าง; ดู rnegbin สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการกำหนดพารามิเตอร์ของ Negative Binomial นั้น) .... " และหลังจากค้นพบ ML ฉันควรทำอย่างไรต่อไป " - ณ จุดนั้นคุณมีการประมาณพารามิเตอร์และข้อผิดพลาดมาตรฐาน นอกเหนือจากนั้นคุณต้องการบรรลุอะไร - ฉันเดาไม่ออก