"การเริ่มต้น" ที่ใช้กันมากที่สุดและอธิบายการจัดจำหน่ายของทางเลือกสำหรับข้อมูลนับเป็นการกระจาย Poisson ส่วนใหญ่มักจะแสดงให้เห็นโดยใช้ตัวอย่างของการใช้งานจริงครั้งแรก:
การใช้งานจริงของการแจกจ่ายนี้ทำโดย Ladislaus Bortkiewicz ในปี 1898 เมื่อเขาได้รับมอบหมายให้ตรวจสอบจำนวนทหารในกองทัพปรัสเซียนที่ถูกฆ่าโดยบังเอิญโดยการเตะม้า การทดลองนี้นำเสนอการกระจายปัวซงไปยังสาขาวิศวกรรมความน่าเชื่อถือ
การกระจายตัวของปัวซองนั้นถูกกำหนดด้วยอัตราต่อช่วงเวลาที่กำหนด (คือค่าเฉลี่ยและความแปรปรวน) ในกรณีของการถดถอยเราสามารถใช้การแจกแจงปัวซงในโมเดลเชิงเส้นทั่วไปพร้อมฟังก์ชันลิงค์เชิงเส้นλλλ
E( Y| X, β) = λ = ประสบการณ์( β0+ β1X1+ ⋯ + βkXk)
นั่นเรียกว่าการถดถอยปัวซองเนื่องจากเราสามารถสันนิษฐานได้ว่าคืออัตราการกระจายปัวซอง อย่างไรก็ตามโปรดสังเกตว่าสำหรับการถดถอยแบบบันทึกเชิงเส้นคุณไม่จำเป็นต้องใช้สมมติฐานดังกล่าวและใช้GLM พร้อมลิงค์บันทึกข้อมูลที่ไม่นับ เมื่อตีความพารามิเตอร์ที่คุณต้องจำไว้ว่าเนื่องจากการใช้การแปลงบันทึกการเปลี่ยนแปลงในตัวแปรอิสระส่งผลให้เกิดการเปลี่ยนแปลงหลายหลากในการนับที่คาดการณ์ไว้λ
ปัญหาของการใช้การแจกแจงปัวซงสำหรับข้อมูลในชีวิตจริงคือมันถือว่าค่าเฉลี่ยเท่ากับความแปรปรวน การละเมิดสมมติฐานนี้เรียกว่าการใช้เกินขีดจำกัด ในกรณีเช่นนี้คุณสามารถใช้แบบจำลองกึ่ง - ปัวซองรูปแบบบันทึกเชิงเส้นที่ไม่ใช่ปัวซอง (สำหรับจำนวนมากปัวซงสามารถประมาณได้โดยการแจกแจงแบบปกติ), การถดถอยแบบทวินามเชิงลบ (เกี่ยวข้องกับปัวซอง; รุ่นอื่น ๆ ตามที่อธิบายไว้โดยสเตฟาน Kolassa
สำหรับการแนะนำการถดถอยแบบปัวซองอย่างเป็นมิตรคุณสามารถตรวจสอบเอกสารโดย Lavery (2010) หรือ Coxe, West และ Aiken (2009)
Lavery, R. (2010) คู่มือภาพเคลื่อนไหว: บทนำสู่การถดถอยของปัวซอง กระดาษ NESUG, sa04
Coxe, S. , West, SG, & Aiken, LS (2009) การวิเคราะห์ข้อมูลการนับ: การแนะนำอย่างอ่อนโยนสำหรับการถดถอยปัวซองและทางเลือกอื่น วารสารการประเมินบุคลิกภาพ, 91 (2), 121-136
Berk, R. , & MacDonald, JM (2008) การถดถอยมากเกินไปและการถดถอยปัวซอง วารสารวิทยาเชิงปริมาณ, 24 (3), 269-284