การถดถอยปัวซองกับการนับการถดถอยกำลังสองน้อยที่สุด?


21

การถดถอยปัวซองคือGLM ที่มีฟังก์ชั่นบันทึกลิงค์

อีกวิธีหนึ่งในการสร้างแบบจำลองข้อมูลการกระจายที่ไม่ใช่แบบปกติคือการประมวลผลล่วงหน้าโดยการบันทึก (หรือมากกว่าบันทึก (1 + จำนวน) เพื่อจัดการกับ 0) หากคุณทำการถดถอยอย่างน้อยกำลังสองในการตอบกลับนับบันทึกนั่นเกี่ยวข้องกับการถดถอยปัวซองหรือไม่ มันสามารถรองรับปรากฏการณ์ที่คล้ายกันได้หรือไม่?


6
คุณวางแผนที่จะใช้ลอการิทึมของการนับใด ๆ ที่เป็นศูนย์ได้อย่างไร
whuber

3
ไม่เทียบเท่าที่แน่นอน วิธีง่ายๆในการดูสิ่งนี้คือดูว่าจะเกิดอะไรขึ้นหากคุณสังเกตว่ามีค่าเป็นศูนย์ (ความคิดเห็นที่สร้างขึ้นก่อนที่จะเห็น @ ความคิดเห็นของ whuber เห็นได้ชัดว่าหน้านี้ไม่ได้ฟื้นฟูอย่างเหมาะสมบนเบราว์เซอร์ของฉัน..)
พระคาร์ดินัล

ตกลงฉันเห็นได้ชัดว่าควรบันทึก (1 + จำนวน) เห็นได้ชัดว่าไม่เทียบเท่า แต่สงสัยว่ามีความสัมพันธ์หรือว่าพวกเขาสามารถจัดการกับปรากฏการณ์ที่คล้ายกัน
เบรนแดน OConnor

1
มีการอภิปรายที่มีประโยชน์ของปัญหานี้ได้ที่นี่: blog.stata.com/2011/08/22/…
Michael Bishop

คำตอบ:


22

ในมือข้างหนึ่งในการถดถอยปัวซองด้านซ้ายมือของสมการรูปแบบคือลอการิทึมของการนับที่คาดหวัง: )log(E[Y|x])

E[Y|x]

YY=log(Y)YE[Y|x]=E[log(Y)|x]E[log(Y)|x]log(E[Y|x])


6
E(log(Y)|X)log(E(Y|X)) P(Y=f(X)|X)=1σ(X)fYX

@cardinal ใส่ได้ดีมาก
suncoolsu

9

ฉันเห็นความแตกต่างที่สำคัญสองประการ

ก่อนอื่นค่าที่คาดการณ์ไว้ (บนมาตราส่วนดั้งเดิม) จะทำงานแตกต่างกัน ใน loglinear-squares น้อยที่สุดพวกเขาเป็นตัวแทนของวิธีการทางเรขาคณิตเงื่อนไข ใน log-poisson model หมายถึงการแสดงเงื่อนไข เนื่องจากข้อมูลในการวิเคราะห์ประเภทนี้มักจะเอียงไปทางขวาค่าเฉลี่ยเรขาคณิตเชิงเงื่อนไขจะประเมินค่าเฉลี่ยตามเงื่อนไขต่ำเกินไป

ข้อแตกต่างที่สองคือการแจกแจงโดยนัย: lognormal และ poisson สิ่งนี้เกี่ยวข้องกับโครงสร้าง heteroskedasticity ของส่วนที่เหลือ: ความแปรปรวนที่เหลือตามสัดส่วนกับค่าที่คาดหวังกำลังสอง (lognormal) เมื่อเทียบกับความแปรปรวนที่เหลือตามสัดส่วนกับค่าที่คาดหวัง (Poisson)


-1

ความแตกต่างที่เห็นได้ชัดอย่างหนึ่งคือการถดถอยของปัวซองจะให้ผลเป็นจำนวนเต็มตามการทำนายจุด


12
มันทำงานอย่างไร GLM ไม่คาดการณ์ความคาดหวังซึ่งไม่จำเป็นต้องเป็นส่วนสำคัญใช่หรือไม่
whuber

1
นี่เป็นเรื่องจริง ในทางกลไกการปัวซงการถดถอยนั้นสามารถจัดการกับจำนวนที่ไม่ใช่จำนวนเต็มได้อย่างสมบูรณ์แบบ ข้อผิดพลาดมาตรฐานจะไม่กระจายแบบปัวซอง แต่คุณสามารถใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพแทน
แมทธิว
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.