วิธีตีความการประมาณค่าพารามิเตอร์ในผลลัพธ์ Poisson GLM [ปิด]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

ฉันต้องการทราบวิธีตีความการประมาณค่าพารามิเตอร์แต่ละรายการในตารางด้านบน


การตีความเหมือนกัน: stats.stackexchange.com/a/126225/7071
Dimitriy V. Masterov

6
คำถามนี้ดูเหมือนจะเป็นหัวข้อนอกเรื่องเพราะเป็นเรื่องเกี่ยวกับการอธิบายเอาท์พุท R โดยไม่มีคำถามอัจฉริยะที่อยู่เบื้องหลัง นี่คือหมวดหมู่ "ฉันทิ้งคอมพิวเตอร์ของฉันที่นั่นและคุณเรียกใช้การวิเคราะห์สถิติสำหรับฉัน" ...
ซีอาน

1
พารามิเตอร์การกระจายของคุณดูเหมือนจะบ่งชี้ว่ามีปัญหาบางอย่างกับแบบจำลองของคุณ บางทีคุณควรพิจารณาใช้การกระจาย quasipoisson แทน ฉันเดิมพันการประมาณค่าพารามิเตอร์ของคุณจะเปลี่ยนไปอย่างมากและการตีความจะเป็นเช่นนั้น หากคุณเรียกใช้ "พล็อต (โมเดล)" คุณจะได้รับพล็อตส่วนที่เหลือของคุณให้ดูที่พล็อตเหล่านี้สำหรับรูปแบบที่ไม่ต้องการก่อนที่คุณจะเริ่มตีความโมเดลที่แท้จริงของคุณ สำหรับการวางแผนแบบจำลองของคุณได้อย่างรวดเร็วคุณสามารถใช้ "visreg (modelfit)" จากแพ็คเกจ visreg
Robbie

3
@ ซีอานแม้ว่าคำถามจะกระจัดกระจายและจำเป็นต้องแก้ไขฉันไม่คิดว่ามันเป็นนอกหัวข้อ พิจารณาคำถามเหล่านี้ที่ไม่ได้รับการพิจารณาปิดหัวข้อ: แปลความหมายของ LM R () ของการส่งออกและการแปลความหมายของการส่งออกของ R สำหรับการถดถอยทวินาม มันไม่ปรากฏเป็นที่ซ้ำกันอย่างไร
gung - Reinstate Monica

2
นี่คือซ้ำของวิธีการตีความสัมประสิทธิ์ในการถดถอยปัวซอง? โปรดอ่านหัวข้อที่เชื่อมโยง หากคุณยังมีคำถามหลังจากอ่านแล้วให้กลับมาที่นี่ & แก้ไขคำถามของคุณเพื่อระบุสิ่งที่คุณได้เรียนรู้ & สิ่งที่คุณต้องรู้เราสามารถให้ข้อมูลที่คุณต้องการโดยไม่ต้องทำซ้ำเนื้อหาในที่อื่นที่ไม่ได้ช่วย คุณ.
gung - Reinstate Monica

คำตอบ:


28

ฉันไม่คิดว่าชื่อคำถามของคุณรวบรวมสิ่งที่คุณขออย่างถูกต้อง

คำถามเกี่ยวกับวิธีตีความพารามิเตอร์ใน GLM นั้นกว้างมากเนื่องจาก GLM เป็นรุ่นที่กว้างมาก จำได้ว่าแบบจำลอง GLM ตอบสนองตัวแปรที่สันนิษฐานว่าเป็นไปตามการกระจายที่รู้จักจากตระกูลชี้แจงและเราได้เลือกฟังก์ชั่นกลับหัวเช่น สำหรับตัวแปรxในรูปแบบนี้การตีความหมายของพารามิเตอร์ที่เฉพาะเจาะจงใด ๆคืออัตราการเปลี่ยนแปลงของด้วยความเคารพx_jกำหนดg E [ yyg J x β เจกรัม( Y ) x เจ μ E [ Y

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xj ηxβเจ{1,...,J} β J =μE[y|x]=g1(x)และเพื่อรักษาสัญกรณ์ให้สะอาด จากนั้นสำหรับ , ทีนี้กำหนดให้เป็นเวกเตอร์ของเลขศูนย์และในตำแหน่ง th ดังนั้นถ้าจากนั้นขวา) จากนั้น ηxβj{1,,J}
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

ซึ่งก็หมายความว่าเป็นผลกระทบต่อจากการเพิ่มขึ้นในหน่วยx_jβjηxj

คุณสามารถระบุความสัมพันธ์ด้วยวิธีนี้: และ

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

โดยที่ไม่รู้อะไรเกี่ยวกับนั่นคือเท่าที่เราจะทำได้ เป็นผลต่อ , บนค่าเฉลี่ยตามเงื่อนไขการแปลงสภาพของ , ของหน่วยเพิ่มขึ้นใน , และผลกระทบต่อค่าเฉลี่ยตามเงื่อนไขของของหน่วยเพิ่มขึ้นในคือขวา)}gβjηyxjyxjg1(β)


แต่คุณดูเหมือนจะถามเกี่ยวกับการถดถอยปัวซองโดยเฉพาะโดยใช้ฟังก์ชั่นลิงค์เริ่มต้นของ R ซึ่งในกรณีนี้คือลอการิทึมธรรมชาติ หากเป็นกรณีที่คุณกำลังถามเกี่ยวกับชนิดที่เฉพาะเจาะจงของ GLMซึ่งในและ\ จากนั้นเราสามารถดึงบางอย่างเกี่ยวกับการตีความที่เฉพาะเจาะจงyPoisson(λ)g=ln

จากสิ่งที่ฉันพูดข้างต้นเรารู้ว่า\ และเนื่องจากเรารู้เรายังไม่ทราบว่าE นอกจากนี้เรายังรู้ว่าดังนั้นเราจึงสามารถพูดได้ว่า μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

ซึ่งในที่สุดก็หมายถึงสิ่งที่จับต้องได้:

ได้รับการเปลี่ยนแปลงที่มีขนาดเล็กมากในที่ติดตั้งเปลี่ยนแปลงโดยYxjy^y^βj

หมายเหตุ: การประมาณนี้สามารถใช้งานได้จริงสำหรับการเปลี่ยนแปลงที่มีขนาดใหญ่ถึง 0.2 ขึ้นอยู่กับความแม่นยำที่คุณต้องการ

และใช้การตีความการเปลี่ยนแปลงหน่วยที่คุ้นเคยยิ่งขึ้นเรามี: ซึ่งหมายถึง

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

ได้รับการเปลี่ยนแปลงในหน่วยที่ติดตั้งเปลี่ยนแปลงโดยขวา)Y Y ( อีβ J - 1 )xjy^y^(ejβ1)

มีสามสิ่งสำคัญที่ควรทราบที่นี่:

  1. ผลของการเปลี่ยนแปลงในตัวทำนายขึ้นอยู่กับระดับของการตอบสนอง
  2. การเปลี่ยนแปลงที่เพิ่มขึ้นในตัวทำนายนั้นมีผลคูณในการตอบสนอง
  3. คุณไม่สามารถตีความค่าสัมประสิทธิ์เพียงแค่อ่านพวกเขา (ยกเว้นว่าคุณสามารถคำนวณเลขยกกำลังในหัวของคุณ)

ดังนั้นในตัวอย่างของคุณผลของการเพิ่มค่า pH 1 คือการเพิ่มโดย ; นั่นคือการคูณโดย1.09 ดูเหมือนว่าผลลัพธ์ของคุณคือจำนวนของ darters ที่คุณสังเกตในหน่วยเวลาคงที่ (พูดสัปดาห์ละครั้ง) ดังนั้นถ้าคุณสังเกต 100 darters ต่อสัปดาห์ด้วยค่า pH 6.7 การเพิ่มค่า pH ของแม่น้ำเป็น 7.7 หมายความว่าตอนนี้คุณสามารถคาดการณ์ได้ถึง 109 darters ต่อสัปดาห์Y ( อี0.09 - 1 ) Y E 0.091.09lny^y^(e0.091) y^e0.091.09


ฉันได้ปรับแต่งคู่ที่นี่ @ssdecontrol ฉันคิดว่าพวกเขาจะทำให้การโพสต์ของคุณง่ายขึ้น แต่ถ้าคุณไม่ชอบให้ย้อนกลับไปด้วยคำขอโทษของฉัน
gung - Reinstate Monica

ฉันไม่สามารถหาคำตอบจากคำตอบของฉันได้อย่างชัดเจนฉันต้องแก้ไขคำตอบ คุณยังสับสนอะไรอยู่
shadowtalker

เสียบตัวเลขเหล่านี้เข้ากับสมการเหมือนกับการถดถอยเชิงเส้น
shadowtalker

1
@skan ไม่มีฉันหมายถึงx] และเป็นตัวแปรสุ่มที่ใช้แทนการสังเกตเพียงครั้งเดียว คือเวกเตอร์ที่จัดทำดัชนีโดย ; เป็นตัวแปรสุ่มที่แสดงถึงคุณสมบัติ / regressor / input / ทำนายที่เฉพาะเจาะจงสำหรับการสังเกต x y x j x jE[y|x]xyxjxj
shadowtalker

2
และอย่าคิดมาก เมื่อคุณเข้าใจชิ้นส่วนทั้งหมดใน GLM แล้วการดัดแปลงที่นี่เป็นเพียงการประยุกต์ใช้หลักการแคลคูลัสโดยตรง เป็นเรื่องง่ายเหมือนการทำอนุพันธ์เทียบกับตัวแปรที่คุณสนใจ
shadowtalker

3

คำแนะนำของฉันจะสร้างตารางขนาดเล็กประกอบด้วยการรวมกันของแม่น้ำสองสายและสองหรือสามค่าของแต่ละตัวแปรแล้วใช้ฟังก์ชั่นที่มีตารางของคุณเป็นpredict newdataจากนั้นกราฟผลลัพธ์ มันมีความชัดเจนมากในการดูค่าที่ตัวแบบทำนายไว้ คุณอาจหรืออาจไม่ต้องการเปลี่ยนการทำนายกลับเป็นมาตรวัดดั้งเดิม ( type = "response")


1
เท่าที่ฉันชอบวิธีการนี้ (ฉันทำมันตลอดเวลา) ฉันคิดว่ามันเป็นผลดีต่อการสร้างความเข้าใจ
shadowtalker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.