ช่วยฉันเข้าใจค่าในค่า Bayesian glm


13

ฉันกำลังพยายามที่จะใช้ logit คชกรรมกับข้อมูลที่นี่ ฉันใช้bayesglm()ในarmแพ็คเกจใน R การเข้ารหัสนั้นตรงไปตรงมามากพอ:

df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)

summary(model) ให้เอาต์พุตต่อไปนี้:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.10381    0.10240   1.014    0.311    
SEXMale      0.02408    0.09363   0.257    0.797    
HIGH        -0.27503    0.03562  -7.721 1.15e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2658.2  on 1999  degrees of freedom
Residual deviance: 2594.3  on 2000  degrees of freedom
AIC: 2600.3

โปรดพาฉันผ่านสิ่งนี้ ผมเข้าใจว่ารหัสนี้ใช้เป็นที่อ่อนแอมากก่อน (ตั้งแต่ผมไม่ได้หมายถึงการระบุก่อน) เพื่อให้การส่งออกเป็นไปได้ในทางปฏิบัติเหมือนกันถ้าผมใช้แทนglm() bayesglm()แต่ผลลัพธ์ยังคงอยู่ในจิตวิญญาณของชาวเบย์ใช่ไหม? ค่าและคืออะไรที่นี่ เครื่องมืออนุมานเหล่านี้ไม่ใช่ประจำใช่หรือไม่ พวกเขาตีความที่แตกต่างกันที่นี่?Zpz


นี่คือความคิดเห็นและไม่ใช่คำตอบ แต่นี่คือสิ่งที่จะทำให้รู้สึกถึงฉัน คุณจะได้รับการประมาณค่าซึ่งอาจเป็นค่าที่การกระจายหลังถูกขยายให้ใหญ่สุด มันอาจเป็นไปได้ว่าพวกเขาเป็นเพียงวิธีหลัง? ควรตรวจสอบว่าคุณสามารถ แต่ไม่ว่ารายละเอียดที่แน่นอนจะเป็นอย่างไรเมื่อคุณมีค่าประมาณคุณสามารถทดสอบได้โดย Estimate / Std ข้อผิดพลาด -> ขั้นตอน z-score ซึ่งใช้งานได้หากหลังอยู่ใกล้กับปกติ (ไปสู่สภาวะปกติภายใต้เงื่อนไขบางอย่างที่มักจะถือ)
Erik

เอริค ... คุณถูกต้อง: ค่าสัมประสิทธิ์เป็นค่าความหนาแน่นหลัง คำถามของฉันเกี่ยวกับค่า p และ z พวกเขาเป็นตัวแทนอะไรที่นี่?
3671

ตกลง. หากคุณมีความหนาแน่นที่มีการแจกแจงแบบปกติโดยประมาณคุณสามารถทดสอบได้ว่าค่าเฉลี่ยเป็นศูนย์หรือไม่โดยการใช้คะแนน z = ค่าเฉลี่ย / ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงและเปรียบเทียบกับการแจกแจงแบบปกติมาตรฐาน จากนั้นคุณดูว่าค่าของคุณหรือค่าที่มากกว่านั้นไม่น่าจะอยู่ภายใต้การแจกแจงแบบปกติมาตรฐาน -> p-value ดูรายละเอียดคะแนน z บนวิกิพีเดีย
Erik

ก็ใช่ แต่ทำไมต้องทำอย่างนั้นในการตั้งค่าแบบเบย์? ในการอนุมานแบบเบย์การประมาณจุดคือการคาดเดาที่ดีที่สุดของฉันเกี่ยวกับพารามิเตอร์สุ่มดังนั้นไม่จำเป็นต้องทดสอบ อย่างมากที่สุดฉันสามารถรวม "ช่วงเวลาที่น่าเชื่อถือ" ซึ่งเทียบเท่ากับ "ช่วงความมั่นใจ" ที่พบบ่อย แต่การตีความทางสถิติแตกต่างกันอย่างมากมาย นี่เป็นส่วนที่สับสนเกี่ยวกับเอาต์พุตสรุป () จิตวิญญาณคือ Bayesian แต่ผลผลิตเป็นประจำ?
user3671

จุดหนึ่งคือการประมาณที่คุณได้รับจะแตกต่างกันเนื่องจากคุณใช้ค่าก่อนหน้า และในขณะที่การประเมินจุดคือ "เดาที่ดีที่สุด" ถ้าคุณต้องการที่จะแสดงในแบบเบย์ว่ามีบางสิ่งที่มีผลคุณจะต้องพยายามแสดงให้เห็นว่าช่วงเวลาที่น่าเชื่อถือไม่ได้มีศูนย์ เมื่อคุณประมาณหลังปกติด้วยค่าเฉลี่ยเดียวกันและ sd (แก้ไข asymptotically) ดังนั้นช่วงเวลาความน่าเชื่อถือ (1-p / 2) คือช่วงเวลาความน่าเชื่อถือแบบสมมาตรที่ใหญ่ที่สุดที่มีศูนย์ดังนั้นคำตอบของคุณจึงเหมือนกัน p คือค่า p ที่ระบุข้างต้น
Erik

คำตอบ:


16

เป็นคำถามที่ดีมาก! แม้ว่าจะมีค่า p Bayesianและหนึ่งในผู้เขียนของแพ็คเกจแขนเป็นผู้สนับสนุนสิ่งที่คุณเห็นในผลลัพธ์ของคุณไม่ได้เป็นค่า p Bayesian ตรวจสอบระดับของmodel

class(model)
"bayesglm" "glm"      "lm" 

และคุณจะเห็นว่าคลาส bayesglm สืบทอดมาจาก glm นอกจากนี้การตรวจสอบชุดแขนยังไม่พบวิธีสรุปเฉพาะสำหรับวัตถุ Bayesglm ดังนั้นเมื่อคุณทำ

summary(model)

คุณกำลังทำจริง

summary.glm(model)

และการตีความผลลัพธ์บ่อยครั้ง หากคุณต้องการมุมมองแบบเบย์มากขึ้นฟังก์ชั่นในแขนก็คือdisplay()


+1 คำตอบที่ยอดเยี่ยม! นี่เป็นปัญหาของ R มีนักสถิติอัจฉริยะจำนวนมากที่เขียนรหัสที่น่ากลัวทำให้ทุ่นระเบิดเหล่านี้นอนอยู่
Bogdanovist

ดูเหมือนว่าทางเลือกโดยเจตนาในส่วนนักออกแบบมากกว่าการกำกับดูแล
atiretoo - คืนสถานะโมนิก้า

หลังจากอ่านลิงก์ฉันเห็นด้วยกับเจตนา แต่ในกรณีนั้นสรุป () ควรได้รับการดำเนินการอีกครั้งเพื่อเรียกการแสดงผล () แทนที่จะให้ผลลัพธ์ไร้สาระโดยไม่มีการเตือน ผู้ที่ถามคำถามนี้ได้ถูกสะดุดด้วยรหัสที่ทำลายโมเดลผู้ใช้สำหรับ R ที่สร้างโดยวัตถุอื่น ๆ ที่พวกเขาเคยใช้ นั่นคือการฝึกเขียนโปรแกรมที่แย่มาก
Bogdanovist

2
ขอบคุณมาก atiretoo นี่ทำให้เกิดคำถามอื่น display () และสรุป () แตกต่างกันอย่างไร สำหรับฉันแล้วดูเหมือนว่าเอาต์พุตจากอดีตจะเป็นเพียงแค่เอาต์พุตจากหลังน้อยกว่าสองคอลัมน์และปัดเป็น 2 หลัก มันจะปรากฏเช่นนั้นจากโพสต์ของ Gelman ที่คุณเชื่อมโยงด้านบน
user3671

ใช่และจากการสนทนาที่บล็อกของ Andrew Gelman ดูเหมือนว่าพวกเขาจะแก้ไขปัญหานี้ในแพ็คเกจแขนรุ่นอนาคต
atiretoo - คืนสถานะโมนิก้า
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.