การรายงานผลลัพธ์ของการถดถอยโลจิสติก


13

ฉันมีผลลัพธ์การถดถอยโลจิสติกต่อไปนี้:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

เหมาะสมที่จะรายงานสิ่งนี้ด้วยวิธีต่อไปนี้:

ค่าสัมประสิทธิ์เบต้า, อัตราต่อรอง, ค่า Z, ค่า P ถ้าใช่ฉันจะรับอัตราต่อรองได้อย่างไร


คำถามที่เกี่ยวข้อง: ถดถอยโลจิสติใน R (Odds Ratio)
landroni

คำตอบ:


9

การรายงานที่แนะนำสำหรับตารางดูเหมือนสมเหตุสมผลแม้ว่าค่า z และค่า p จะซ้ำซ้อน วารสารหลายเล่มที่ฉันคุ้นเคยไม่รายงาน z-value / p-value เลยและใช้เครื่องหมายดอกจันเพื่อรายงานนัยสำคัญทางสถิติเท่านั้น ฉันเคยเห็นตารางโลจิสติกส์เฉพาะกับอัตราส่วนของคี่ที่ได้รับการรายงานถึงแม้ว่าโดยส่วนตัวแล้วฉันชอบทั้งอัตราต่อรองและอัตราต่อรองที่รายงานหากพื้นที่อนุญาตในตาราง

แต่สถานที่ต่างกันอาจมีคู่มือที่แตกต่างกันเกี่ยวกับขั้นตอนการรายงานดังนั้นสิ่งที่คาดหวังอาจแตกต่างกันไป หากฉันส่งกระดาษไปยังวารสารฉันมักจะเห็นว่าเอกสารล่าสุดอื่น ๆ ได้ทำตารางของพวกเขาและเลียนแบบเหล่านั้น หากเป็นเอกสารส่วนตัวของคุณเองการขอให้ใครก็ตามอาจตรวจสอบได้จะเป็นคำขอที่สมเหตุสมผล ดังที่ฉันได้กล่าวไว้ข้างต้นข้อ จำกัด ด้านพื้นที่ในบางสถานที่อาจทำให้คุณไม่สามารถรายงานข้อมูลที่ซ้ำซ้อนได้ในท้ายที่สุด (เช่นทั้งอัตราต่อรองและอัตราต่อรอง) บางแห่งอาจบังคับให้คุณรายงานผลลัพธ์ทั้งหมดในข้อความ!

นอกจากนี้ยังมีคำถามว่าสรุปรุ่นอื่น ๆ จะรายงานอย่างไร แม้ว่าวารสารหลายเล่มที่ฉันคุ้นเคยกับการรายงานค่าหลอกบ่อยครั้งนี่เป็นหัวข้อในเว็บไซต์ที่กล่าวถึงจุดอ่อนของมาตรการต่างๆ ฉันชอบอัตราการจัดหมวดหมู่ที่จะรายงาน แต่อีกครั้งฉันสงสัยว่าสิ่งนี้จะแตกต่างกันไปตามสถานที่จัดงาน (ฉันสามารถจินตนาการวารสารบางฉบับจะขอให้เฉพาะหนึ่งในหลอกR 2มาตรการที่จะรายงาน)R2R2

เพื่อให้ได้อัตราการแปลกเพียง exponentiate ค่าสัมประสิทธิ์การถดถอย (เช่นใช้เวลาที่อีเป็นฐานของลอการิทึมธรรมชาติและβเป็นค่าสัมประสิทธิ์การถดถอยโลจิสติกประมาณ.) เดาที่ดีในภาษาทางสถิติใด ๆ ในการคำนวณนี้อยู่eβ^eβ^exp(coefficient)

แม้ว่าจะเป็นคำตอบที่ได้รับการยอมรับในปัจจุบัน แต่ lejohn และ Frank Harrell ทั้งคู่ก็ให้คำแนะนำที่มีประโยชน์มาก ในขณะที่ฉันมักจะต้องการสถิติในคำถามรายงานที่ไหนสักแห่งคำตอบอื่น ๆ คำแนะนำเกี่ยวกับมาตรการอื่น ๆ เป็นวิธีที่มีประโยชน์ในการประเมินขนาดของผลกระทบเมื่อเทียบกับผลกระทบอื่น ๆ ขั้นตอนแบบกราฟิกยังมีประโยชน์ในการตรวจสอบขนาดผลสัมพัทธ์และดูเอกสารทั้งสองนี้ในการเปลี่ยนตารางเป็นกราฟเป็นตัวอย่าง ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


ลิงก์ Kastellec & Leoni, 2007 ล้มเหลว แต่นี่เป็นตัวอย่างจากบทความเดียวกันที่มีรหัส
ACNB

11

คำตอบสำหรับคำถามนี้อาจขึ้นอยู่กับภูมิหลังทางวินัยของคุณ

ต่อไปนี้เป็นข้อควรพิจารณาทั่วไป

เบต้าในการถดถอยโลจิสติกค่อนข้างยากที่จะตีความโดยตรง ดังนั้นการรายงานพวกเขาอย่างชัดเจนจึงเป็นเพียงการใช้งานที่ จำกัด มาก คุณควรยึดติดกับอัตราต่อรองหรือแม้แต่กับผลกระทบเล็กน้อย ผลกระทบส่วนเพิ่มของตัวแปร x คืออนุพันธ์ของความน่าจะเป็นที่ตัวแปรที่ขึ้นต่อกันของคุณมีค่าเท่ากับ 1 โดยเทียบกับ x วิธีการนำเสนอผลลัพธ์นี้เป็นที่นิยมในหมู่นักเศรษฐศาสตร์ โดยส่วนตัวแล้วฉันเชื่อว่าผลกระทบเล็กน้อยนั้นง่ายต่อการเข้าใจโดยฆราวาส (แต่ไม่เพียง แต่พวกเขา ... ) มากกว่าอัตราต่อรอง

ความเป็นไปได้อีกประการหนึ่งที่น่าสนใจคือการใช้การแสดงผลกราฟิก สถานที่ที่คุณจะได้พบกับภาพของวิธีนี้บางส่วนเป็นหนังสือของGelman และฮิลล์ ฉันพบว่าสิ่งนี้ดีกว่าการรายงานผลกระทบเล็กน้อย

เกี่ยวกับคำถามเกี่ยวกับวิธีการได้รับอัตราส่วนราคาต่อไปนี้เป็นวิธีที่คุณสามารถทำได้ใน R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

คุณมีตัวอย่างของการเปลี่ยนการประมาณผลกระทบส่วนเพิ่มลงในตาราง (หรือการอ้างอิงหน้าเฉพาะใน Gelman และ Hill หรือไม่?)
Andy W

1
Gelman และ Hill ไม่ได้ใช้เอฟเฟ็กต์เล็กน้อย แต่เป็นกราฟที่มาจากความน่าจะเป็นที่คาดการณ์ไว้ ดูบทที่ห้าเริ่มต้นที่หน้า 79

10

เฉพาะในกรณีพิเศษที่ค่าสัมประสิทธิ์และการป้องกันบันทึก (อัตราต่อรอง) เป็นบทสรุปที่ดี นี่คือเมื่อความสัมพันธ์เป็นเส้นตรงและมีค่าสัมประสิทธิ์หนึ่งที่เกี่ยวข้องกับการทำนายและเมื่อการเปลี่ยนแปลงหนึ่งหน่วยเป็นพื้นฐานที่ดีสำหรับการคำนวณอัตราส่วนอัตราต่อรอง (ตกลงมากขึ้นสำหรับอายุไม่มากสำหรับการนับเม็ดเลือดขาวที่มีช่วงของ 500-100,000) โดยทั่วไปสิ่งต่าง ๆ เช่นอัตราส่วนระหว่างอัตราควอไทล์มีประโยชน์ ฉันมีรายละเอียดเพิ่มเติมเกี่ยวกับเรื่องนี้ที่http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdfและrmsแพ็คเกจR ทำได้ทั้งหมดโดยอัตโนมัติ (การจัดการคำที่ไม่เป็นเชิงเส้นและการโต้ตอบคำนวณควอไทล์ของ X ฯลฯ )


5

มันอาจขึ้นอยู่กับผู้ชมและวินัยของคุณ คำตอบด้านล่างคือสิ่งที่ปกติแล้วทำสำหรับวารสารระบาดวิทยาและวารสารทางการแพทย์ที่มีขอบเขตน้อยกว่า

เพื่อจะเปิดเผยเราไม่สนใจเกี่ยวกับค่า p อย่างจริงจังเราทำไม่ได้ วิทยาการระบาดจะไม่ยอมให้คุณรายงานพวกเขาจนกว่าคุณจะมีความจำเป็นเร่งด่วนจริง ๆ และฟิลด์ตามหลังชุดสูท

เราอาจไม่สนใจเกี่ยวกับการประมาณการเบต้าขึ้นอยู่กับคำถาม หากรายงานของคุณมีวิธีการหรือการจำลองที่เน้นไปมากกว่านี้ฉันอาจรายงานค่าประมาณเบต้าและข้อผิดพลาดมาตรฐาน หากคุณกำลังพยายามที่จะรายงานผลกระทบตามที่คาดการณ์ไว้ในประชากรฉันจะยึดตามอัตราต่อรองและช่วงความเชื่อมั่น 95% นั่นคือเนื้อของการประเมินของคุณและสิ่งที่ผู้อ่านในสาขานั้นจะมองหา

คำตอบได้รับการโพสต์ข้างต้นสำหรับวิธีการได้รับอัตราต่อรอง แต่สำหรับ OR & 95% CI:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

ขอบคุณสำหรับคำตอบ! ฉันจะถามสิ่งที่ 1.96 หมายถึงในการคำนวณได้อย่างไร
upabove

1
ไม่มีปัญหา :) ช่วงความมั่นใจ 95% คือช่วงที่ควรครอบคลุมคร่าวๆจากเปอร์เซนต์ไทล์ 2.5th ไปเป็นไทล์ไทล์ 97.5 ของการแจกแจงแบบปกติของการประมาณค่าเบต้าของคุณ แต่ละจุดเหล่านี้มีค่าเบี่ยงเบนมาตรฐานประมาณ 1.96 จากค่าเฉลี่ย (ในกรณีนี้คือเบต้า)
Fomite

ใช่ แต่ฉันควรทำสิ่งนี้กับสัมประสิทธิ์เบต้าแต่ละอันหรือไม่ 1.96 ก็เปลี่ยนแปลงเช่นกัน? นี่ก็คือข้อมูลทวินามมันยังคงยึดตามการแจกแจงแบบปกติเหรอ?
upabove

2
ใช่ - สำหรับสัมประสิทธิ์เบต้าแต่ละตัวคุณสามารถรับอัตราต่อรองและขีด จำกัด ของความมั่นใจได้ 95% 1.96 จะไม่เปลี่ยนแปลงเว้นแต่ว่าคุณต้องการคำนวณเปอร์เซ็นต์ไทล์ที่แตกต่างกันสำหรับช่วงความมั่นใจ (90%, 99%, ฯลฯ ) แต่เนื่องจาก 95% เป็นมาตรฐานจึงไม่จำเป็นต้องทำเช่นนั้น และตราบใดที่คุณกำลังทำงานกับมาตราส่วนการบันทึกพารามิเตอร์จากตัวแบบการถดถอยแบบโลจิสติกจะถูกกระจายตามปกติ เมื่อคุณยกกำลังพวกเขาแล้วสิ่งนี้จะหยุดเป็นความจริง
Fomite
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.