การรายงานผลลัพธ์ของการถดถอยเชิงเส้นอย่างง่าย: มีข้อมูลอะไรให้บ้าง


11

ฉันเพิ่งทำการถดถอยเชิงเส้นแบบง่าย ๆ (ใน) ใน Genstat และต้องการรวมการสรุปรวบยอดและมีความหมายของผลลัพธ์ในรายงานของฉัน ฉันไม่แน่ใจว่าข้อมูลที่ฉันควรจะรวมหรือจำนวนเท่าใด

บิตหลักของเอาต์พุต Genstat ของฉันมีลักษณะเช่นนี้:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

ฉันตั้งใจจะรายงานสิ่งนี้อย่างง่ายๆว่า:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

แต่เพื่อนร่วมงานได้แนะนำว่าฉันควรรวมอย่างน้อยroot mean squared error(ซึ่งฉันเชื่อในกรณีนี้เท่ากับข้อผิดพลาดมาตรฐานของการสังเกตคือ 99.9?)

การรวม RMSE ให้ข้อมูลที่เป็นประโยชน์เพิ่มเติมหรือไม่หรือความดีของความพอดีได้อธิบายไว้อย่างเพียงพอแล้วโดยการปรับค่า R2 หรือไม่?

มีกฎที่ยากและรวดเร็วในการรายงานข้อมูลจำนวนเท่าใดหรือเป็นเรื่องส่วนตัวหรือไม่?

ขอบคุณมาก ๆ!


1
"มีกฎที่ยากและรวดเร็วในการรายงานข้อมูลจำนวนเท่าใด" - ขึ้นอยู่กับสิ่งที่คุณต้องการทำหลังจากการถดถอย อาจมีความสุขกับค่าสัมประสิทธิ์สหสัมพันธ์ หนึ่งอาจต้องการค่า Durbin-Watson ด้านบนของที่และยังคงมีอีกคนหนึ่งอาจต้องการที่จะเห็นเส้นทแยงมุมของเมทริกซ์หมวก ... มันขึ้นอยู่กับ
JM ไม่ใช่นักสถิติเมื่อ

2
บางองค์กรมีกฎ ดูแนวทาง APAสำหรับตัวอย่าง
whuber

คำตอบ:


6

สำหรับการถดถอยเชิงเส้นอย่างง่ายฉันมักจะสร้างพล็อตของตัวแปร x เทียบกับตัวแปร y ด้วยเส้นการถดถอยที่กำหนดไว้เป็นพิเศษบนพล็อต (เสมอพล็อตข้อมูลของคุณทุกครั้ง สิ่งนี้จะบอกคุณได้อย่างง่ายดายว่าแบบจำลองของคุณเหมาะสมเพียงใดและอ่านง่ายสำหรับการถดถอย 1 ตัวแปร การเพิ่มสิ่งนั้นลงไปในสิ่งที่คุณมีอยู่แล้วอาจจะเพียงพอแม้ว่าคุณอาจต้องการที่จะรวมบางแปลงวินิจฉัย (ยกระดับระยะทางพ่อครัวปรุงอาหารส่วนที่เหลือ ฯลฯ ) ขึ้นอยู่กับว่าพล็อต xy นั้นดีแค่ไหนและขึ้นอยู่กับกลุ่มเป้าหมายที่คุณต้องการและโปรโตคอลใด ๆ ที่ผู้ชมคาดหวัง

R2

R2±±2R2


ขอบคุณ @probabilityislogic ฉันได้รวมพล็อตในรายงานของฉันและดูเหมือนว่าบวกประโยคเดิมของฉันควรจะเพียงพอในกรณีนี้ ฉันคิดว่าการรวมถึงแผนการวินิจฉัยอาจไม่จำเป็นสำหรับผู้ชมนี้ แต่ฉันได้ตรวจสอบด้วยตนเองอย่างชัดเจนและพวกเขาดูสมเหตุสมผล ขอบคุณสำหรับคำอธิบายของ R2 กับ RMSE - มันมีประโยชน์มาก
JamesS

สิ่งที่เกี่ยวกับค่า t และ sf เมื่อใดควรรวมสิ่งเหล่านี้ มันสมเหตุสมผลหรือไม่ที่จะรวมทั้งสองอย่างหรือไม่?
บ๊องเกี่ยวกับ natty

1

ฉันใช้เพื่อรายงานค่าสัมประสิทธิ์βบวก 95% CI, ค่า p และปรับ Rsquared Ex:

(β = 1.46, 95% CI [1.19, 1.8], p = 0.001 **, ปรับ R2 = 0.48)

หากรายงานการถดถอยหลายครั้งหรือการถดถอยพร้อมตัวแปรปัจจัยฉันจะรายงานค่าสัมประสิทธิ์ 95% CI ค่า p แล้วแยกสถิติ F (degres of freedom) แยก R2 ที่ปรับแล้วและค่า p ของโมเดล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.