การตีความฟังก์ชันสรุปสำหรับโมเดล lm ใน R


11

ความหมายของt valueและPr(>|t|)เมื่อใช้summary()ฟังก์ชันกับตัวแบบการถดถอยเชิงเส้นใน R คืออะไร?

Coefficients:
                              Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    10.1595     1.3603   7.469 1.11e-13 ***
log(var)                        0.3422     0.1597   2.143   0.0322 *


และสำหรับข้อผิดพลาดมาตรฐานดูที่นี่
Glen_b -Reinstate Monica

คำตอบ:



4

ฉันไม่ได้ทดสอบแบบคร่าวๆแต่วิกิพีเดียมีบทความที่ดีเกี่ยวกับค่า p โดยทั่วไปค่า p คือโอกาสที่ผลลัพธ์ที่คุณเห็นเกิดขึ้นเนื่องจากการเปลี่ยนแปลงแบบสุ่ม โดยทั่วไปค่า p-.05 หรือน้อยกว่า (ตีความคร่าว ๆ ว่า "มีโอกาส 5% หรือน้อยกว่าที่เกิดขึ้นเพียงเพราะการเปลี่ยนแปลงแบบสุ่ม") ถูกนำมาใช้เพื่อหมายความว่าผลลัพธ์มีความสำคัญ


4
เนื่องจากปัญหาเหล่านี้ได้ถูกกล่าวถึงอย่างกว้างขวางในเว็บไซต์นี้ฉันจะสรุป: (1) ค่า p เป็นค่าความน่าจะเป็นแบบมีเงื่อนไขในการสมมติสมมติฐานว่าง (ไม่ใช่บางส่วน "โอกาส" ที่ไม่มีเงื่อนไขและมันอาจเป็นการฝ่าฝืน ) และ (2) ไม่ใช่โอกาสของ "ผลลัพธ์ที่คุณเห็น" ซึ่งในกรณีนี้เป็นศูนย์จริง - แต่เป็นโอกาส - ภายใต้สมมติฐานว่าง - ว่าผลลัพธ์ของคุณจะอยู่ใน "พื้นที่วิกฤติ" สำหรับ การทดสอบสมมติฐาน แม้ว่าสิ่งนี้อาจดูเหมือนการหยิบยก แต่ความสับสนมากมายอาจเกิดขึ้นจากการตีความภาษาที่ไม่ถูกต้อง
whuber

2
@whuber - ขอขอบคุณที่สละเวลารวบรวมคำอธิบายที่ถูกต้องและแม่นยำเกี่ยวกับค่า p ฉันเพิ่งเข้าใจว่าตัวเองจริง ๆ แล้ว แต่ตั้งใจให้คำตอบ "ภาษาหลวม" เพื่อช่วยให้ผู้ถามได้รับแนวคิดพื้นฐานโดยไม่ครอบงำเขา ... ดูเหมือนว่าฉันว่าสถิติจำนวนมากเป็นเช่นนั้น - สิ่งที่สถิติบอก ไม่ใช้มิตรดังนั้นผู้คนให้ประมาณคร่าวๆที่ย่อยง่ายขึ้น ฉันคิดว่ามันเป็น "Six Easy Pieces" ที่ Feynman อธิบายเกี่ยวกับฟิสิกส์เช่นนั้น "สิ่งนี้ไม่ถูกต้อง แต่เป็นการประมาณที่มีประโยชน์"
Aerik

1
น่าเสียดายที่ภาษาที่ไม่คุ้นเคยนำไปสู่การกระทำที่เข้าใจผิดมากมายซึ่งเกิดจากความเข้าใจผิด
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.