ความเข้าใจเกี่ยวกับค่า p ในการถดถอยเชิงเส้นหลายครั้ง


12

เกี่ยวกับค่า p ของการวิเคราะห์การถดถอยเชิงเส้นแบบหลายส่วนการแนะนำจากเว็บไซต์ของ Minitabจะแสดงอยู่ด้านล่าง

p-value สำหรับแต่ละเทอมทดสอบสมมติฐานว่างว่าสัมประสิทธิ์เท่ากับศูนย์ (ไม่มีผล) ค่า p ต่ำ (<0.05) แสดงว่าคุณสามารถปฏิเสธสมมติฐานว่างได้ กล่าวอีกนัยหนึ่งตัวทำนายที่มีค่า p ต่ำน่าจะเป็นส่วนเสริมที่มีความหมายกับโมเดลของคุณเนื่องจากการเปลี่ยนแปลงค่าของตัวทำนายเกี่ยวข้องกับการเปลี่ยนแปลงในตัวแปรตอบกลับ

ตัวอย่างเช่นผมมีรูปแบบอัตราดอกเบี้ย MLR ผลลัพธ์เป็น 14.48 และเอาออกแสดงอยู่ด้านล่าง จากนั้นyสามารถคำนวณได้โดยใช้สมการนี้y=0.46753X10.2668X2+1.6193X3+4.5424X4+14.48y

            Estimate      SE        tStat       pValue  
               ________    ______    _________    _________

(Intercept)      14.48     5.0127       2.8886    0.0097836
x1             0.46753     1.2824      0.36458      0.71967
x2             -0.2668     3.3352    -0.079995      0.93712
x3              1.6193     9.0581      0.17877      0.86011
x4              4.5424     2.8565       1.5902       0.1292

X4y2=0.46753X10.2668X2+1.6193X3+0X4+14.48yy2X4

ใครสามารถช่วยในการทำความเข้าใจที่ถูกต้อง? ขอบคุณมาก!


คุณสามารถแสดงผลลัพธ์ของรูทีนการถดถอยได้หรือไม่
Aksakal

คำอธิบายการคำนวณค่า p ของคุณไม่ได้มาตรฐาน ทำไมคุณคิดว่าควรคำนวณวิธีที่คุณอธิบาย p-value ในผลลัพธ์ถูกคำนวณจากเมทริกซ์ Var-Cov ของพารามิเตอร์ หากคุณต้องการทดสอบข้อ จำกัด เช่น Wald ก็ไม่ใช่วิธีที่คุณอธิบาย คุณต้องประเมินตัวแบบใหม่ด้วยตัวแปร 3 ตัวรับ loglikelihood และอื่น ๆ อีกครั้ง
Aksakal

1
ตามการแนะนำนั้นคุณมีตัวแปร "นัยสำคัญ" เพียงตัวเดียวนั่นคือ "การสกัดกั้น" - เพราะค่า p มีค่าน้อย หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการปฏิบัติที่ไร้เดียงสาและทำให้เข้าใจผิดในใบเสนอราคา เพื่อดูว่าสามารถเรียนรู้ในเรื่องนี้พิจารณาการสำรวจหัวข้อที่เกี่ยวข้องในเว็บไซต์ของเรา
whuber

2
ตรวจสอบคำตอบสำหรับคำถามสองข้อนี้: - stats.stackexchange.com/questions/5135/ …และ - stats.stackexchange.com/questions/126179/…พวกเขาช่วยให้ฉันเข้าใจวิธีคำนวณค่า p หวังว่าคุณจะพบพวกเขา มีประโยชน์เช่นกัน
Giacomo

คำตอบ:


7

สิ่งนี้ไม่ถูกต้องด้วยเหตุผลสองประการ:

  1. โมเดล "ที่ไม่มี" X4 จะไม่จำเป็นต้องมีค่าสัมประสิทธิ์ประมาณเท่ากันสำหรับค่าอื่น ๆ พอดีกับรุ่นที่ลดลงและดูด้วยตัวคุณเอง

  2. Y

  3. การทดสอบทางสถิติซึ่งดำเนินการสำหรับนัยสำคัญทางสถิติของสัมประสิทธิ์คือหนึ่งตัวอย่าง t-test นี่คือความสับสนเนื่องจากเราไม่มี "ตัวอย่าง" ของค่าสัมประสิทธิ์หลาย ๆ ค่าสำหรับ X4 แต่เรามีการประเมินคุณสมบัติการกระจายตัวของตัวอย่างดังกล่าวโดยใช้ทฤษฎีบทขีด จำกัด กลาง ค่าเฉลี่ยและข้อผิดพลาดมาตรฐานอธิบายถึงที่ตั้งและรูปร่างของการแจกแจงที่ จำกัด หากคุณใช้คอลัมน์ "Est" และหารด้วย "SE" และเปรียบเทียบกับการแจกแจงแบบปกติมาตรฐานสิ่งนี้จะให้ค่า p ในคอลัมน์ที่ 4

  4. ประเด็นที่สี่: การวิจารณ์หน้าช่วยเหลือของ minitab ไฟล์ความช่วยเหลือดังกล่าวไม่สามารถสรุปการฝึกอบรมทางสถิติได้ในวรรคหนึ่งดังนั้นฉันไม่จำเป็นต้องโต้แย้งกับเรื่องทั้งหมด แต่การที่จะบอกว่า "ตัวทำนาย" คือ "ผลงานสำคัญ" นั้นคลุมเครือและอาจไม่ถูกต้อง เหตุผลในการเลือกตัวแปรที่จะรวมไว้ในตัวแบบหลายตัวแปรนั้นละเอียดและอาศัยเหตุผลทางวิทยาศาสตร์และไม่อนุมานเชิงสถิติ


0

การตีความค่า p เริ่มต้นของคุณนั้นถูกต้องซึ่งเป็นเพียงการสกัดกั้นที่มีค่าสัมประสิทธิ์ที่แตกต่างจาก 0 อย่างมากคุณจะสังเกตได้ว่าการประมาณค่าสัมประสิทธิ์สำหรับ x4 นั้นยังค่อนข้างสูง แต่มีข้อผิดพลาดไม่เพียงพอ แตกต่างจาก 0

การทดสอบ t คู่ของคุณที่ y1 และ y2 แสดงให้เห็นว่าแบบจำลองนั้นแตกต่างจากกัน คาดว่าจะเป็นไปได้ในแบบจำลองเดียวคุณรวมค่าสัมประสิทธิ์ขนาดใหญ่ แต่ไม่แน่ชัดซึ่งมีส่วนทำให้แบบจำลองของคุณค่อนข้างน้อย ไม่มีเหตุผลที่จะคิดว่าค่า p ของโมเดลเหล่านี้แตกต่างจากกันควรจะเหมือนกับ p-value ของสัมประสิทธิ์ของ x4 ซึ่งแตกต่างจาก 0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.