การถดถอยเชิงเส้นหลายครั้งสำหรับการทดสอบสมมติฐาน


15

ฉันคุ้นเคยกับการใช้การถดถอยเชิงเส้นหลายครั้งเพื่อสร้างแบบจำลองของตัวแปรต่าง ๆ อย่างไรก็ตามฉันสงสัยว่าการทดสอบการถดถอยจะใช้ในการทำการทดสอบสมมติฐานพื้นฐานประเภทใด ถ้าเป็นเช่นนั้นสถานการณ์ / สมมติฐานเหล่านั้นจะเป็นอย่างไร?


1
คุณช่วยอธิบายเพิ่มเติมสิ่งที่คุณหมายถึง? เป็นเรื่องธรรมดามากที่จะทดสอบว่าพารามิเตอร์ความชันของตัวแปรนั้นแตกต่างจากศูนย์หรือไม่ ฉันจะเรียกว่า "การทดสอบสมมติฐาน" คุณไม่รู้หรือคุณหมายถึงบางสิ่งที่แตกต่างออกไป? อะไรคือสถานการณ์สมมติสำหรับวัตถุประสงค์ของคุณ
gung - Reinstate Monica

ฉันไม่รู้ตัว ฉันก็ไม่แน่ใจเช่นกันว่าการวิเคราะห์โดยใช้การถดถอยนั้นใช้สำหรับการทดสอบสมมติฐานประเภทอื่น ๆ หรือไม่
cryptic_star

คำตอบ:


26

นี่คือตัวอย่างง่ายๆ ฉันไม่รู้ว่าคุณคุ้นเคยกับ R หรือไม่ แต่หวังว่ารหัสนั้นจะอธิบายได้อย่างเพียงพอ

set.seed(9)        # this makes the example reproducible
N = 36
    # the following generates 3 variables:
x1 =     rep(seq(from=11, to=13),           each=12)
x2 = rep(rep(seq(from=90, to=150, by=20),   each=3 ), times=3)
x3 =     rep(seq(from=6,  to=18,  by=6 ),  times=12)
cbind(x1, x2, x3)[1:7,]    # 1st 7 cases, just to see the pattern
      x1  x2 x3
 [1,] 11  90  6
 [2,] 11  90 12
 [3,] 11  90 18
 [4,] 11 110  6
 [5,] 11 110 12
 [6,] 11 110 18
 [7,] 11 130  6 
    # the following is the true data generating process, note that y is a function of
    #   x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
    #   & that x2 tends to have less influence on the response variable than x1:
y  = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)

reg.Model = lm(y~x1+x2+x3)    # fits a regression model to these data

ทีนี้มาดูกันว่ามันจะเป็นอย่างไร:

. . . 
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) -1.76232   27.18170  -0.065  0.94871   
x1           3.11683    2.09795   1.486  0.14716   
x2           0.21214    0.07661   2.769  0.00927 **
x3           0.17748    0.34966   0.508  0.61524   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1 
. . . 
F-statistic: 3.378 on 3 and 32 DF,  p-value: 0.03016 

เราสามารถมุ่งเน้นไปที่ส่วน "ค่าสัมประสิทธิ์" ของผลลัพธ์ แต่ละพารามิเตอร์ที่ประเมินโดยตัวแบบจะได้รับแถวของตัวเอง การประมาณการจริงจะแสดงในคอลัมน์แรก คอลัมน์ที่สองแสดงรายการข้อผิดพลาดมาตรฐานของการประมาณการนั่นคือการประมาณว่าการประมาณจะเด้งจากตัวอย่างหนึ่งไปยังอีกตัวอย่างหนึ่งถ้าเราต้องทำซ้ำขั้นตอนนี้ซ้ำแล้วซ้ำอีก โดยเฉพาะอย่างยิ่งมันเป็นการประมาณค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างของการประมาณ หากเราแบ่งการประมาณแต่ละพารามิเตอร์ด้วย SE เราจะได้คะแนน t-ซึ่งแสดงอยู่ในคอลัมน์ที่สาม สิ่งนี้ใช้สำหรับการทดสอบสมมติฐานโดยเฉพาะเพื่อทดสอบว่าการประมาณพารามิเตอร์นั้นแตกต่างอย่างมีนัยสำคัญจาก 0 หรือไม่คอลัมน์สุดท้ายคือp-value ที่เกี่ยวข้องกับ t-score มันเป็นความน่าจะเป็นในการหาค่าประมาณที่ไกลหรือไกลจาก 0 หากสมมติฐานว่างเป็นจริง โปรดทราบว่าหากสมมติฐานว่างเปล่าไม่เป็นความจริงมันไม่ชัดเจนว่าค่านี้บอกเราว่ามีความหมายอะไรเลย

หากเรามองกลับไปมาระหว่างตารางค่าสัมประสิทธิ์และกระบวนการสร้างข้อมูลจริงข้างต้นเราสามารถเห็นสิ่งที่น่าสนใจบางอย่าง การสกัดกั้นนั้นประมาณ -1.8 และ SE ของมันคือ 27 ในขณะที่ค่าจริงคือ 15 เนื่องจากค่า p-value ที่เกี่ยวข้องคือ. 95 จึงไม่ถือว่า 'แตกต่างอย่างมีนัยสำคัญ' จาก 0 ( ข้อผิดพลาด type II ) แต่ มันยังคงอยู่ภายในหนึ่ง SE ของมูลค่าที่แท้จริง ดังนั้นจึงไม่มีอะไรมากสุดขีดเกี่ยวกับการประเมินนี้จากมุมมองของมูลค่าที่แท้จริงและจำนวนเงินที่ควรจะผันผวน เราเพียง แต่มีพลังไม่เพียงพอที่จะแยกความแตกต่างจาก 0 เรื่องราวเดียวกันถือครองไม่มากก็น้อยสำหรับx1. โดยทั่วไปนักวิเคราะห์ข้อมูลจะบอกว่ามันไม่ได้มีนัยสำคัญเพียงเล็กน้อยเนื่องจากค่า p ของมันคือ> .10 อย่างไรก็ตามนี่เป็นข้อผิดพลาดประเภทที่สองอีกประการหนึ่ง ค่าประมาณx2นั้นค่อนข้างแม่นยำ..21214.2x3x1ทำนายตัวแปรตอบสนองได้ดีกว่าโอกาสเพียงอย่างเดียว อีกวิธีหนึ่งในการพูดแบบนี้คือการประมาณว่าทั้งหมดควรได้รับการพิจารณาว่าไม่สามารถแยกความแตกต่างจาก 0 ได้ผลลัพธ์ของการทดสอบนี้แสดงให้เห็นว่าอย่างน้อยที่สุดการประมาณค่าพารามิเตอร์บางอย่างไม่เท่ากับ 0 เนื่องจากมีการทดสอบ 4 รายการข้างต้นเราจึงไม่มีการป้องกันจากปัญหาการเปรียบเทียบหลายรายการหากไม่มีสิ่งนี้ (โปรดจำไว้ว่าเนื่องจากค่า p เป็นตัวแปรสุ่ม - ไม่ว่าจะมีบางอย่างที่สำคัญจะแตกต่างจากการทดสอบไปสู่การทดสอบหรือไม่ถ้าการทดลองนั้นถูกเรียกใช้ซ้ำ - มันเป็นไปได้ที่สิ่งเหล่านี้จะไม่สอดคล้องกัน CV ที่นี่: ความสำคัญของสัมประสิทธิ์ในการถดถอยหลายครั้ง: t-test อย่างมีนัยสำคัญเทียบกับสถิติ F ที่ไม่มีนัยสำคัญและสถานการณ์ตรงข้ามที่นี่: การถดถอยมีความสำคัญอย่างไร แต่ตัวทำนายทั้งหมดไม่สำคัญ , & ที่นี่: สถิติ F และ t ในการถดถอย ) บางทีอาจจะสงสัยว่าไม่มีข้อผิดพลาดประเภทที่ 1ในตัวอย่างนี้ ในอัตราใด ๆทั้ง 5 ของการทดสอบที่กล่าวถึงในย่อหน้านี้มีการทดสอบสมมติฐาน

จากความคิดเห็นของคุณฉันรวบรวมคุณอาจสงสัยว่าจะอธิบายได้อย่างไรว่าตัวแปรอธิบายหนึ่งสำคัญกว่าอีกหรือไม่ นี่เป็นคำถามที่พบบ่อยมาก แต่ค่อนข้างยุ่งยาก ลองนึกภาพว่าต้องการทำนายศักยภาพของความสำเร็จในการเล่นกีฬาโดยพิจารณาจากความสูงและน้ำหนักของนักกีฬาและสงสัยว่าสิ่งใดสำคัญกว่ากัน กลยุทธ์ทั่วไปคือการดูเพื่อดูว่าสัมประสิทธิ์ประมาณใดมีขนาดใหญ่กว่า อย่างไรก็ตามการประมาณเหล่านี้มีความเฉพาะกับหน่วยที่ใช้: ตัวอย่างเช่นสัมประสิทธิ์ของน้ำหนักจะเปลี่ยนไปขึ้นอยู่กับว่าใช้ปอนด์หรือกิโลกรัม นอกจากนี้ยังไม่มีความชัดเจนในระยะไกลเกี่ยวกับวิธีการเปรียบเทียบ / เปรียบเทียบปอนด์และนิ้วหรือกิโลกรัมและเซนติเมตร กลยุทธ์หนึ่งที่ผู้คนใช้คือสร้างมาตรฐานR2R=R2


2

การทดสอบที่สำคัญในแบบจำลองการถดถอยคือการทดสอบแบบ Full-Reduced นี่คือที่ที่คุณกำลังเปรียบเทียบแบบจำลองการถดถอย 2 แบบแบบเต็มมีเงื่อนไขทั้งหมดอยู่ในนั้นและการทดสอบที่ลดลงมีส่วนย่อยของคำเหล่านั้น (แบบจำลองที่ลดลงจะต้องซ้อนอยู่ในแบบเต็ม) จากนั้นการทดสอบจะทดสอบสมมติฐานว่างว่าโมเดลที่ลดลงนั้นพอดีกับโมเดลเต็มและความแตกต่างใด ๆ เกิดขึ้นเนื่องจากโอกาส

งานพิมพ์ทั่วไปจากซอฟต์แวร์สถิติรวมถึงการทดสอบ F โดยรวมนี่เป็นเพียงการทดสอบ Full-Reduced ที่การทดสอบที่ลดลงเป็นรูปแบบการสกัดกั้นเท่านั้น พวกเขามักจะพิมพ์ค่า p สำหรับตัวทำนายแต่ละตัวนี่เป็นเพียงชุดของการทดสอบแบบจำลอง Full-Reduced ในแต่ละแบบจำลองที่ลดลงจะไม่รวมคำเฉพาะนั้น มีหลายวิธีในการใช้แบบทดสอบเหล่านี้เพื่อตอบคำถามที่น่าสนใจ ในความเป็นจริงแล้วการทดสอบทุกอย่างที่สอนในหลักสูตรสถิติเบื้องต้นสามารถคำนวณได้โดยใช้แบบจำลองการถดถอยและการทดสอบ Full-Reduced และผลลัพธ์จะเหมือนกันในหลาย ๆ กรณีและการประมาณใกล้เคียงกันในอีกไม่กี่คน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.