ทำไมจึงเป็นไปได้ที่จะได้รับสถิติ F อย่างมีนัยสำคัญ (p <.001) แต่การทดสอบ t regressor ไม่สำคัญ?


70

ในการถดถอยเชิงเส้นแบบหลายเหตุใดจึงเป็นไปได้ที่จะมีสถิติ F ที่มีความสำคัญสูง (p <.001) แต่มีค่า p สูงมากในการทดสอบ t ของ regressor ทั้งหมด?

ในแบบจำลองของฉันมีผู้ลงทะเบียน 10 ราย หนึ่งมีค่า p-0.1 และส่วนที่เหลืออยู่สูงกว่า 0.9


สำหรับการรับมือกับปัญหานี้ดูคำถามที่ติดตาม


2
ค่าคงที่นั้นไม่มีนัยสำคัญหรือไม่? มีกี่กรณีที่เกี่ยวข้อง มีตัวแปรกี่ตัว?
whuber

Multicollinearity ถูกวินิจฉัยอย่างไร มีวิธีการมากมายบางวิธีมีข้อมูลมากกว่าวิธีอื่น ๆ ยิ่งคุณบอกเรามากเท่าไหร่ชุมชนจะตอบได้ดีขึ้นเท่านั้น
StasK

3
คำถามนี้ได้กลายเป็นคำถามที่พบบ่อย คำตอบบางส่วนที่นี่ถูกรวมเข้าด้วยกันจากกระทู้ที่คล้ายกันมาก
whuber

3
ดูเพิ่มเติมที่นี่: การถดถอยจะมีความสำคัญได้อย่างไร แต่ผู้ทำนายทั้งหมดจะไม่สำคัญและสำหรับการอภิปรายกรณีตรงข้ามให้ดูที่นี่: การทดสอบ t-test ที่สำคัญกับ F-statistic ที่ไม่สำคัญ
gung

ฉันมีปัญหาเดียวกันและไม่ใช่คำตอบข้างต้นสามารถช่วยฉันได้ ตอนนี้ฉันรู้คำตอบแล้ว (สำหรับปัญหาของฉันอย่างน้อย): ค่า F ของแบบจำลอง 2 มีความสำคัญเนื่องจากคุณได้ 'คงที่' (ตัวแปร) เหมือนในรุ่น 1 (ซึ่งค่า F ก็มีความสำคัญเช่นกัน) คุณต้องดูตารางที่เรียกว่า 'สรุปแบบจำลอง' ในคอลัมน์ 'ซิก F เปลี่ยน 'เพื่อดูว่าการเปลี่ยนแปลงใน R กำลังสองมีนัยสำคัญ (สำหรับรุ่น 2) ถ้าสิ่งนั้นมีความสำคัญค่า b ก็ควรจะสำคัญเช่นกัน คุณสามารถละเว้นค่า F ทั้งหมดได้

คำตอบ:


53

ในฐานะที่เป็น Rob กล่าวถึงสิ่งนี้จะเกิดขึ้นเมื่อคุณมีตัวแปรที่มีความสัมพันธ์สูง ตัวอย่างมาตรฐานที่ฉันใช้คือการทำนายน้ำหนักจากขนาดรองเท้า คุณสามารถทำนายน้ำหนักได้ดีพอ ๆ กับขนาดของรองเท้าขวาหรือซ้าย แต่ด้วยกันมันไม่ได้ผล

ตัวอย่างการจำลองสั้น ๆ

RSS = 3:10 #Right shoe size
LSS = rnorm(RSS, RSS, 0.1) #Left shoe size - similar to RSS
cor(LSS, RSS) #correlation ~ 0.99

weights = 120 + rnorm(RSS, 10*RSS, 10)

##Fit a joint model
m = lm(weights ~ LSS + RSS)

##F-value is very small, but neither LSS or RSS are significant
summary(m)

##Fitting RSS or LSS separately gives a significant result. 
summary(lm(weights ~ LSS))

9
มันเป็นเรื่องที่น่าสนใจและสำคัญที่จะต้องทราบว่าทั้งสองแบบของคุณทำนายได้ดีเท่า ๆ กัน ความสัมพันธ์สูงในหมู่ผู้ทำนายไม่จำเป็นต้องเป็นปัญหาสำหรับการทำนาย Multicolinearity เป็นปัญหาเมื่อ 1) นักวิเคราะห์พยายามตีความค่าสัมประสิทธิ์การถดถอยหลายครั้ง 2) โมเดลไม่สามารถประเมินได้; และ 3) SEs นั้นสูงเกินจริงและค่าสัมประสิทธิ์ไม่เสถียร
Brett

ฉันเข้าใจว่าตัวแปรสองตัวนั้นมีความสัมพันธ์กันอย่างมากดังนั้นผลลัพธ์ของการทดสอบ t จึงไม่สำคัญในขณะที่ผลลัพธ์ของการทดสอบ F มีความสำคัญ แต่สิ่งนี้เกิดขึ้นได้อย่างไร ฉันหมายความว่าอะไรคือสาเหตุของข้อเท็จจริงนี้?
yue86231

105

ตัวแปรอิสระมีความสัมพันธ์กันน้อยมากในการทำให้เกิดสิ่งนี้

หากต้องการดูสาเหตุให้ลองทำดังนี้

  • วาดสิบเวกเตอร์สิบชุดด้วยค่าสัมประสิทธิ์ iid มาตรฐานปกติ(x1,x2,,x10)

  • คำนวณสำหรับ9 สิ่งนี้ทำให้รายบุคคลมาตรฐานปกติ แต่มีความสัมพันธ์บางอย่างในหมู่พวกเขาyi=(xi+xi+1)/2i=1,2,,9yi

  • คำนวณ{10} โปรดทราบว่าy_9)w=x1+x2++x10w=2(y1+y3+y5+y7+y9)

  • เพิ่มอิสระข้อผิดพลาดการกระจายตามปกติบางอย่างเพื่อWจากการทดลองเล็กน้อยฉันพบว่ากับทำงานได้ค่อนข้างดี ดังนั้นคือผลรวมของบวกข้อผิดพลาดบางอย่าง นอกจากนี้ยังเป็นผลรวมของบางส่วนของบวกข้อผิดพลาดเดียวกันwz=w+εεN(0,6)zxiyi

เราจะพิจารณาให้เป็นตัวแปรอิสระและเป็นตัวแปรตามyiz

นี่คือเมทริกซ์กระจายของชุดข้อมูลหนึ่งชุดโดยมีอยู่ด้านบนและด้านซ้ายและดำเนินการตามลำดับzyi

เมทริกซ์ Scatterplot

ความสัมพันธ์คาดว่าในหมู่และเป็นเมื่อและมิฉะนั้น ค่าสหสัมพันธ์ที่รับรู้มีมากถึง 62% พวกมันปรากฏเป็นแผนการกระจายที่แน่นกว่าถัดจากแนวทแยงyiyj1/2|ij|=10

ดูการถดถอยของเทียบกับ :zyi

      Source |       SS       df       MS              Number of obs =      50
-------------+------------------------------           F(  9,    40) =    4.57
       Model |  1684.15999     9  187.128887           Prob > F      =  0.0003
    Residual |  1636.70545    40  40.9176363           R-squared     =  0.5071
-------------+------------------------------           Adj R-squared =  0.3963
       Total |  3320.86544    49  67.7727641           Root MSE      =  6.3967

------------------------------------------------------------------------------
           z |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          y1 |   2.184007   1.264074     1.73   0.092    -.3707815    4.738795
          y2 |   1.537829   1.809436     0.85   0.400    -2.119178    5.194837
          y3 |   2.621185   2.140416     1.22   0.228    -1.704757    6.947127
          y4 |   .6024704   2.176045     0.28   0.783    -3.795481    5.000421
          y5 |   1.692758   2.196725     0.77   0.445    -2.746989    6.132506
          y6 |   .0290429   2.094395     0.01   0.989    -4.203888    4.261974
          y7 |   .7794273   2.197227     0.35   0.725    -3.661333    5.220188
          y8 |  -2.485206    2.19327    -1.13   0.264     -6.91797    1.947558
          y9 |   1.844671   1.744538     1.06   0.297    -1.681172    5.370514
       _cons |   .8498024   .9613522     0.88   0.382    -1.093163    2.792768
------------------------------------------------------------------------------

สถิติ F มีความสำคัญสูง แต่ไม่มีตัวแปรอิสระใด ๆ ถึงแม้ว่าจะไม่มีการปรับค่าใด ๆ สำหรับทั้ง 9 ตัวแปรก็ตาม

หากต้องการดูว่าเกิดอะไรขึ้นให้พิจารณาการถดถอยของเทียบกับเลขคี่:zyi

      Source |       SS       df       MS              Number of obs =      50
-------------+------------------------------           F(  5,    44) =    7.77
       Model |  1556.88498     5  311.376997           Prob > F      =  0.0000
    Residual |  1763.98046    44  40.0904649           R-squared     =  0.4688
-------------+------------------------------           Adj R-squared =  0.4085
       Total |  3320.86544    49  67.7727641           Root MSE      =  6.3317

------------------------------------------------------------------------------
           z |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          y1 |   2.943948   .8138525     3.62   0.001     1.303736     4.58416
          y3 |   3.403871   1.080173     3.15   0.003     1.226925    5.580818
          y5 |   2.458887    .955118     2.57   0.013      .533973    4.383801
          y7 |  -.3859711   .9742503    -0.40   0.694    -2.349443    1.577501
          y9 |   .1298614   .9795983     0.13   0.895    -1.844389    2.104112
       _cons |   1.118512   .9241601     1.21   0.233    -.7440107    2.981034
------------------------------------------------------------------------------

ตัวแปรเหล่านี้บางอย่างมีความสำคัญสูงถึงแม้จะมีการปรับ Bonferroni (มีอีกมากมายที่สามารถพูดได้โดยดูผลลัพธ์เหล่านี้ แต่มันจะพาเราออกไปจากจุดหลัก)

สัญชาตญาณเบื้องหลังนี้คือขึ้นอยู่กับชุดย่อยของตัวแปรเป็นหลัก (แต่ไม่จำเป็นต้องเป็นชุดย่อยที่ไม่ซ้ำกัน) ส่วนประกอบของชุดย่อยนี้ ( ) ไม่จำเป็นต้องเพิ่มข้อมูลใด ๆ เกี่ยวกับเนื่องจากความสัมพันธ์ - เล็กน้อย - กับเซตย่อยเองy 2 , y 4 , y 6 , y 8 zzy2,y4,y6,y8z

การเรียงลำดับของสถานการณ์เช่นนี้จะเกิดขึ้นในการวิเคราะห์อนุกรมเวลา เราสามารถพิจารณาตัวห้อยเป็นเวลา การสร้างทำให้เกิดความสัมพันธ์แบบอนุกรมระยะสั้นในหมู่พวกเขาคล้ายกับอนุกรมเวลาจำนวนมาก ด้วยเหตุนี้เราจึงสูญเสียข้อมูลเพียงเล็กน้อยโดยการสุ่มซีรีส์ใหม่ในช่วงเวลาปกติyi

ข้อสรุปหนึ่งที่เราสามารถดึงมาได้จากสิ่งนี้คือเมื่อตัวแปรมากเกินไปรวมอยู่ในแบบจำลองพวกเขาสามารถปกปิดสิ่งที่สำคัญอย่างแท้จริง สัญญาณแรกของสิ่งนี้คือสถิติ F โดยรวมที่มีความสำคัญสูงพร้อมกับการทดสอบทีที่ไม่สำคัญสำหรับค่าสัมประสิทธิ์ของแต่ละบุคคล (แม้ว่าตัวแปรบางตัวมีความสำคัญเป็นรายบุคคล แต่ก็ไม่ได้หมายความว่าตัวแปรอื่นจะไม่ได้โดยอัตโนมัตินั่นคือหนึ่งในข้อบกพร่องพื้นฐานของกลยุทธ์การถดถอยแบบขั้นตอน: พวกเขาตกเป็นเหยื่อของปัญหาการหลอกลวงนี้) โดยบังเอิญปัจจัยเงินเฟ้อที่แปรปรวนในช่วงการถดถอยครั้งแรกจาก 2.55 ถึง 6.09 ด้วยค่าเฉลี่ย 4.79: เพียงแค่เส้นเขตแดนของการวินิจฉัยพหุความสัมพันธ์บางอย่างตามกฎหัวโบราณที่สุดของนิ้วหัวแม่มือ; ต่ำกว่าขีด จำกัด ตามกฎอื่น ๆ (โดยที่ 10 คือการตัดยอดบน)


5
คำตอบที่ดี A บวก 1 จากฉัน ฉันอยากจะให้มากกว่านี้
Michael Chernick

41

พหุ

  • R2
  • แน่นอนความหลากหลายทางชีวภาพไม่ได้เป็นเพียงแค่เกณฑ์ที่แน่นอน ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยจะเพิ่มขึ้นตามความสัมพันธ์กับการเพิ่มขึ้นของตัวทำนายโฟกัส

ตัวทำนายที่สำคัญเกือบหลายตัว

  • แม้ว่าคุณจะไม่มีความหลากหลายทางชีวภาพ แต่คุณยังสามารถรับตัวทำนายที่ไม่สำคัญและแบบจำลองที่สำคัญโดยรวมได้หากตัวทำนายสองตัวหรือมากกว่านั้นใกล้เคียงกับนัยสำคัญและรวมกันการทำนายโดยรวมจะผ่านเกณฑ์สำคัญทางสถิติ ตัวอย่างเช่นการใช้อัลฟ่าที่. 05 หากคุณมีตัวทำนายสองตัวที่มีค่า p-.06 และ. 07 ดังนั้นฉันจะไม่แปลกใจถ้าแบบจำลองโดยรวมมี p <.05

คำตอบที่กระชับ หากต้องการเพิ่มสิ่งนี้ฉันขอแนะนำให้รบกวนข้อมูล (หรือลบตัวทำนาย) และดูว่ามีการเปลี่ยนแปลงที่เห็นได้ชัดเจนในสัมประสิทธิ์การถดถอยหรือไม่ ตัวอย่างเช่นระวังการเปลี่ยนแปลงเครื่องหมาย
Mustafa S Eisa

38

สิ่งนี้จะเกิดขึ้นเมื่อตัวทำนายมีความสัมพันธ์สูง ลองนึกภาพสถานการณ์ที่มีเพียงสองตัวทำนายที่มีความสัมพันธ์สูงมาก ทั้งคู่ยังสัมพันธ์อย่างใกล้ชิดกับตัวแปรตอบกลับ ดังนั้นการทดสอบ F มีค่า p ต่ำ (กล่าวกันว่าตัวทำนายร่วมกันมีความสำคัญอย่างสูงในการอธิบายความแปรปรวนในตัวแปรตอบสนอง) แต่การทดสอบทีสำหรับตัวทำนายแต่ละตัวมีค่า p สูงเพราะหลังจากอนุญาตให้มีผลกระทบของตัวทำนายอื่น ๆ แล้วก็ไม่มีเหลือให้อธิบายอีกมาก


สวัสดีร็อบขอโทษที่รบกวนคุณ ฉันอ่านคำตอบของคุณ (เพราะฉันกำลังเผชิญกับสถานการณ์คำถามตอนนี้) แต่ฉันไม่สามารถเข้าใจสิ่งที่คุณหมายถึงโดยการพูดว่า "หลังจากให้ผลกระทบของการทำนายอื่น ๆ ที่เหลือไม่มากที่จะอธิบาย" ฉันขอให้คุณอธิบายเรื่องนี้กับฉันได้ไหม ขอบคุณมาก.
yue86231

1
@ yue86231 หมายความว่าแม้ว่าเราจะมีค่า p-value เดียวสำหรับตัวทำนายแต่ละตัว แต่เราก็ไม่สามารถตีความค่า p แต่ละค่าในการแยกได้ ตัวทำนาย t-test แต่ละตัวสามารถแสดงความสำคัญของตัวแปรหลังจากการบัญชีสำหรับความแปรปรวนที่อธิบายโดยตัวแปรอื่น ๆ ทั้งหมด สัมประสิทธิ์การถดถอยเชิงเส้นและความคลาดเคลื่อนมาตรฐานถูกสร้างขึ้นในเวลาเดียวกันดังนั้นการพูดและตัวทำนายสองตัวจะลดความสำคัญซึ่งกันและกัน
Robert Kubrick

11

X1N(0,1)X2=aX1+δY=bX1+cX2+ϵδϵX1N(0,1)

Cov(X2,Y)=E[(aX1+δ)(bX1+cX2+ϵ)]=E[(aX1+δ)({b+ac}X1+cδ+ϵ)]=a(b+ac)+c

a=1b=2c=1

คุณบอกว่าคุณเข้าใจปัญหาของตัวแปรที่มีความสัมพันธ์และการถดถอยนั้นไม่มีนัยสำคัญที่ดีกว่า มันอาจหมายความว่าคุณถูก จำกัด ด้วยการกล่าวถึงความสัมพันธ์แบบหลายจุด แต่คุณจะต้องเพิ่มความเข้าใจในเรขาคณิตอย่างน้อยกำลังสอง


10

คำหลักที่ใช้ในการค้นหาคือ "collinearity" หรือ "multicollinearity" สิ่งนี้สามารถตรวจพบได้โดยใช้การวินิจฉัยเช่นVariance Inflation Factors (VIFs) หรือวิธีการตามที่อธิบายไว้ในตำรา"การวินิจฉัยการถดถอย: การระบุข้อมูลที่มีอิทธิพลและแหล่งที่มาของการ Collinearity"โดย Belsley, Kuh และ Welsch VIFs เป็นเรื่องง่ายที่จะเข้าใจ แต่พวกเขาไม่สามารถจัดการกับ collinearity ที่เกี่ยวข้องกับการตัด (เช่นการพยากรณ์ที่เกือบจะคงที่ด้วยตัวเองหรือในการรวมกันเชิงเส้น) - ตรงกันข้ามวินิจฉัย BKW อยู่ห่างไกลที่ใช้งานง่ายน้อย แต่สามารถจัดการกับ collinearity ที่เกี่ยวข้องกับ การสกัดกั้น


9

คำตอบที่คุณได้รับขึ้นอยู่กับคำถามที่คุณถาม นอกเหนือจากที่ได้ทำไปแล้วค่าแต่ละพารามิเตอร์ค่า F และค่า F รุ่นโดยรวมจะตอบคำถามต่าง ๆ กันดังนั้นพวกเขาจึงได้คำตอบที่แตกต่างกัน ฉันได้เห็นสิ่งนี้เกิดขึ้นแม้ว่าค่า F แต่ละค่าจะไม่ใกล้เคียงอย่างมีนัยสำคัญโดยเฉพาะอย่างยิ่งหากแบบจำลองมีค่ามากกว่า 2 หรือ 3 IV ฉันไม่รู้วิธีใดที่จะรวมค่า p แต่ละค่าเข้ากับค่าใด ๆ ที่มีความหมายแม้ว่าอาจมีวิธีก็ตาม


2
(-1) ใช่ - โปสเตอร์ต้นฉบับสังเกตว่าเขา / เธอเห็นว่ามันเกิดขึ้นเช่นกัน คำถามคืออะไรบางอย่างที่อาจทำให้สิ่งนี้นอกเหนือจากความไม่เป็นเชิงเส้นตรงและฉันไม่เห็นว่านี่เป็นคำตอบอย่างไร
มาโคร

4
@Macro Downvote ดูเหมือนจะรุนแรงเล็กน้อยเนื่องจากมีการสังเกตที่เป็นประโยชน์และถูกต้องในคำตอบนี้: การทดสอบความสำคัญโดยรวมและสำหรับความสำคัญของตัวแปรแต่ละตัว "ตอบคำถามต่าง ๆ " เป็นที่ยอมรับว่ามีคุณภาพ แต่ไม่มากดังนั้นจึงเป็นคำตอบแรกที่มี upvotes มากมาย และสำหรับคำตอบนั้นมันเป็นการเพิ่มสัญชาตญาณที่ถูกต้องบางส่วนทำให้เป็นการปรับปรุงมากกว่าคำตอบนั้น
whuber

1
ฉันไม่เคยบอกว่าไม่มีข้อมูลหรือสัญชาตญาณที่ถูกต้องมาจากคำตอบนี้ หากฉันมีคำตอบที่ดีสำหรับคำถามนี้ฉันได้ตอบไปแล้ว - มันเป็นคำถามที่ยากมาก - ฉันแค่บอกว่าคำตอบนี้ดูเหมือนจะไม่ตอบคำถามในแง่ของคำใด ๆ
มาโคร

9

สิ่งหนึ่งที่ต้องจำไว้คือการทดสอบค่าสัมประสิทธิ์ของแต่ละคนคิดว่าตัวทำนายอื่น ๆ ทั้งหมดอยู่ในแบบจำลอง กล่าวอีกนัยหนึ่งตัวทำนายแต่ละตัวไม่สำคัญตราบใดที่ตัวทำนายอื่น ๆ ทั้งหมดอยู่ในแบบจำลอง จะต้องมีการโต้ตอบหรือการพึ่งพาซึ่งกันและกันระหว่างตัวทำนายสองตัวหรือมากกว่าของคุณ

ตามที่คนอื่นถามไว้ข้างต้น - คุณวินิจฉัยปัญหาการขาดความหลากหลายทางชีวภาพได้อย่างไร?


4

วิธีหนึ่งในการทำความเข้าใจนี้เป็นรูปทรงเรขาคณิตของสี่เหลี่ยมน้อยที่สุดตามที่ @StasK แนะนำ

อีกเรื่องหนึ่งคือการตระหนักว่า X หมายถึง X ที่เกี่ยวข้องกับ Y เมื่อควบคุมตัวแปรอื่น แต่ไม่ใช่เพียงอย่างเดียว คุณบอกว่า X เกี่ยวข้องกับความแปรปรวนที่ไม่ซ้ำกันใน Y สิ่งนี้ถูกต้อง แม้ว่าความแปรปรวนที่ไม่ซ้ำกันใน Y นั้นแตกต่างจากความแปรปรวนทั้งหมด แล้วตัวแปรอื่น ๆ ที่ลบออกคืออะไร?

มันจะช่วยถ้าคุณบอกตัวแปรของคุณกับเราได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.