พิสูจน์ว่าสถิติ F ตามการกระจายตัวของ F


20

ในแง่ของคำถามนี้: พิสูจน์ว่าสัมประสิทธิ์ในแบบจำลอง OLS เป็นไปตามการแจกแจงแบบ t- ด้วย (nk) องศาอิสระ

ฉันชอบที่จะเข้าใจว่าทำไม

F=(TSSRSS)/(p1)RSS/(np),

โดยที่คือจำนวนพารามิเตอร์โมเดลและจำนวนการสังเกตและความแปรปรวนรวม,ค่าความแปรปรวนที่เหลือตามการกระจายn T S S R S S F พี- 1 , n - พีpnTSSRSSFp1,np

ฉันต้องยอมรับว่าฉันไม่ได้พยายามพิสูจน์มันเพราะฉันไม่รู้ว่าจะเริ่มจากตรงไหน


Christoph Hanck และ Francis ให้คำตอบที่ดีมากไปแล้ว หากคุณยังมีความยากลำบากในการทำความเข้าใจหลักฐานของการทดสอบ F สำหรับการถดถอยเชิงเส้นพยายามที่จะเช็คเอาท์teamdable.github.io/techblog/... ฉันเขียนโพสต์บล็อกเกี่ยวกับหลักฐานการ ftest สำหรับการถดถอยเชิงเส้น มันเขียนด้วยภาษาเกาหลี แต่อาจไม่เป็นปัญหาเพราะเกือบทั้งหมดเป็นสูตรทางคณิตศาสตร์ ฉันหวังว่ามันจะช่วยถ้าคุณยังมีปัญหาในการทำความเข้าใจหลักฐานการทดสอบ f สำหรับการถดถอยเชิงเส้น
Taeho Oh

แม้ว่าลิงก์นี้อาจตอบคำถามได้ดีกว่าหากรวมส่วนสำคัญของคำตอบไว้ที่นี่และให้ลิงก์สำหรับการอ้างอิง คำตอบสำหรับลิงค์เท่านั้นอาจไม่ถูกต้องหากหน้าเว็บที่เชื่อมโยงมีการเปลี่ยนแปลง - จากการรีวิว
mkt - Reinstate Monica

คำตอบ:


19

ให้เราแสดงผลลัพธ์สำหรับกรณีทั่วไปที่สูตรของคุณสำหรับสถิติทดสอบเป็นกรณีพิเศษ โดยทั่วไปเราต้องตรวจสอบว่าสถิติสามารถเป็นไปตามลักษณะของการแจกแจงแบบFχ 2เขียนเป็นอัตราส่วนอิสระ rvs หารด้วยองศาอิสระχ2

ให้กับและที่รู้จักกัน nonrandom และมีคอลัมน์เต็มอันดับQสิ่งนี้แสดงให้เห็นถึงข้อ จำกัด เชิงเส้นของสำหรับ (ซึ่งแตกต่างจากสัญลักษณ์ OP) regressors รวมถึงคำคงที่ ดังนั้นในตัวอย่างของ @ user1627466สอดคล้องกับข้อ จำกัดของการตั้งค่าสัมประสิทธิ์ความชันทั้งหมดให้เป็นศูนย์H0:Rβ=rRrR:k×qqqkp1q=k1

ในมุมมองของเรามี ดังนั้น (ด้วยเป็น "เมทริกซ์สแควร์รูท" ของ , ผ่าน, เช่น, a การสลายตัว Cholesky) เป็น Var(β^ols)=σ2(XX)1

R(β^olsβ)N(0,σ2R(XX)1R),
B1/2={R(XX)1R}1/2B1={R(XX)1R}1
n:=B1/2σR(β^olsβ)N(0,Iq),
Var(n)=B1/2σRVar(β^ols)RB1/2σ=B1/2σσ2BB1/2σ=I
โดยที่บรรทัดที่สองใช้ความแปรปรวนของ OLSE

สิ่งนี้ดังที่แสดงในคำตอบที่คุณเชื่อมโยงไปถึง (ดูที่นี่ด้วย ) เป็นอิสระจาก ที่เป็นค่าประมาณความแปรปรวนข้อผิดพลาดที่ไม่เอนเอียงตามปกติโดยมีคือ 'เมทริกซ์ชงเหลือ' จากถอยในX

d:=(nk)σ^2σ2χnk2,
σ 2=Y'MXY/(n-k)MX=ฉัน-เอ็กซ์(X'X)-1X'Xσ^2=yMXy/(nk)MX=IX(XX)1XX

ดังนั้นเมื่อเป็นรูปแบบสมการกำลังสองในภาวะปกติ โดยเฉพาะอย่างยิ่งภายใต้สิ่งนี้จะลดค่าทางสถิติ nn

nnχq2/qd/(nk)=(β^olsβ)R{R(XX)1R}1R(β^olsβ)/qσ^2Fq,nk.
H0:Rβ=r
F=(Rβ^olsr){R(XX)1R}1(Rβ^olsr)/qσ^2Fq,nk.

เพื่อประกอบการอธิบายให้พิจารณากรณีพิเศษ , , ,และฉัน จากนั้น ระยะ Euclidean กำลังสองของ OLS ประเมินจากแหล่งกำเนิดที่ได้มาตรฐานโดยจำนวนองค์ประกอบ - เน้นว่าเนื่องจากเป็นมาตรฐานบรรทัดฐานกำลังสองและด้วยเหตุนี้การกระจายอาจเห็นได้ เป็นการกระจาย"เฉลี่ยR=Ir=0q=2σ 2 = 1 X ' X = ฉันF = β ' OLS β OLS / 2 = β 2 OLS , 1 + β 2 OLS , 2σ^2=1XX=I

F=β^olsβ^ols/2=β^ols,12+β^ols,222,
β2OLS,2χ21Fไค2β^ols,22χ12Fχ2

ในกรณีที่คุณต้องการจำลองเล็ก ๆ น้อย ๆ (ซึ่งแน่นอนว่าไม่ใช่ข้อพิสูจน์!) ซึ่งเป็นโมฆะทดสอบว่าไม่มีใครในเรื่อง regressors - ที่พวกเขาทำไม่ได้แน่นอนดังนั้นเราจึงจำลองการแจกแจงโมฆะk

ป้อนคำอธิบายรูปภาพที่นี่

เราเห็นข้อตกลงที่ดีระหว่างความหนาแน่นเชิงทฤษฎีและฮิสโตแกรมของสถิติการทดสอบมอนติคาร์โล

library(lmtest)
n <- 100
reps <- 20000
sloperegs <- 5 # number of slope regressors, q or k-1 (minus the constant) in the above notation
critical.value <- qf(p = .95, df1 = sloperegs, df2 = n-sloperegs-1) 
# for the null that none of the slope regrssors matter

Fstat <- rep(NA,reps)
for (i in 1:reps){
  y <- rnorm(n)
  X <- matrix(rnorm(n*sloperegs), ncol=sloperegs)
  reg <- lm(y~X)
  Fstat[i] <- waldtest(reg, test="F")$F[2] 
}

mean(Fstat>critical.value) # very close to 0.05

hist(Fstat, breaks = 60, col="lightblue", freq = F, xlim=c(0,4))
x <- seq(0,6,by=.1)
lines(x, df(x, df1 = sloperegs, df2 = n-sloperegs-1), lwd=2, col="purple")

ที่จะเห็นว่ารุ่นของสถิติทดสอบในคำถามและคำตอบที่เป็นจริงเทียบเท่าทราบว่าสอดคล้อง null ข้อ จำกัดและ 0R=[0I]r=0

ให้ถูกแบ่งพาร์ติชันตามค่าสัมประสิทธิ์ที่ถูก จำกัด ให้เป็นศูนย์ภายใต้ null (ในกรณีของคุณทั้งหมดยกเว้นค่าคงที่ แต่การสืบทอดตามมานั้นเป็นเรื่องทั่วไป) นอกจากนี้ให้เป็นค่าประมาณ OLS ที่แบ่งพาร์ติชันอย่างเหมาะสมX=[X1X2]β OLS = ( β ' OLS , 1 , β ' OLS , 2 ) 'β^ols=(β^ols,1,β^ols,2)

จากนั้น และ บล็อกล่างขวาของ ตอนนี้ใช้ผลลัพธ์สำหรับผู้ที่ได้รับการแบ่งพาร์ติชันเพื่อรับ ที่

Rβ^ols=β^ols,2
R(XX)1RD~,
(XTX)1=(X1X1X1X2X2X1X2X2)1(A~B~C~D~)
˜ D =(X2 X2-X2 X1(X1 X1)-1X1 X2)-1=(X2 M X 1 X2)-1M X 1 =I
D~=(X2X2X2X1(X1X1)1X1X2)1=(X2MX1X2)1
MX1=IX1(X1X1)1X1

ดังนั้นตัวเศษของสถิติจะกลายเป็น (โดยไม่มีการหารด้วย ) ถัดไปจำได้ว่าตามทฤษฎีบท Frisch-Waugh-Lovellเราอาจเขียน เพื่อให้ Fq

Fnum=β^ols,2(X2MX1X2)β^ols,2
β^ols,2=(X2MX1X2)1X2MX1y
Fnum=yMX1X2(X2MX1X2)1(X2MX1X2)(X2MX1X2)1X2MX1y=yMX1X2(X2MX1X2)1X2MX1y

มันยังคงแสดงให้เห็นว่าตัวเศษนี้เหมือนกับ , ความแตกต่างในผลรวมที่ไม่ จำกัด และ จำกัด ของส่วนที่สองUSSRRSSR

ที่นี่ คือผลรวมที่เหลือของกำลังสองจากการถดถอยบนนั่นคือกำหนดในกรณีพิเศษของคุณนี่เป็นเพียงค่าคงที่ของการถดถอยบนค่าคงที่

RSSR=yMX1y
yX1H0TSS=i(yiy¯)2

ใช้ FWL ​​อีกครั้ง (ซึ่งแสดงให้เห็นว่าส่วนที่เหลือของทั้งสองวิธีเหมือนกัน) เราสามารถเขียน (SSR ในเอกสารของคุณ) เป็น SSR ของการถดถอย USSR

MX1yonMX1X2

นั่นคือ

USSR=yMX1MMX1X2MX1y=yMX1(IPMX1X2)MX1y=yMX1yyMX1MX1X2((MX1X2)MX1X2)1(MX1X2)MX1y=yMX1yyMX1X2(X2MX1X2)1X2MX1y

ดังนั้น,

RSSRUSSR=yMX1y(yMX1yyMX1X2(X2MX1X2)1X2MX1y)=yMX1X2(X2MX1X2)1X2MX1y


ขอบคุณ ฉันไม่รู้ว่ามันถือเป็นมือจับ ณ จุดนี้ แต่คุณจะไปจากผลรวมของกำลังสองของคุณถึงการแสดงออกที่ประกอบด้วยผลรวมของสี่เหลี่ยมได้อย่างไร
user1627466

1
@ user1627466 ฉันได้เพิ่มความเทียบเท่าของสูตรสองสูตร
Christoph Hanck

4

@ ChristophHanck ได้ให้คำตอบที่ครอบคลุมมากที่นี่ฉันจะเพิ่มร่างของหลักฐานในกรณีพิเศษ OP กล่าวถึง หวังว่ามันจะง่ายต่อการติดตามสำหรับผู้เริ่มต้น

ตัวแปรแบบสุ่มถ้าที่และมีความเป็นอิสระ ดังนั้นเพื่อแสดงให้เห็นว่า -statistic มี -distribution เราอาจรวมทั้งแสดงให้เห็นว่าและสำหรับค่าคงที่และเป็นอิสระYFd1,d2

Y=X1/d1X2/d2,
X1χd12X2χd22FFcESSχp12cRSSχnp2c

ในรูปแบบ OLS เราเขียนที่เป็นเมทริกซ์และความนึกคิด2I) เพื่อความสะดวกของเราแนะนำหมวกเมทริกซ์ (หมายเหตุ ) และผู้ผลิตที่เหลือMคุณสมบัติที่สำคัญของและคือมีทั้งสมมาตรและ idempotent นอกจากนี้เรายังมีและสิ่งเหล่านี้จะมีประโยชน์ในภายหลัง

y=Xβ+ε,
Xn×pεNn(0,σ2I)H=X(XTX)1XTy^=HyM=IHHMtr(H)=pHX=X

ขอให้เราแสดงเมทริกซ์ของทุกคนในฐานะผลรวมของกำลังสองสามารถแสดงด้วยรูปแบบสมการกำลังสอง:โปรดทราบว่าฉัน หนึ่งสามารถตรวจสอบว่าคือ idempotent และ n มันดังต่อไปจากนี้แล้วที่ยังเป็น idempotent และ 0J

TSS=yT(I1nJ)y,RSS=yTMy,ESS=yT(H1nJ)y.
M+(HJ/n)+J/n=IJ/nrank(M)+rank(HJ/n)+rank(J/n)=nHJ/nM(HJ/n)=0

ตอนนี้เราสามารถกำหนดให้แสดงว่า statistic มี -distribution (ค้นหาทฤษฎีบทของ Cochranสำหรับข้อมูลเพิ่มเติม) ที่นี่เราต้องการข้อเท็จจริงสองประการ:FF

  1. ให้Sigma) สมมติว่ามีความสมมาตรกับอันดับและเป็น idempotent จากนั้นเช่นไม่ใช่ศูนย์กลางมี dfและไม่ใช่ศูนย์กลาง 2 นี้เป็นกรณีพิเศษของผล Baldessari ของเป็นหลักฐานนอกจากนี้ยังสามารถพบได้ที่นี่xNn(μ,Σ)ArAΣxTAxχr2(μTAμ/2)χ2rμTAμ/2
  2. ให้Sigma) ถ้าดังนั้นและเป็นอิสระ นี้เรียกว่าทฤษฎีบทของเครกxNn(μ,Σ)AΣB=0xTAxxTBx

เนื่องจากเรามีอย่างไรก็ตามภายใต้สมมติฐานว่างดังนั้นจริงๆ บนมืออื่น ๆ ทราบว่าตั้งแต่ X ดังนั้น{} เนื่องจาก ,และจึงเป็นอิสระเช่นกัน มันตามมาทันทีแล้วyNn(Xβ,σ2I)

ESSσ2=(yσ)T(H1nJ)yσχp12((Xβ)T(HJn)Xβ).
β=0ESS/σ2χp12yTMy=εTMεHX=XRSS/σ2χnp2M(HJ/n)=0ESS/σ2RSS/σ2
F=(TSSRSS)/(p1)RSS/(np)=ESSσ2/(p1)RSSσ2/(np)Fp1,np.
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.