ความคาดหวังตามเงื่อนไขของ R-squared


18

พิจารณาโมเดลเชิงเส้นอย่างง่าย:

yy=Xββ+ϵ

ที่ϵii.i.d.N(0,σ2)และ XRn×p ,p2และXมีคอลัมน์ของค่าคงที่

คำถามของฉันคือให้E(XX) , βและσมีสูตรสำหรับขอบเขตบนที่ไม่น่ารำคาญบนE(R2) *? (สมมติว่าแบบจำลองนั้นประมาณโดย OLS)

* ฉันสันนิษฐานว่าเขียนสิ่งนี้เพื่อรับE(R2)นั้นเป็นไปไม่ได้

EDIT1

การใช้โซลูชันที่ได้รับจากStéphane Laurent (ดูด้านล่าง) เราจะได้ขอบเขตที่ไม่สำคัญบนE(R2)) การจำลองเชิงตัวเลข (ด้านล่าง) แสดงว่าขอบเขตนี้แน่นจริง ๆ แล้ว

Stéphane Laurent ได้รับสิ่งต่อไปนี้: R2B(p1,np,λ) โดยที่B(p1,np,λ)คือการแจกแจงเบต้าที่ไม่ได้อยู่ตรงกลางพร้อมพารามิเตอร์ non-centrality λด้วย

λ=||XβE(X)β1n||2σ2

ดังนั้น

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

โดยที่เป็น non-central χ 2 ที่มีพารามิเตอร์λและk degree of freedom ดังนั้นขอบเขตบนที่ไม่สำคัญสำหรับE ( R 2 )คือχk2(λ)χ2λkE(R2)

λ+p1λ+n1

มันแน่นมาก (แน่นกว่าที่ฉันคาดไว้มากที่สุดเท่าที่จะเป็นไปได้):

ตัวอย่างเช่นการใช้:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

ค่าเฉลี่ยของมากกว่า 1000 แบบจำลองเป็น ทฤษฎีที่ถูกผูกไว้บนข้างต้นจะช่วยให้ ผูกพันดูเหมือนว่าจะมีความแม่นยำพอ ๆ กันในหลายค่าR 2 น่าประหลาดใจอย่างแท้จริง!R20.9608190.9609081R2

EDIT2:

หลังจากการวิจัยต่อไปก็ปรากฏว่าคุณภาพของการประมาณขอบเขตบนกับจะได้รับดีขึ้นเป็นλ + พีเพิ่มขึ้น (และทุกคนเท่ากันλเพิ่มขึ้นกับn )E(R2)λ+pλn


มีการแจกแจงแบบเบต้าพร้อมพารามิเตอร์ขึ้นอยู่กับ nและ pเท่านั้น ไม่นะ R2np
Stéphane Laurent

1
Oooppss ขออภัยการอ้างสิทธิ์ก่อนหน้าของฉันเป็นจริงเฉพาะภายใต้สมมติฐานของ "โมเดลโมฆะ" (สกัดกั้นเท่านั้น) มิฉะนั้นการกระจายของควรเป็นสิ่งที่เหมือนกับการกระจายเบต้าแบบไม่รวมศูนย์โดยมีพารามิเตอร์แบบไม่รวมศูนย์ที่เกี่ยวข้องกับพารามิเตอร์ที่ไม่รู้จัก R2
Stéphane Laurent

@StéphaneLaurent: thanks. Would you know more about the relationship between the unknown parameters and the parameters of the Beta? I'm stuck, so any pointer would be welcome...
user603

Do you absolutely need to deal with E[R2] ? Perhaps there is a simple exact formula for E[R2/(1R2)].
Stéphane Laurent

1
ด้วยสัญลักษณ์ของคำตอบของฉันสำหรับบางเกลาkและช่วงแรกของ noncentral F -distribution เป็นเรื่องง่าย R2/(1R2)=kFkF
Stéphane Laurent

คำตอบ:


13

Any linear model can be written Y=μ+σG where G has the standard normal distribution on Rn and μ is assumed to belong to a linear subspace W of Rn. In your case W=Im(X).

Let [1]W be the one-dimensional linear subspace generated by the vector (1,1,,1). Taking U=[1] below, the R2 is highly related to the classical Fisher statistic

F=PZY2/(m)PWY2/(nm),
for the hypothesis test of H0:{μU} where UW is a linear subspace, and denoting by Z=UW the orthogonal complement of U in W, and denoting m=dim(W) and =dim(U) (then m=p and =1 in your situation).

Indeed,

PZY2PWY2=R21R2
because the definition of R2 is
R2=PZY2PUY2=1PWY2PUY2.

Obviously PZY=PZμ+σPZG and PWY=σPWG.

When H0:{μU} is true then PZμ=0 and therefore

F=PZG2/(m)PWG2/(nm)Fm,nm
has the Fisher Fm,nm distribution. Consequently, from the classical relation between the Fisher distribution and the Beta distribution, R2B(m,nm).

In the general situation we have to deal with PZY=PZμ+σPZG when PZμ0. In this general case one has PZY2σ2χm2(λ), the noncentral χ2 distribution with m degrees of freedom and noncentrality parameter λ=PZμ2σ2, and then FFm,nm(λ) (noncentral Fisher distribution). This is the classical result used to compute power of F-tests.

The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. Finally R2 has the noncentral beta distribution with "shape parameters" m and nm and noncentrality parameter λ. I think the moments are available in the literature but they possibly are highly complicated.

Finally let us write down PZμ. Note that PZ=PWPU. One has PUμ=μ¯1 when U=[1], and PWμ=μ. Hence PZμ=μμ¯1 where here μ=Xβ for the unknown parameters vector β.


1
PZx is the orthogoanl projection of x on the linear subspace Z. And P denotes projection on the orthogonal.
Stéphane Laurent

1
Beware of PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
μ¯=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.