พิจารณาโมเดลเชิงเส้นอย่างง่าย:
ที่และ ,และมีคอลัมน์ของค่าคงที่
คำถามของฉันคือให้ , และมีสูตรสำหรับขอบเขตบนที่ไม่น่ารำคาญบน *? (สมมติว่าแบบจำลองนั้นประมาณโดย OLS)
* ฉันสันนิษฐานว่าเขียนสิ่งนี้เพื่อรับนั้นเป็นไปไม่ได้
EDIT1
การใช้โซลูชันที่ได้รับจากStéphane Laurent (ดูด้านล่าง) เราจะได้ขอบเขตที่ไม่สำคัญบน) การจำลองเชิงตัวเลข (ด้านล่าง) แสดงว่าขอบเขตนี้แน่นจริง ๆ แล้ว
Stéphane Laurent ได้รับสิ่งต่อไปนี้: โดยที่คือการแจกแจงเบต้าที่ไม่ได้อยู่ตรงกลางพร้อมพารามิเตอร์ non-centrality ด้วย
ดังนั้น
โดยที่เป็น non-central χ 2 ที่มีพารามิเตอร์λและk degree of freedom ดังนั้นขอบเขตบนที่ไม่สำคัญสำหรับE ( R 2 )คือ
มันแน่นมาก (แน่นกว่าที่ฉันคาดไว้มากที่สุดเท่าที่จะเป็นไปได้):
ตัวอย่างเช่นการใช้:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
ค่าเฉลี่ยของมากกว่า 1000 แบบจำลองเป็น ทฤษฎีที่ถูกผูกไว้บนข้างต้นจะช่วยให้ ผูกพันดูเหมือนว่าจะมีความแม่นยำพอ ๆ กันในหลายค่าR 2 น่าประหลาดใจอย่างแท้จริง!0.960819
0.9609081
EDIT2:
หลังจากการวิจัยต่อไปก็ปรากฏว่าคุณภาพของการประมาณขอบเขตบนกับจะได้รับดีขึ้นเป็นλ + พีเพิ่มขึ้น (และทุกคนเท่ากันλเพิ่มขึ้นกับn )