ประเภทของสถานการณ์นี้สามารถจัดการโดยมาตรฐานF-ทดสอบสำหรับรุ่นที่ซ้อนกัน เนื่องจากคุณต้องการทดสอบพารามิเตอร์ทั้งสองกับแบบจำลอง null ด้วยพารามิเตอร์คงที่สมมติฐานของคุณคือ:
H0:β=[01]HA:β≠[01].
การทดสอบแบบ F เกี่ยวข้องกับการปรับให้เหมาะสมกับทั้งสองรุ่นและเปรียบเทียบผลรวมของส่วนที่เหลือซึ่ง ได้แก่ :
SSE0= ∑i = 1n( yผม- xผม)2SSEA= ∑i = 1n( yผม- β^0- β^1xผม)2
สถิติการทดสอบคือ:
F≡ F( y , x ) = n - 22⋅ SSE0- SSEASSEA.
ค่า p ที่สอดคล้องกันคือ:
p ≡ p ( y , x ) = ∫F( y , x )∞F-Dist ( r | 2 , n - 2 ) d ร.
การใช้งานใน R:สมมติว่าข้อมูลของคุณอยู่ในกรอบข้อมูลที่เรียกว่าDATA
พร้อมกับตัวแปรที่เรียกว่าy
x
และ การทดสอบ F สามารถดำเนินการด้วยตนเองด้วยรหัสต่อไปนี้ ในข้อมูลจำลองจำลองที่ฉันใช้คุณจะเห็นว่าค่าสัมประสิทธิ์โดยประมาณใกล้เคียงกับค่าในสมมติฐานว่างและ p-value ของการทดสอบไม่แสดงหลักฐานที่มีนัยสำคัญในการปลอมแปลงสมมติฐานว่างซึ่งฟังก์ชันการถดถอยที่แท้จริงคือ ฟังก์ชันตัวตน
#Generate mock data (you can substitute your data if you prefer)
set.seed(12345);
n <- 1000;
x <- rnorm(n, mean = 0, sd = 5);
e <- rnorm(n, mean = 0, sd = 2/sqrt(1+abs(x)));
y <- x + e;
DATA <- data.frame(y = y, x = x);
#Fit initial regression model
MODEL <- lm(y ~ x, data = DATA);
#Calculate test statistic
SSE0 <- sum((DATA$y-DATA$x)^2);
SSEA <- sum(MODEL$residuals^2);
F_STAT <- ((n-2)/2)*((SSE0 - SSEA)/SSEA);
P_VAL <- pf(q = F_STAT, df1 = 2, df2 = n-2, lower.tail = FALSE);
#Plot the data and show test outcome
plot(DATA$x, DATA$y,
main = 'All Residuals',
sub = paste0('(Test against identity function - F-Stat = ',
sprintf("%.4f", F_STAT), ', p-value = ', sprintf("%.4f", P_VAL), ')'),
xlab = 'Dataset #1 Normalized residuals',
ylab = 'Dataset #2 Normalized residuals');
abline(lm(y ~ x, DATA), col = 'red', lty = 2, lwd = 2);
summary
ส่งออกและplot
เพื่อให้ดูข้อมูลนี้ได้เช่นนี้
summary(MODEL);
Call:
lm(formula = y ~ x, data = DATA)
Residuals:
Min 1Q Median 3Q Max
-4.8276 -0.6742 0.0043 0.6703 5.1462
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.02784 0.03552 -0.784 0.433
x 1.00507 0.00711 141.370 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.122 on 998 degrees of freedom
Multiple R-squared: 0.9524, Adjusted R-squared: 0.9524
F-statistic: 1.999e+04 on 1 and 998 DF, p-value: < 2.2e-16
F_STAT;
[1] 0.5370824
P_VAL;
[1] 0.5846198