เอาล่ะมาดูสถานการณ์ของคุณกันดีกว่า โดยทั่วไปคุณมีสองการถดถอย (APD = เส้นผ่านศูนย์กลางหลัง, NOL = ความยาว naso-ท้ายทอย, HL = ความยาว humeral):
- A PD = β0 , 1+ β1 , 1⋅ NO L
- HL = β0 , 2+ β1 , 2⋅ NO L
ในการทดสอบสมมติฐานคุณสามารถทำสิ่งต่อไปนี้:β1 , 1= β1 , 2
- สร้างตัวแปรตามใหม่ ( ) เพียงแค่ผนวก APD ถึง HLYn E W
- สร้างตัวแปรอิสระใหม่โดยการผนวก NOL เข้ากับตัวเอง ( ) (เช่นการทำซ้ำ NOL)Xn E W
- สร้างตัวแปรดัมมี ( ) ที่ 1 ถ้าข้อมูลมาจากชุดข้อมูลที่สอง (พร้อม HL) และ 0 ถ้าข้อมูลมาจากชุดข้อมูลชุดแรก (APD)D
- คำนวณการถดถอยด้วยเป็นตัวแปรตามและผลกระทบหลักและการมีปฏิสัมพันธ์ระหว่างและตัวแปรจำลองเป็นตัวแปรอธิบาย แก้ไข @ Jake Westfall ชี้ให้เห็นว่าข้อผิดพลาดมาตรฐานที่เหลืออาจแตกต่างกันสำหรับการถดถอยสองครั้งสำหรับ DV แต่ละตัว เจคให้คำตอบซึ่งเหมาะกับโมเดลกำลังสองน้อยที่สุด (GLS)ที่อนุญาตให้ข้อผิดพลาดมาตรฐานตกค้างแตกต่างกันระหว่างการถดถอยสองแบบYn E WXn E WD
ลองดูตัวอย่างที่มีข้อมูลที่ทำขึ้น (ในR
):
# Create artificial data
library(nlme) # needed for the generalized least squares
set.seed(1500)
NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2 - 5*NOL+ rnorm(10000,0,3)
mod1 <- lm(APD~NOL)
mod1
Coefficients:
(Intercept) NOL
10.11 15.00
mod2 <- lm(HL~NOL)
mod2
Coefficients:
(Intercept) NOL
-1.96 -5.00
# Combine the dependent variables and duplicate the independent variable
y.new <- c(APD, HL)
x.new <- c(NOL, NOL)
# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)
dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))
# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)
gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))
Variance function:
Structure: Different standard deviations per stratum
Formula: ~1 | dummy.var
Parameter estimates:
0 1
1.000000 1.481274
Coefficients:
Value Std.Error t-value p-value
(Intercept) 10.10886 0.17049120 59.293 0
x.new 14.99877 0.00169164 8866.430 0
dummy.var -12.06858 0.30470618 -39.607 0
x.new:dummy.var -19.99917 0.00302333 -6614.939 0
หมายเหตุ: การสกัดกั้นและความชันของนั้นเหมือนกับในการถดถอยครั้งแรก (mod1) สัมประสิทธิ์ของหมายถึงความแตกต่างระหว่างการสกัดกั้นของการถดถอยทั้งสอง เพิ่มเติม: ค่าเบี่ยงเบนมาตรฐานที่เหลือของการถดถอยครั้งที่สองนั้นใหญ่กว่า SD แรก (ประมาณ 1.5 เท่า) นี่คือว่าสิ่งที่เราได้ระบุไว้ในยุคของข้อมูล (2 กับ 3) เราใกล้จะถึงแล้ว: สัมประสิทธิ์ของคำศัพท์การโต้ตอบ ( ) ทดสอบความเท่าเทียมของเนินเขา นี่คือความลาดชันของการถดถอยสอง (mod2) เป็นเรื่องเกี่ยวกับหรือประมาณ15-20ความแตกต่างของXn E Wdummy.var
x.new:dummy.var
βx . n E W- βx . n e w × dยูมม. Y. v a r15 - 20 = - 520เป็นสิ่งที่เราได้ระบุไว้เมื่อเราสร้างข้อมูล หากคุณทำงานใน Stata มีคำอธิบายที่ดีที่นี่
คำเตือน:ใช้งานได้เฉพาะกับขนาดเส้นผ่าศูนย์กลางหลังส่วนท้ายและความยาว naso-ท้ายทอยเท่านั้น (ตัวแปรตามสองตัว) มีความเป็นอิสระ ไม่อย่างนั้นมันจะซับซ้อนมาก
แก้ไข
สองคนนี้โพสต์ในการจัดการเว็บไซต์ที่มีคำถามเดียวกัน: ครั้งแรกและครั้งที่สอง