จะเปรียบเทียบการถดถอยสองจุดสำหรับตัวทำนายหนึ่งตัวกับผลลัพธ์ที่แตกต่างกันสองแบบได้อย่างไร


10

ฉันต้องเปรียบเทียบความถดถอยสองจุดที่:

$
y_1 ~ a + b_1x
y_2 ~ a + b_2x
$

ฉันจะเปรียบเทียบ b1 และ b2 ได้อย่างไร

หรือในภาษาของตัวอย่างเฉพาะของฉันในหนูฉันต้องการเปรียบเทียบ

antero-posterior diameter ~  a + b1 * humeral length   
de naso-occipital length  ~  a + b2 * humeral length 

2
คำนวณแบบจำลองการถดถอยด้วยตัวแปรทั้งสองบวกการทำงานร่วมกันของตัวแปรทั้งสอง (ความยาว humeralเส้นผ่านศูนย์กลางภายนอก - หลัง) ปฏิสัมพันธ์ทดสอบสมมติฐานของความขนานของความลาดชันของตัวแปรทั้งสอง หากคำที่ใช้ในการโต้ตอบนั้นมีความสำคัญความลาดชันจะแตกต่างกัน ×
COOLSerdash

ขอบคุณ !! แต่ความยาวของ humeral และ antero-posterior เส้นผ่านศูนย์กลางของ humerus คือ DVs และความยาว naso-ท้ายทอยคือ IV ฉันสามารถทำการวิเคราะห์ตามที่คุณแนะนำได้หรือไม่?
ดรา

1
@ Dra.AlejandraEcheverria คุณหมายถึงว่าคุณมีรูปแบบการถดถอยเชิงเส้นเดียวที่มีตัวแปรอิสระสองตัวและคุณต้องการทดสอบความเท่าเทียมกันของสัมประสิทธิ์สองตัวบนตัวแปรอิสระหรือคุณมีตัวแบบถดถอยเชิงเส้นสองแบบง่ายและคุณต้องการเปรียบเทียบ ค่าสัมประสิทธิ์ในทั้งสองรุ่น?
แกรมวอลช์

1
เรียน @Graeme Walsh ฉันมีสองโมเดลการถดถอยเชิงเส้นอย่างง่ายและฉันต้องการเปรียบเทียบค่าสัมประสิทธิ์ของทั้งสองแบบ
ดรา

คำตอบ:


11

เอาล่ะมาดูสถานการณ์ของคุณกันดีกว่า โดยทั่วไปคุณมีสองการถดถอย (APD = เส้นผ่านศูนย์กลางหลัง, NOL = ความยาว naso-ท้ายทอย, HL = ความยาว humeral):

  1. APD=β0,1+β1,1ยังไม่มีข้อความOL
  2. HL=β0,2+β1,2ยังไม่มีข้อความOL

ในการทดสอบสมมติฐานคุณสามารถทำสิ่งต่อไปนี้:β1,1=β1,2

  1. สร้างตัวแปรตามใหม่ ( ) เพียงแค่ผนวก APD ถึง HLYnอีW
  2. สร้างตัวแปรอิสระใหม่โดยการผนวก NOL เข้ากับตัวเอง ( ) (เช่นการทำซ้ำ NOL)XnอีW
  3. สร้างตัวแปรดัมมี ( ) ที่ 1 ถ้าข้อมูลมาจากชุดข้อมูลที่สอง (พร้อม HL) และ 0 ถ้าข้อมูลมาจากชุดข้อมูลชุดแรก (APD)D
  4. คำนวณการถดถอยด้วยเป็นตัวแปรตามและผลกระทบหลักและการมีปฏิสัมพันธ์ระหว่างและตัวแปรจำลองเป็นตัวแปรอธิบาย แก้ไข @ Jake Westfall ชี้ให้เห็นว่าข้อผิดพลาดมาตรฐานที่เหลืออาจแตกต่างกันสำหรับการถดถอยสองครั้งสำหรับ DV แต่ละตัว เจคให้คำตอบซึ่งเหมาะกับโมเดลกำลังสองน้อยที่สุด (GLS)ที่อนุญาตให้ข้อผิดพลาดมาตรฐานตกค้างแตกต่างกันระหว่างการถดถอยสองแบบYnอีWXnอีWD

ลองดูตัวอย่างที่มีข้อมูลที่ทำขึ้น (ในR):

# Create artificial data

library(nlme) # needed for the generalized least squares

set.seed(1500)

NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2  - 5*NOL+ rnorm(10000,0,3) 

mod1 <- lm(APD~NOL)
mod1

Coefficients:
(Intercept)          NOL
      10.11        15.00

mod2 <- lm(HL~NOL)
mod2

Coefficients:
(Intercept)          NOL
      -1.96        -5.00

# Combine the dependent variables and duplicate the independent variable

y.new <- c(APD, HL)
x.new <- c(NOL, NOL)

# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)

dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))

# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)

gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))

Variance function:
 Structure: Different standard deviations per stratum
 Formula: ~1 | dummy.var 
 Parameter estimates:
       0        1 
1.000000 1.481274 

Coefficients:
                    Value  Std.Error   t-value p-value
(Intercept)      10.10886 0.17049120    59.293       0
x.new            14.99877 0.00169164  8866.430       0
dummy.var       -12.06858 0.30470618   -39.607       0
x.new:dummy.var -19.99917 0.00302333 -6614.939       0

หมายเหตุ: การสกัดกั้นและความชันของนั้นเหมือนกับในการถดถอยครั้งแรก (mod1) สัมประสิทธิ์ของหมายถึงความแตกต่างระหว่างการสกัดกั้นของการถดถอยทั้งสอง เพิ่มเติม: ค่าเบี่ยงเบนมาตรฐานที่เหลือของการถดถอยครั้งที่สองนั้นใหญ่กว่า SD แรก (ประมาณ 1.5 เท่า) นี่คือว่าสิ่งที่เราได้ระบุไว้ในยุคของข้อมูล (2 กับ 3) เราใกล้จะถึงแล้ว: สัมประสิทธิ์ของคำศัพท์การโต้ตอบ ( ) ทดสอบความเท่าเทียมของเนินเขา นี่คือความลาดชันของการถดถอยสอง (mod2) เป็นเรื่องเกี่ยวกับหรือประมาณ15-20ความแตกต่างของXnอีWdummy.varx.new:dummy.varβx.nอีW-βx.nอีW×dยูม.ม.Y.โวลต์aR15-20=-520เป็นสิ่งที่เราได้ระบุไว้เมื่อเราสร้างข้อมูล หากคุณทำงานใน Stata มีคำอธิบายที่ดีที่นี่

คำเตือน:ใช้งานได้เฉพาะกับขนาดเส้นผ่าศูนย์กลางหลังส่วนท้ายและความยาว naso-ท้ายทอยเท่านั้น (ตัวแปรตามสองตัว) มีความเป็นอิสระ ไม่อย่างนั้นมันจะซับซ้อนมาก

แก้ไข

สองคนนี้โพสต์ในการจัดการเว็บไซต์ที่มีคำถามเดียวกัน: ครั้งแรกและครั้งที่สอง


เพียงเพื่อหลีกเลี่ยงความสับสนดูเหมือนว่าคุณมี NOL และ HL ผสมกันอยู่ HL เป็นผู้ทำนาย NOL เป็น DV ตัวที่สอง (และ APD เป็น DV ตัวแรกตามที่คุณชี้ให้เห็น) แต่ผมเพิ่งสังเกตเห็นว่าโปสเตอร์ตัวเองเปลี่ยนสถานะของตัวแปรของเธอในความคิดเห็น ...
แพทริค Coulombe

@Patrick Coulombe ขอบคุณที่ชี้ให้เห็น เมื่อวานนี้ยังไม่เห็นชัดเจนนัก
COOLSerdash

@PatrickCoulombe ในความคิดที่สอง: ฉันคิดว่า Jeromy Anglim เข้าใจผิดความคิดเห็นของ Alejandra และแลกเปลี่ยนตัวแปร
COOLSerdash

1
วิธีนี้ดูเหมือนสมเหตุสมผล แต่ฉันกังวลเล็กน้อยเกี่ยวกับความจริงที่ว่าในโมเดลรวม / แบบโต้ตอบของคุณความแปรปรวนที่เหลือจะถือว่าเท่ากันทั้งสองระดับdummy.varนั่นคือสำหรับ DV ทั้งสอง ขึ้นอยู่กับสิ่งที่ DVs อยู่ในบริบทดั้งเดิมเป็นไปได้ว่าความแปรปรวนที่เหลือนั้นแตกต่างอย่างสิ้นเชิงในการถดถอยแยกของ DV แต่ละตัว ฉันสงสัยว่าจะเป็นการดีกว่าหรือไม่ที่จะใช้วิธีการพื้นฐานแบบเดียวกันกับที่คุณเสนอ แต่ด้วยglsแบบจำลองที่เราประเมินความแปรปรวนที่เหลือต่างกันสำหรับ DV แต่ละตัว มีความคิดเห็นเกี่ยวกับเรื่องนี้ไหม?
Jake Westfall

1
@COOLSerdash แน่นอนว่ามันจะออกมาเป็นแบบนี้:library(nlme); mod4 <- gls(y.new~x.new*dummy.var, weights=varIdent(form= ~1 | dummy.var))
Jake Westfall
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.