การทดสอบผลกระทบที่เกิดขึ้นพร้อมกันและล้าหลังในโมเดลผสมตามยาวที่มีตัวแปรแปรผันตามเวลา


12

เมื่อไม่นานมานี้มีคนบอกฉันว่ามันเป็นไปไม่ได้ที่จะรวม covariates ที่แปรผันตามเวลาในรูปแบบผสมตามยาวโดยไม่ได้แนะนำการล่าช้าของ covariates เหล่านี้ คุณสามารถยืนยัน / ปฏิเสธสิ่งนี้ได้หรือไม่? คุณมีการอ้างอิงเกี่ยวกับสถานการณ์นี้หรือไม่?

ฉันเสนอสถานการณ์ง่าย ๆ เพื่อชี้แจง สมมติว่าฉันมีมาตรการซ้ำ ๆ (พูดมากกว่า 30 ครั้ง) ของตัวแปรเชิงปริมาณ (y, x1, x2, x3) ใน 40 วิชา ตัวแปรแต่ละตัวจะถูกวัด 30 ครั้งในแต่ละหัวข้อโดยแบบสอบถาม ที่นี่ข้อมูลสุดท้ายจะเป็น 4 800 การสังเกต (4 ตัวแปร X 30 ครั้ง X 40 วิชา) ซ้อนกันใน 40 วิชา

ฉันต้องการทดสอบแยกต่างหาก (ไม่ใช่สำหรับการเปรียบเทียบรุ่น) สำหรับ:

  • เอฟเฟกต์แบบซิงโครนัส (พร้อมกัน): อิทธิพลของ x1, x2 และ x3 ณ เวลา t บน y ณ เวลา t
  • lagged effects: อิทธิพลของ x1, x2 และ x3 ณ เวลา t-1 ต่อ y ในเวลา t

ฉันหวังว่าทุกอย่างชัดเจน (ฉันไม่ใช่เจ้าของภาษาอังกฤษ!)

ตัวอย่างเช่นใน R lmer {lme4} สูตรที่มีเอฟเฟกต์ lagged คือ:

lmer(y ~ lag1.x1 + lag1.x2 + lag1.x3 + (1|subject))

โดยที่yเป็นตัวแปรตามเวลา t lag1.x1เป็นตัวแปรอิสระ lagged x1 ในระดับบุคคล ฯลฯ

สำหรับเอฟเฟกต์พร้อมกันสูตรคือ:

lmer(y ~ x1 + x2 + x3 + (1|subject))

ทุกอย่างทำงานได้ดีและให้ผลลัพธ์ที่น่าสนใจ แต่มันถูกต้องหรือไม่ที่จะระบุโมเดล lmer ที่มีตัวแปรแปรผันตามเวลาแบบซิงโครนัสหรือฉันพลาดอะไรไป?

แก้ไข: ยิ่งไปกว่านั้นเป็นไปได้หรือไม่ที่จะทดสอบทั้งเอฟเฟกต์พร้อมกันและความล่าช้าในเวลาเดียวกัน? ตัวอย่างเช่น:

lmer(y ~ x1 + x2 + x3 + lag1.x1 + lag1.x2 + lag1.x3 + (1|subject))

ตามหลักการแล้วมันสมเหตุสมผลที่จะทดสอบการแข่งขันระหว่างผลกระทบที่เกิดขึ้นพร้อมกันกับความล่าช้า แต่มันเป็นไปได้ด้วยlmer{lme4}ใน R ตัวอย่างเช่น?

คำตอบ:


6

ฉันรู้ว่านี่อาจจะสายเกินไปสำหรับคุณ แต่สำหรับคนอื่นฉันจะให้คำตอบ

คุณสามารถรวมโควาเรียที่แปรผันตามเวลาในโมเดลสุ่มเอฟเฟกต์ตามยาว (ดูการวิเคราะห์ระยะยาวประยุกต์โดย Fitzmaurice, Laird and Ware, 2011 และhttp://www.ats.ucla.edu/stat/r/examples/alda/โดยเฉพาะสำหรับ ใช้ R lme) การตีความแนวโน้มขึ้นอยู่กับว่าคุณใช้รหัสเวลาเป็นหมวดหมู่หรือต่อเนื่องและเงื่อนไขการโต้ตอบของคุณ ตัวอย่างเช่นถ้าเวลาต่อเนื่องและ covariates x1 และ x2 ของคุณเป็นไบนารี (0 และ 1) และขึ้นอยู่กับเวลาโมเดลถาวรคือ:

yij=β0+β1x1ij+β2x2ij+β3timeij+β4×(x1ijtimeij)+β5×(x2ijtimeij)

ฉันมีไว้สำหรับคนที่ j สำหรับโอกาส jth

β4และจับความแตกต่างในแนวโน้มระหว่างระดับของและขณะที่บัญชีสำหรับการเปลี่ยนแปลงตลอดเวลาในและx_2หากคุณไม่ได้ระบุและเป็นเอฟเฟกต์แบบสุ่มความสัมพันธ์ระหว่างการวัดซ้ำจะไม่ถูกนำมาพิจารณา (แต่สิ่งนี้ต้องขึ้นอยู่กับทฤษฎีและอาจยุ่งเหยิงหากคุณมีเอฟเฟกต์แบบสุ่มมากเกินไป - นั่นคือแบบจำลองจะไม่มาบรรจบกัน) . นอกจากนี้ยังมีการพูดคุยกันเกี่ยวกับการจัดศูนย์แปรผันตามเวลาเพื่อกำจัดอคติแม้ว่าฉันจะไม่ได้ทำสิ่งนี้ (Raudenbush & Bryk, 2002) โดยทั่วไปการตีความก็ยากกว่าเช่นกันถ้าคุณมีโควาเรียต์ที่ขึ้นกับเวลาβ5x1x2x1x2x1x2

β1และจับภาพความสัมพันธ์แบบตัดขวางระหว่างและและและที่จุดตัด ( ) การสกัดกั้นคือเวลาที่เป็นศูนย์ (พื้นฐานหรือที่ใดก็ตามที่คุณอยู่กึ่งกลางตัวแปรเวลาของคุณ) การตีความนี้อาจเปลี่ยนแปลงได้หากคุณมีรูปแบบการสั่งซื้อที่สูงขึ้น (เช่นกำลังสอง) β2x1yx2yβ0

คุณจะรหัสนี้ใน R เป็นสิ่งที่ชอบ:

model<- lme(y ~ time*x1 + time*x2, data, random= ~time|subject, method="")

นักร้องและวิลเล็ตดูเหมือนจะใช้ ML สำหรับ“ วิธีการ” แต่ฉันได้รับการสอนให้ใช้ REML ใน SAS สำหรับผลลัพธ์โดยรวมเสมอ แต่เปรียบเทียบความพอดีของรุ่นต่าง ๆ ที่ใช้ ML ฉันคิดว่าคุณสามารถใช้ REML ใน R ได้เช่นกัน

นอกจากนี้คุณยังสามารถสร้างแบบจำลองโครงสร้างความสัมพันธ์สำหรับ y โดยการเพิ่มรหัสก่อนหน้า:

correlation = [you’ll have to look up the options] 

ฉันไม่แน่ใจว่าฉันเข้าใจเหตุผลของคุณเพียงเพื่อทดสอบผลกระทบที่ล้าหลังเท่านั้น ฉันไม่คุ้นเคยกับการจำลองเอฟเฟกต์ที่ล้าหลังดังนั้นฉันจึงไม่สามารถพูดกับมันได้ที่นี่ บางทีฉันผิด แต่ฉันคิดว่าการสร้างแบบจำลองเอฟเฟกต์ที่ล้าหลังจะบั่นทอนประโยชน์ของโมเดลผสม (เช่นความสามารถในการรวมวิชาที่มีข้อมูลตามเวลาหายไป)


โปรดตรวจสอบอีกครั้งว่าฉันไม่ได้สมการของคุณด้วยการแก้ไขฉันพยายามทำให้ดีที่สุด
jonsca

ดูดีสำหรับฉัน :)
MegPophealth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.