คำถามเกี่ยวกับการระบุตัวแบบผสมเชิงเส้นใน R สำหรับการวัดซ้ำข้อมูลด้วยโครงสร้างการซ้อนเพิ่มเติม


10

โครงสร้างข้อมูล

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

แบบเต็มผู้สมัคร

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • เวลาปฏิกิริยาจากการทดลองถูกทำคลัสเตอร์ภายในเซสชันซึ่งจะจัดกลุ่มภายในผู้ป่วย
  • การทดลองแต่ละครั้งจะมีลักษณะโดยโควาเรียตสองตัวของ ASCORE และ HSCORE (ระหว่าง 1-9) และโดยการตอบสนองการเคลื่อนไหว (ถอนหรือเข้าใกล้)
  • เซสชั่นมีลักษณะโดยการบริโภคยา (ยาหลอกหรือร้านขายยาที่ใช้งาน) และโดยความบริบูรณ์ (อดอาหารหรือก่อนป้อน)

การสร้างแบบจำลองและไวยากรณ์ R?

ฉันกำลังพยายามระบุแบบเต็มรูปแบบที่เหมาะสมพร้อมโครงสร้างค่าเฉลี่ยที่สามารถใช้เป็นจุดเริ่มต้นในกลยุทธ์การเลือกแบบจำลองจากบนลงล่าง

ปัญหาเฉพาะ:

  • ไวยากรณ์ถูกต้องระบุผลกระทบของการจัดกลุ่มและการสุ่ม?
  • นอกเหนือจากไวยากรณ์แล้วรุ่นนี้เหมาะสำหรับการออกแบบภายในเรื่องหรือไม่
  • แบบจำลองเต็มรูปแบบควรระบุปฏิสัมพันธ์ทั้งหมดของเอฟเฟกต์คงที่หรือเฉพาะที่ฉันสนใจจริงๆเท่านั้น
  • ฉันไม่ได้รวมปัจจัย STIM ไว้ในแบบจำลองซึ่งระบุประเภทของการกระตุ้นเฉพาะที่ใช้ในการทดลอง แต่ฉันไม่สนใจที่จะประมาณค่าในทางใดทางหนึ่ง - ฉันควรระบุว่าเป็นปัจจัยแบบสุ่มเนื่องจากมี 123 ระดับและน้อยมาก จุดข้อมูลต่อประเภทการกระตุ้น?

ถ้าฉันไม่สามารถหาคำแนะนำได้ที่นี่ฉันไม่รู้จริงๆว่าฉันจะถามใครได้บ้าง บางทีคุณอาจรู้จักฟอรัมโมเดลผสมเฉพาะหรือผู้เชี่ยวชาญยินดีให้คำปรึกษาสำหรับเงินเล็กน้อย
Cel

3
สวัสดี @Cel ดูเหมือนว่าคุณได้รับการโต้ตอบทั้งหมดในโมเดลรวมถึงการโต้ตอบ 5-way, 4-way และ 3-way ฉันไม่แน่ใจเกี่ยวกับกรณีนี้ แต่โดยทั่วไปจะมีข้อมูลมากเกินไปซึ่งจะทำให้ผลลัพธ์ของคุณลดน้อยลง การเลือกย้อนกลับ (ถ้าคุณต้องใช้) ไม่จำเป็นต้องเริ่มต้นด้วยรุ่นที่อิ่มตัวสมบูรณ์ - มันควรเริ่มต้นด้วยรุ่นที่ใหญ่ที่สุดที่คุณพบว่าน่าเชื่อถือ คุณลดได้ไหม?
มาโคร

@ แมโครที่ดีที่จะรู้ฉันจะรวมเฉพาะการโต้ตอบที่น่าเชื่อถือแล้ว คุณมีข้อเสนอแนะเกี่ยวกับปัญหาอื่น ๆ หรือไม่? ถ้าคุณทำอาจจะใช้เป็นคำตอบก็ได้
Cel

คำตอบ:


16

ฉันจะตอบทุกข้อสงสัยของคุณ

ไวยากรณ์ถูกต้องระบุผลกระทบของการจัดกลุ่มและการสุ่ม?

แบบจำลองที่คุณพอดีที่นี่คือในแง่คณิตศาสตร์แบบจำลอง

Yijk=Xijkβ+ηi+θij+εijk

ที่ไหน

  • Yijkเป็นเวลาปฏิกิริยาสำหรับการสังเกตในช่วงเซสชั่นในแต่ละฉันkji

  • Xijkเป็นเวกเตอร์ตัวทำนายสำหรับการสังเกตระหว่างเซสชันบนแต่ละ (ในแบบจำลองที่คุณเขียนขึ้นซึ่งประกอบด้วยผลกระทบหลักทั้งหมดและการโต้ตอบทั้งหมด)kji

  • ηiเป็นบุคคลที่สุ่มเอฟเฟ็กต์ที่ก่อให้เกิดความสัมพันธ์ระหว่างการสังเกตในคนคนเดียวกัน เป็นเอฟเฟกต์แบบสุ่มสำหรับแต่ละเซสชันของและเป็นคำที่ผิดพลาดที่เหลือiθijijεijk

  • βเป็นเวกเตอร์สัมประสิทธิ์การถดถอย

ดังที่บันทึกไว้ในหน้า 14-15 ที่นี่รุ่นนี้ถูกต้องสำหรับการระบุว่าเซสชันซ้อนกันภายในบุคคลซึ่งเป็นกรณีจากคำอธิบายของคุณ

นอกเหนือจากไวยากรณ์แล้วรุ่นนี้เหมาะสำหรับการออกแบบภายในเรื่องหรือไม่

ฉันคิดว่าโมเดลนี้มีเหตุผลเพราะมันเคารพโครงสร้างการซ้อนในข้อมูลและฉันคิดว่าแต่ละคนและเซสชันมีการคาดการณ์อย่างสมเหตุสมผลว่าเป็นเอฟเฟกต์แบบสุ่มเนื่องจากโมเดลนี้ยืนยัน คุณควรดูความสัมพันธ์ระหว่างตัวทำนายและการตอบกลับด้วย scatterplots ฯลฯ เพื่อให้แน่ใจว่ามีการระบุตัวทำนายเชิงเส้น ( ) อย่างถูกต้อง ควรตรวจสอบการวิเคราะห์การถดถอยมาตรฐานอื่น ๆ ด้วยเช่นกันXijkβ

แบบจำลองเต็มรูปแบบควรระบุปฏิสัมพันธ์ทั้งหมดของเอฟเฟกต์คงที่หรือเฉพาะที่ฉันสนใจจริงๆเท่านั้น

ฉันคิดว่าการเริ่มต้นด้วยตัวแบบที่มีความอิ่มตัวมากอาจไม่ใช่ความคิดที่ดีเว้นแต่ว่ามันจะสมเหตุสมผล ดังที่ฉันได้กล่าวไว้ในความคิดเห็นสิ่งนี้มีแนวโน้มที่จะทำให้ชุดข้อมูลของคุณเหมาะสมและอาจทำให้ผลลัพธ์ของคุณลดน้อยลง เกี่ยวกับการเลือกแบบจำลองถ้าคุณเริ่มต้นด้วยตัวแบบที่มีความอิ่มตัวสมบูรณ์และทำการเลือกแบบย้อนกลับ ( ซึ่งบางคนบนไซต์นี้มีเหตุผลที่ดีคัดค้าน ) คุณต้องแน่ใจว่าเคารพลำดับชั้นในแบบจำลอง นั่นคือถ้าคุณกำจัดการโต้ตอบระดับต่ำกว่าจากแบบจำลองคุณควรลบการโต้ตอบระดับที่สูงขึ้นทั้งหมดที่เกี่ยวข้องกับตัวแปรนั้น สำหรับการสนทนาเพิ่มเติมเกี่ยวกับเรื่องนั้นให้ดูที่หัวข้อที่เชื่อมโยง

ฉันไม่ได้รวมปัจจัย STIM ไว้ในแบบจำลองซึ่งระบุประเภทของการกระตุ้นเฉพาะที่ใช้ในการทดลอง แต่ฉันไม่สนใจที่จะประมาณค่าในทางใดทางหนึ่ง - ฉันควรระบุว่าเป็นปัจจัยแบบสุ่มเนื่องจากมี 123 ระดับและน้อยมาก จุดข้อมูลต่อประเภทการกระตุ้น?

ยอมรับว่าไม่รู้อะไรเลยเกี่ยวกับแอปพลิเคชัน (ดังนั้นให้ใช้เม็ดเกลือ) ซึ่งฟังดูเหมือนเอฟเฟกต์คงที่ไม่ใช่เอฟเฟกต์แบบสุ่ม นั่นคือประเภทของการรักษาดูเหมือนตัวแปรที่จะสอดคล้องกับการเปลี่ยนแปลงแบบคงที่ในการตอบสนองค่าเฉลี่ยไม่ใช่สิ่งที่จะก่อให้เกิดความสัมพันธ์ระหว่างอาสาสมัครที่มีประเภทของการกระตุ้นเดียวกัน แต่ความจริงที่ว่ามันเป็นปัจจัยระดับ 123 ทำให้ยุ่งยากในการเข้าสู่แบบจำลอง ฉันคิดว่าฉันอยากรู้ว่าเอฟเฟกต์ที่คุณคาดหวังนั้นมีขนาดใหญ่แค่ไหน ไม่คำนึงถึงขนาดของเอฟเฟกต์มันจะไม่ทำให้เกิดความลำเอียงในการประเมินความชันของคุณเนื่องจากนี่เป็นโมเดลเชิงเส้น แต่การปล่อยออกมาอาจทำให้ข้อผิดพลาดมาตรฐานของคุณมีขนาดใหญ่กว่าที่อื่น


2
ว้าว. ขอบคุณมาโครฉันหวังว่าฉันจะให้คะแนนมากขึ้น
Cel

เนื่องจากเอฟเฟกต์แบบสุ่มถูกข้ามมากกว่าแบบสุ่มสัญกรณ์ควรเป็นและ (มากกว่า ) เนื่องจากมีคนไข้ข้าม (และไม่ซ้อนกัน) กับผู้ป่วยหรือไม่ ηiθjθj
Joshua Rosenberg
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.