การวิเคราะห์โพสต์ - ฮอคที่ถูกต้องคืออะไรสำหรับการวัด ANOVA ซ้ำสามทาง?


10

ฉันได้ทำการทดสอบ ANOVA ซ้ำสามทาง การวิเคราะห์หลังการประชุมอะไรถูกต้อง?

นี่คือการออกแบบที่สมดุลอย่างสมบูรณ์ (2x2x2) โดยมีปัจจัยหนึ่งที่มีการวัดซ้ำภายในวัตถุ ฉันตระหนักถึงวิธีการหลายตัวแปรในการวัด ANOVA ซ้ำ ๆ ใน R แต่สัญชาตญาณแรกของฉันคือดำเนินการในลักษณะ aov () ที่เรียบง่ายของ ANOVA:

aov.repeated <- aov(DV ~ IV1 * IV2 * Time + Error(Subject/Time), data=data)

DV = ตัวแปรตอบกลับ

IV1 = ตัวแปรอิสระ 1 (2 ระดับ, A หรือ B)

IV2 = ตัวแปรอิสระ 2 (2 ระดับ, ใช่หรือไม่)

IV3 = เวลา (2 ระดับก่อนหรือหลัง)

Subject = หัวเรื่อง ID (40 วิชาทั้งหมด, 20 สำหรับแต่ละระดับของ IV1: nA = 20, nB = 20)

summary(aov.repeated)

    Error: Subject
          Df Sum Sq Mean Sq F value   Pr(>F)   
IV1       1   5969  5968.5  4.1302 0.049553 * 
IV2       1   3445  3445.3  2.3842 0.131318   
IV1:IV2   1  11400 11400.3  7.8890 0.007987 **
Residuals 36  52023  1445.1                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Error: Subject:Time
               Df Sum Sq Mean Sq F value   Pr(>F)   
Time            1    149   148.5  0.1489 0.701906   
IV1:Time        1    865   864.6  0.8666 0.358103   
IV2:Time        1  10013 10012.8 10.0357 0.003125 **
IV1:IV2:Time    1    852   851.5  0.8535 0.361728   
Residuals      36  35918   997.7                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

อีกทางหนึ่งฉันกำลังคิดที่จะใช้แพ็คเกจ nlme สำหรับ lme style ANOVA:

aov.repeated2 <- lme(DV ~ IV1 * IV2 * Time, random = ~1|Subject/Time, data=data)
summary(aov.repeated2)

Fixed effects: DV ~ IV1 * IV2 * Time 
                                Value Std.Error DF   t-value p-value
(Intercept)                      99.2  11.05173 36  8.975972  0.0000
IV1                              19.7  15.62950 36  1.260437  0.2156
IV2                              65.9  15.62950 36  4.216385  0.0002 ***
Time                             38.2  14.12603 36  2.704228  0.0104 *
IV1:IV2                         -60.8  22.10346 36 -2.750701  0.0092 **
IV1:Time                        -26.2  19.97722 36 -1.311494  0.1980
IV2:Time                        -57.8  19.97722 36 -2.893295  0.0064 **
IV1:IV2:Time                     26.1  28.25206 36  0.923826  0.3617

สัญชาตญาณครั้งแรกของฉันในการโต้ตอบแบบสองทางที่สำคัญกับ Tukey contrasts โดยใช้ glht () จากแพ็คเกจ multcomp:

data$IV1IV2int <- interaction(data$IV1, data$IV2)
data$IV2Timeint <- interaction(data$IV2, data$Time)

aov.IV1IV2int <- lme(DV ~ IV1IV2int, random = ~1|Subject/Time, data=data)
aov.IV2Timeint <- lme(DV ~ IV2Timeint, random = ~1|Subject/Time, data=data)

IV1IV2int.posthoc <- summary(glht(aov.IV1IV2int, linfct = mcp(IV1IV2int = "Tukey")))
IV2Timeint.posthoc <- summary(glht(aov.IV2Timeint, linfct = mcp(IV2Timeint = "Tukey")))

IV1IV2int.posthoc
#A.Yes - B.Yes == 0        0.94684   
#B.No - B.Yes == 0         0.01095 * 
#A.No - B.Yes == 0         0.98587    I don't care about this
#B.No - A.Yes == 0         0.05574 .  I don't care about this
#A.No - A.Yes == 0         0.80785   
#A.No - B.No == 0          0.00346 **

IV2Timeint.posthoc 
#No.After - Yes.After == 0           0.0142 *
#Yes.Before - Yes.After == 0         0.0558 .
#No.Before - Yes.After == 0          0.5358   I don't care about this
#Yes.Before - No.After == 0          0.8144   I don't care about this
#No.Before - No.After == 0           0.1941  
#No.Before - Yes.Before == 0         0.8616

ปัญหาหลักที่ฉันเห็นด้วยการวิเคราะห์ภายหลังแบบนี้เป็นการเปรียบเทียบที่ไม่เป็นประโยชน์สำหรับสมมติฐานของฉัน

ข้อเสนอแนะใด ๆ สำหรับการวิเคราะห์หลังการประชุมที่เหมาะสมจะขอบคุณมาก

แก้ไข: คำถามที่เกี่ยวข้องและคำตอบที่ชี้ไปยังการทดสอบเมทริกซ์ความคมชัดด้วยตนเอง


โมเดลสุ่มเอฟเฟกต์ของคุณดูแปลก: /ใช้เพื่อแสดงการซ้อน (ตามที่เห็นในการทดลองแบบแยกส่วน) ซึ่งแตกต่างจากการใช้ในErrorระยะaov()ที่ซึ่งส่วนใหญ่ระบุว่าจะสร้างชั้นข้อผิดพลาดได้อย่างไร
chl

@chl ฉันจัดรูปแบบErrorคำศัพท์aov()ด้วยวิธีนี้เพื่อระบุว่าTimeเป็นปัจจัยภายในกลุ่ม Error(subj/(color + shape))ดูเหมือนว่าจากบารอนจะถูกนำมาใช้ในลักษณะเดียวกัน
RobJackson28

@chl ขอขอบคุณที่นำขึ้นรุ่นผมไม่มีความชัดเจนในการใช้งานที่เหมาะสมของlme /วิธีที่คุณจะระบุTimeเป็นปัจจัยภายในกลุ่มในขณะที่Error()มีaov()?
RobJackson28

คำตอบ:


2

ฉันคิดว่านักสถิติจะบอกคุณว่ามีปัญหาเสมอกับการวิเคราะห์โพสต์เฉพาะกิจเพราะการดูข้อมูลอาจมีผลต่อสิ่งที่คุณมองและคุณอาจลำเอียงเพราะคุณกำลังตามล่าเพื่อผลลัพธ์ที่สำคัญ องค์การอาหารและยาในการศึกษาวิจัยทางคลินิกกำหนดให้มีการสะกดแผนสถิติอย่างสมบูรณ์ในโปรโตคอล ในโมเดลเชิงเส้นแน่นอนว่าคุณสามารถแสดงความแตกต่างล่วงหน้าได้อย่างที่คุณต้องการดูในกรณีที่ ANOVA หรือ ANCOVA พบความแตกต่างโดยรวม ความแตกต่างที่ได้รับการกำหนดล่วงหน้านั้นน่าจะใช้ได้ผลตราบใดที่การรักษาตามปกติสำหรับความซ้ำซ้อนก็เป็นส่วนหนึ่งของมันเช่นกัน


นี่เป็นปัญหาที่ฉันมีอยู่มากเนื่องจากการวิเคราะห์ได้ถูกส่งมอบให้ฉัน (โดยไม่มีการวางแผนเชิงสถิติมาก่อนนอกจาก "ลองใช้การทดสอบแบบกลุ่ม") ฉันพยายามที่จะบิดเบือนสมมติฐานพื้นฐานที่ตั้งใจเดิม แต่ฉันมีปัญหาเล็กน้อยกับไวยากรณ์โพสต์เฉพาะกิจ การระบุขั้นตอนเหล่านี้ทั้งหมดให้ผู้ทดสอบเป็นเป้าหมายหลักของฉันเพื่อหลีกเลี่ยงความเชื่อในการทดสอบ เป้าหมายสูงสุด: ทำให้การวางแผนเชิงสถิติเป็นสิ่งจำเป็นสำหรับการออกแบบการทดลองในอนาคต ในขณะนี้ฉันต้องทำงานกับสิ่งที่ฉันมี
RobJackson28

1
สิ่งที่ฉันจะเพิ่มก็คือถ้าคุณต้องการที่จะไปกับการวิเคราะห์หลังการโพสต์ฉันไม่เห็นปัญหาตราบใดที่คุณทำการปรับหลายหลากที่เหมาะสม
Michael R. Chernick

1
ฉันถูกต้องหรือไม่ถ้าสมมติว่าการปรับค่าหลายค่านั้นคล้ายคลึงกับการปรับข้อผิดพลาดที่เหมาะกับครอบครัว เช่น Tukey's, Bonferroni เป็นต้น?
RobJackson28

ถูกต้อง bootstrap และวิธีการเปลี่ยนรูปยังมีอยู่ใน SAS เช่นด้วย Proc MULTTEST ดูผลงานของ Westfall and Young
Michael R. Chernick

ขอบคุณสำหรับความช่วยเหลือ @Michael ฉันขอขอบคุณ Rแต่ฉันยังคงไม่มีความชัดเจนเกี่ยวกับไวยากรณ์ที่จะใช้ใน โดยเฉพาะฉันไม่แน่ใจว่าจะเหมาะสมที่สุดในการระบุเมทริกซ์ความคมชัดด้วยตนเองสำหรับความแตกต่างของ Tukey ที่ใช้glht()หรือทำการเปรียบเทียบทั้งหมดตามค่าเริ่มต้น นอกจากนี้ฉันไม่แน่ใจว่าจะจัดการกับการวัดซ้ำTimeในแง่ของการโพสต์เฉพาะกิจได้อย่างถูกต้อง
RobJackson28

1

หากคุณมีแพคเกจซอฟต์แวร์เช่น SAS คุณอาจใช้ proc มิกซ์เพื่อทำแบบจำลองการวัดซ้ำ ๆ กันและถ้าคุณระบุความคมชัดที่คุณต้องการใช้ SAS จะจัดการกับมันอย่างถูกต้องสำหรับคุณ คุณอาจจะสามารถทำได้ด้วยตัวเลือกซ้ำใน PROC GLM แต่ต้องระวังเพราะมันทำงานต่างกันและตั้งสมมติฐานต่างกัน การสังเกตซ้ำ ๆ มักจะเกิดขึ้นเนื่องจากมีบางสิ่งร่วมกัน ฉันมักจะมีมาตรการซ้ำ ๆ ในผู้ป่วยรายเดียวกันในเวลาที่ต่างกัน ดังนั้นในการคำนวณความแปรปรวนของเงื่อนไขความแปรปรวนร่วมจะเข้าสู่ปัญหา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.