วิธีการเปรียบเทียบแบบใดที่จะใช้สำหรับโมเดล lmer: lsmeans หรือ glht


16

ฉันกำลังวิเคราะห์ชุดข้อมูลโดยใช้โมเดลเอฟเฟกต์ผสมกับเอฟเฟ็กต์คงที่หนึ่งรายการ (เงื่อนไข) และเอฟเฟกต์แบบสุ่มสองรายการ (ผู้เข้าร่วมเนื่องจากการออกแบบภายในและคู่ของเรื่อง) รูปแบบที่ถูกสร้างขึ้นด้วยแพคเกจ:lme4exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)

ต่อไปฉันทำการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลนี้เทียบกับโมเดลโดยไม่มีผลกระทบคงที่ (เงื่อนไข) และมีความแตกต่างอย่างมีนัยสำคัญ ชุดข้อมูลของฉันมี 3 เงื่อนไขดังนั้นฉันจึงต้องการเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าจะใช้วิธีใด ฉันพบคำถามที่คล้ายกันจำนวนหนึ่งใน CrossValidated และฟอรัมอื่น ๆ แต่ฉันยังสับสนอยู่

จากสิ่งที่ฉันเห็นผู้คนแนะนำให้ใช้

1.lsmeansแพคเกจ - lsmeans(exp.model,pairwise~condition)ซึ่งทำให้ผมส่งออกต่อไปนี้:

condition     lsmean         SE    df  lower.CL  upper.CL
 Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552

Confidence level used: 0.95 

$contrasts
 contrast                   estimate         SE    df t.ratio p.value
 Condition1 - Condition2 -0.04893538 0.03813262 62.07  -1.283  0.4099
 Condition1 - Condition3 -0.10424628 0.03813262 62.07  -2.734  0.0219
 Condition2 - Condition3 -0.05531090 0.03813262 62.07  -1.450  0.3217

P value adjustment: tukey method for comparing a family of 3 estimates 

2.multcompแพคเกจในสองวิธีที่แตกต่างกัน - ใช้mcp glht(exp.model,mcp(condition="Tukey"))ผลในการ

     Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error z value Pr(>|z|)  
Condition2 - Condition1 == 0  0.04894    0.03749   1.305    0.392  
Condition3 - Condition1 == 0  0.10425    0.03749   2.781    0.015 *
Condition3 - Condition2 == 0  0.05531    0.03749   1.475    0.303  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
(Adjusted p values reported -- single-step method)

และการใช้lsm glht(exp.model,lsm(pairwise~condition))ผลใน

Note: df set to 62

     Simultaneous Tests for General Linear Hypotheses

Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error t value Pr(>|t|)  
Condition1 - Condition2 == 0 -0.04894    0.03749  -1.305   0.3977  
Condition1 - Condition3 == 0 -0.10425    0.03749  -2.781   0.0195 *
Condition2 - Condition3 == 0 -0.05531    0.03749  -1.475   0.3098  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
(Adjusted p values reported -- single-step method)

อย่างที่คุณเห็นวิธีการให้ผลลัพธ์ที่แตกต่าง นี่เป็นครั้งแรกที่ฉันทำงานกับ R และสถิติดังนั้นอาจมีบางอย่างผิดปกติ แต่ฉันไม่รู้ว่าอยู่ที่ไหน คำถามของฉันคือ:

ความแตกต่างระหว่างวิธีที่นำเสนอมีอะไรบ้าง ฉันอ่านคำตอบของคำถามที่เกี่ยวข้องซึ่งเกี่ยวกับระดับความเป็นอิสระ ( lsmeansเทียบกับglht) มีกฎหรือคำแนะนำบ้างเมื่อจะใช้อันไหนเช่นวิธีที่ 1 ดีสำหรับชุดข้อมูล / รุ่นอื่น ๆ หรือไม่? ฉันควรรายงานผลลัพธ์ใด ฉันอาจจะไปและรายงานค่า p ที่สูงที่สุดที่ฉันได้รับเพื่อเล่นให้ปลอดภัย แต่มันก็ดีที่จะมีเหตุผลที่ดีกว่า ขอบคุณ

คำตอบ:


17

ไม่ใช่คำตอบที่สมบูรณ์ ...

ความแตกต่างระหว่างglht(myfit, mcp(myfactor="Tukey"))และอีกสองวิธีคือวิธีนี้ใช้สถิติ "z" (การแจกแจงแบบปกติ) ในขณะที่วิธีอื่นใช้สถิติ "t" (การกระจายนักศึกษา) สถิติ "z" จะเหมือนกับสถิติ "t" ที่มีระดับความอิสระไม่ จำกัด วิธีนี้เป็นวิธีการเชิงเส้นประสาทและให้ค่า p ที่น้อยลงและช่วงความเชื่อมั่นที่สั้นกว่าวิธีอื่น ค่า p อาจเล็กเกินไปและช่วงความเชื่อมั่นอาจสั้นเกินไปหากชุดข้อมูลมีขนาดเล็ก

เมื่อฉันเรียกใช้lsmeans(myfit, pairwise~myfactor)ข้อความต่อไปนี้ปรากฏขึ้น:

Loading required namespace: pbkrtest

นั่นหมายความว่าlsmeans(สำหรับlmerแบบจำลอง) ใช้pbkrtestแพ็คเกจที่ใช้วิธีการของ Kenward & Rogers สำหรับองศาอิสระของสถิติ "t" วิธีนี้มุ่งที่จะให้ค่า p และช่วงความเชื่อมั่นที่ดีกว่าแบบ asymptotic (ไม่มีความแตกต่างเมื่อระดับของอิสรภาพมีขนาดใหญ่)

ตอนนี้เกี่ยวกับความแตกต่างระหว่างlsmeans(myfit, pairwise~myfactor)$contrastsและglht(myfit, lsm(pairwise~factor)ฉันเพิ่งทำแบบทดสอบและข้อสังเกตของฉันคือสิ่งต่อไปนี้:

  • lsmเป็นอินเทอร์เฟซระหว่างlsmeansแพคเกจและmultcompแพคเกจ (ดู?lsm)

  • สำหรับการออกแบบที่สมดุลไม่มีความแตกต่างระหว่างผลลัพธ์

  • สำหรับการออกแบบที่ไม่สมดุลฉันสังเกตเห็นความแตกต่างเล็กน้อยระหว่างผลลัพธ์ (ข้อผิดพลาดมาตรฐานและอัตราส่วน t)

น่าเสียดายที่ฉันไม่รู้ว่าอะไรคือสาเหตุของความแตกต่างเหล่านี้ ดูเหมือนว่าการlsmเรียกlsmeansเท่านั้นที่จะได้เมทริกซ์สมมุติฐานเชิงเส้นและองศาอิสระ แต่lsmeansใช้วิธีอื่นในการคำนวณข้อผิดพลาดมาตรฐาน


ขอบคุณสำหรับการตอบรับอย่างละเอียด! ฉันพลาดความแตกต่างในสถิติการทดสอบอย่างสมบูรณ์ ... คุณพูดถึงว่าค่าอาจน้อยเกินไปและ CIs แคบเกินไปสำหรับวิธีซีมโทติค ชุดข้อมูลของฉันประกอบด้วยผู้เข้าร่วมประมาณ 30 คนดังนั้นฉันเดาว่าฉันจะยึดติดกับสถิติ เมื่อคุณพูดว่าวิธีการ Kenward & Rogers นำไปสู่ค่า p ที่ดีขึ้นคุณหมายถึงถูกต้องหรือเล็กลงหรือไม่ ดังนั้นความแตกต่างเกิดจากความแตกต่างในวิธีการคำนวณ df และ SE และไม่มีเนื่องจากการใช้งานอย่างไม่ถูกต้องของหนึ่งในแบบจำลองของฉันถ้าฉันเข้าใจคุณอย่างถูกต้อง มีวิธีเลือกวิธี "ดีที่สุด" ที่นี่หรือไม่
schvaba986

11
(ฉันเป็นผู้พัฒนาแพ็คเกจlsmeans ) lsmeansใช้แพ็คเกจ pbkrtest ซึ่งให้ (1) การคำนวณ Kenward-Rogers df และ (2) เมทริกซ์ความแปรปรวนร่วมที่ปรับแล้วพร้อมกับความเอนเอียงที่ลดลงในการประมาณการ หากคุณตั้งค่าครั้งแรกlsm.options(disable.pbkrtest=TRUE)การlsmeansโทรด้วยadjust="mvt"จะให้ผลลัพธ์เหมือนglhtกันยกเว้นความแตกต่างเล็กน้อยเนื่องจากอัลกอริทึมแบบสุ่มที่ใช้โดยแพคเกจทั้งสองสำหรับการแจกแจงหลายตัวแปร
Russ Lenth

3
อย่างไรก็ตามฉันขอแนะนำการปรับ "mvt" โดยไม่ต้องปิดการใช้งาน pbkrtest เนื่องจากการปรับค่าไบอัสและความจริงที่ไม่มี df ค่า asymptotic (z) จะถือว่า df ไม่มีที่สิ้นสุดดังนั้นจึงให้ค่า P ที่ไม่สมจริง
Russ Lenth

3
โดยวิธีการsummaryวิธีการglhtช่วยให้วิธีการทดสอบขั้นตอนลงต่าง ๆ นอกเหนือจากการปรับหลายหลากแบบขั้นตอนเดียว (พร้อมกัน CI) เริ่มต้น ในจุดที่แตกต่างอย่างสิ้นเชิงหากคุณมีมากกว่าหนึ่งปัจจัยlsmสามารถสร้างการเปรียบเทียบแบบปกติได้ง่าย ๆ ในขณะที่mcpไม่สามารถทำได้เลย
Russ Lenth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.