การตีความความแปรปรวนของเอฟเฟกต์แบบสุ่มในเครื่องแปล


13

ฉันกำลังทบทวนบทความเกี่ยวกับการผสมเกสรซึ่งมีการแจกแจงข้อมูลแบบทวินาม (ผลไม้สุกหรือไม่มี) ดังนั้นฉันจึงใช้เอglmerฟเฟกต์แบบสุ่มหนึ่งอัน (พืชเดี่ยว) และผลคงที่หนึ่งอัน (การรักษา) ผู้ตรวจทานต้องการทราบว่าพืชมีผลต่อชุดผลไม้หรือไม่ แต่ฉันมีปัญหาในการตีความglmerผลลัพธ์

ฉันได้อ่านจากเว็บไซต์และดูเหมือนว่าอาจมีปัญหากับการเปรียบเทียบglmและglmerรุ่นโดยตรงดังนั้นฉันจึงไม่ทำเช่นนั้น ฉันคิดว่าวิธีที่ตรงไปตรงมาที่สุดในการตอบคำถามคือเพื่อเปรียบเทียบความแปรปรวนของเอฟเฟกต์แบบสุ่ม (1.449 ด้านล่าง) กับความแปรปรวนทั้งหมดหรือความแปรปรวนที่อธิบายโดยการรักษา แต่ฉันจะคำนวณผลต่างอื่น ๆ เหล่านี้ได้อย่างไร ดูเหมือนว่าจะไม่รวมอยู่ในผลลัพธ์ด้านล่าง ฉันอ่านบางอย่างเกี่ยวกับความแปรปรวนตกค้างที่ไม่รวมอยู่ในทวินามglmer- ฉันจะตีความความสำคัญสัมพัทธ์ของเอฟเฟกต์แบบสุ่มได้อย่างไร

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

คำตอบ:


12

ในขณะที่รับอะนาล็อกของ "ความแปรปรวนสัดส่วนที่อธิบายโดยแต่ละเอฟเฟ็กต์" เป็นหลักการที่เป็นไปได้สำหรับ GLMMs มีปัจจัยที่ซับซ้อนหลายอย่าง (ระดับใดของแบบจำลองที่คุณพิจารณา "ความแปรปรวนรวม") และคุณคำนวณปริมาณ ระดับต่ำสุด [Binomial ในกรณีนี้] การกระจายตัวตัวอย่าง)? Nakagawa และ Schielzeth (ดอย: 10.1111 / j.2041-210x.2012.00261.x) นำเสนอวิธีการทั่วไปในการคำนวณ R ^ 2 (สัดส่วนของความแปรปรวนทั้งหมดอธิบาย) สำหรับ (G) LMM ที่ได้รับความนิยมในระบบนิเวศ Xu et al 2003ใช้วิธีการที่คล้ายกัน ในหลักการวิธีการนี้อาจขยายออกไปเพื่อพิจารณาสัดส่วนของความแปรปรวนที่อธิบายด้วยคำศัพท์ต่าง ๆ [แต่โปรดทราบว่า 'สัดส่วนของความแปรปรวน' ของคำศัพท์ทั้งหมดในแบบจำลองที่พิจารณาด้วยวิธีนี้อาจจะไม่เพิ่มขึ้น 100% - จะมากหรือน้อย]

อย่างไรก็ตามหากผู้ตรวจทานของคุณไม่ได้ถูกแขวนไว้กับรายละเอียดทางสถิติและจะพอใจกับคำอธิบายฮิวริสติกเพิ่มเติมของ "ความสำคัญ" คุณสามารถชี้ให้เห็นว่าค่าเบี่ยงเบนมาตรฐานระหว่างโรงงานประมาณ 1.20 ใกล้เคียงกับขนาดที่ใหญ่ที่สุด ผลการรักษา (-1.18); ซึ่งหมายความว่าพืชแตกต่างกันเล็กน้อยเมื่อเทียบกับขนาดของผลการรักษา (เช่นช่วง 95% ของผลกระทบของพืชอยู่ที่ประมาณจากถึง )- 1.96 σ + 1.96 σ4σ1.96σ+1.96σ

สายตา:

ป้อนคำอธิบายรูปภาพที่นี่


+1 ฉันรู้สึกทึ่งกับคุณ (ฉันอนุมานได้ดี) ถึงสำหรับโมเดลที่ไม่ใช่เชิงเส้น การอภิปรายของคุณมีอะไรบ้าง: การวัดหลอกแบบ R2 เป็นวิธีการรายงานการถดถอยโลจิสติก (Cox & Snell หรือ Nagelkerke) R2
gung - Reinstate Monica

1
ฉันแค่บอกว่าฉันไม่คิดว่ามันเป็นคำถามที่บ้าหรือไร้เหตุผล แต่ทั้งโครงสร้างแบบลำดับชั้นและตัวแบบคล้าย GLM จะเปิดกระป๋องของเวิร์มซึ่งทำให้ยากต่อการเลือกคำตอบ ฉันมักจะไม่รำคาญ แต่ฉันเห็นได้ว่าทำไมผู้คนถึงต้องการลองหาตัวเลขที่วัดความดีที่เหมาะสมหรือความสำคัญของคำในแบบจำลองในแบบที่สมเหตุสมผล
Ben Bolker

นั่นเป็นเหตุผล Btw คุณคิดอย่างไรกับคำแนะนำของฉันที่มีพืช 10 ต้นการรักษา 3 รายการ & N = 30 ผู้ปฏิบัติงานสามารถพอดีกับโมเดลที่ใช้ทั้งสองแบบเป็นเอฟเฟกต์ถาวร ฉันไม่จำเป็นต้องคิดว่านี่จะเป็นรูปแบบสุดท้ายที่ถูกต้องแน่นอน แต่มันทำให้ฉันเป็นวิธีที่ได้รับอนุญาตในการทดสอบว่ามีการเปลี่ยนแปลงระหว่างพืชหรือไม่และวางตัวแปรทั้งสองไว้บนฐานเดียวกันเพื่อเปรียบเทียบ
gung - Reinstate Monica

ดูเหมือนว่าสมเหตุสมผลกับฉัน
Ben Bolker

ฉันพอดีกับแบบจำลองที่มีทั้งการรักษาและโรงงานเป็นเอฟเฟกต์คงที่ตามที่แนะนำโดย gung และคำศัพท์พืชมีค่า p สูงมาก (p = 0.3) สิ่งนี้ดูแปลกหรือเปล่าที่คุณบอกว่า "ค่าเบี่ยงเบนมาตรฐานระหว่างโรงงานคือ 1.20 ใกล้เคียงกับขนาดของผลการรักษาที่ใหญ่ที่สุด (-1.18)" ทำไมมันจะปรากฏขึ้นเล็กน้อยใน ANOVA ที่มีผลกระทบคงที่ 2
jwb4

3

สิ่งที่คุณต้องการคือการทดสอบว่าความแปรปรวนของการPlantIDเป็น0อย่างไรก็ตามนี่คือการทดสอบแปลก ๆ ที่พยายามเรียกใช้เนื่องจากค่า Null อยู่ที่ขอบเขตของพื้นที่ที่อนุญาต การทดสอบดังกล่าวยังคงดำเนินการอยู่ แต่ผู้คนจำนวนมากไม่สบายใจ 0

ในกรณีของคุณคุณมีหลายมาตรการต่อต้นดังนั้นวิธีหนึ่งที่รวดเร็วและสกปรกคือการใช้แบบจำลองPlantIDที่มีเอฟเฟกต์คงที่และทดสอบเอฟเฟกต์นั้น


1

คำตอบง่ายๆสำหรับผู้ตรวจสอบของคุณคือ "ใช่" หากเขาขอให้คุณทดสอบว่าความแปรปรวนของเอฟเฟกต์สุ่มนั้นแตกต่างจาก 0 อย่างมากหรือไม่คุณมีสองทางเลือก โปรดทราบว่าคนฉลาดหลายคนไม่สบายใจกับการทดสอบว่าผลต่างของเอฟเฟกต์แบบสุ่มแตกต่างจาก 0 หรือไม่

ง่ายที่สุดคือการทดสอบอัตราส่วนความน่าจะเป็นถึงแม้จะไม่ได้รับการแนะนำโดยส่วนใหญ่ก็ตาม พวกเขาระมัดระวังมากเมื่อทำการทดสอบที่ขอบเขต (เช่นคุณกำลังทดสอบความแปรปรวนของ 0 ซึ่งต่ำที่สุดเท่าที่จะเป็นไปได้) มีกฎง่ายๆที่ค่า p ประมาณสองเท่าของสิ่งที่เป็นจริง

วิธีที่แนะนำให้ใช้มากที่สุดคือการบูตแบบพารามิเตอร์ คุณสามารถใช้bootMerจากlme4แพ็คเกจ ตรวจสอบให้แน่ใจว่าคุณตั้งค่าพารามิเตอร์ REML ของฟังก์ชัน lmer ของคุณเป็น FALSE ไม่เช่นนั้นความแปรปรวนของคุณจะมากกว่า 0 100% ของเวลา (หรือใกล้กับ ... จริง ๆ แล้วมันอาจจะมากกว่า 0 เกือบ 100% ของ เวลาต่อไป)

เคล็ดลับและแหล่งข้อมูลเพิ่มเติม:

http://glmm.wikidot.com/faq (ค้นหาส่วนฉันจะทดสอบได้อย่างไรว่าเอฟเฟกต์แบบสุ่มมีความสำคัญหรือไม่)

lmer () การทดสอบพารามิเตอร์บูตสำหรับผลคงที่

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


ขอบคุณสำหรับคำแนะนำที่ชัดเจน (และพรอมต์!) สำหรับการเปรียบเทียบแบบจำลอง แต่ฉันจะตีความ "ขนาด" ของผลของตัวแปรสุ่มได้อย่างไร เช่นฉันจะเปรียบเทียบความแปรปรวนที่อธิบายโดยตัวแปรสุ่มของฉันกับความแปรปรวนที่อธิบายโดยตัวแปรคงที่ได้อย่างไร (การรักษา) ฉันเดาว่าฉันไม่เห็นว่าสิ่งนี้ถูกรวบรวมจากผลการทดสอบ bootstrapped LRT อย่างไร
jwb4

0

ในการทดสอบ Q ของ Cochranพวกเขาใช้ anova เพื่อเปรียบเทียบผลลัพธ์ของแบบจำลองทั้งสอง (อันที่ไม่มีเอฟเฟกต์แบบสุ่ม

มหาวิทยาลัย Jairo Rocha แห่งหมู่เกาะแบลีแอริก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.