ค่าสัมประสิทธิ์สหสัมพันธ์ในแบบจำลองผสมกับความลาดชันแบบสุ่ม


10

ฉันมีโมเดลต่อไปนี้ที่m_plotมีเอlme4::lmerฟเฟ็กต์แบบสุ่มข้ามสำหรับผู้เข้าร่วม ( lfdn) และรายการ ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

ฉันต้องการทราบว่า Intraclass Correlation Coefficients (ICC) สำหรับผู้เข้าร่วมและสิ่งของ ต้องขอบคุณคำตอบที่ดีนี้โดยหลักการแล้วฉันรู้วิธีรับ ICC สำหรับแบบจำลองของฉัน อย่างไรก็ตามฉันไม่แน่ใจว่าจะรวมเนินลาดแบบสุ่มหรือไม่:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

อะไรคือมาตรการที่เหมาะสมสำหรับความสัมพันธ์ระหว่างการตอบสนองสองอย่างจากผู้เข้าร่วมเดียวกันที่เกี่ยวข้องกับรายการเดียวกัน


1
Merlo et al 2005 "บทสรุปแนวคิดการสอนเกี่ยวกับการวิเคราะห์หลายระดับในระบาดวิทยาทางสังคม: การตรวจสอบปรากฏการณ์เชิงบริบทในกลุ่มคนต่าง ๆ " อาจเป็นข้อมูลอ้างอิงที่มีประโยชน์
N Brouwer

@ Henrik คุณเคยพบคำตอบสำหรับคำถามนี้หรือไม่? ฉันสนใจเช่นกัน
Patrick S. Forscher

2
@ PatrickS.Forscher เท่าที่ฉันเข้าใจ ICC ไม่สมเหตุสมผลกับความลาดชันแบบสุ่ม ฉันได้เรียนรู้สิ่งนี้จาก Jake Westfall
Henrik

มีลิงก์ไปยังการอ่านที่เกี่ยวข้องโดยบังเอิญหรือไม่?
Patrick S. Forscher

1
@ PatrickS.Forscher อย่างที่คุณเห็น Jake ตอนนี้ให้คำตอบที่ดี
Henrik

คำตอบ:


8

โดยทั่วไปไม่มีหมายเลขเดียวหรือค่าประมาณที่สามารถสรุประดับของการจัดกลุ่มในรูปแบบความลาดชันแบบสุ่ม

ความสัมพันธ์ภายในคลาส (ICC) สามารถเขียนเป็นสัดส่วนความแปรปรวนแบบง่าย ๆ ในโมเดลแบบตัดเฉพาะแบบสุ่มเท่านั้น เพื่อดูว่าทำไมเป็นร่างของแหล่งที่มาของการแสดงออกของศาลอาญาระหว่างประเทศที่สามารถพบได้ที่นี่

เมื่อคุณโยนความลาดชันแบบสุ่มลงในสมการโมเดลการทำตามขั้นตอนเดียวกันจะนำไปสู่นิพจน์ ICC ในหน้า 5 ของเอกสารนี้ ดังที่คุณเห็นการแสดงออกที่ซับซ้อนนั้นเป็นหน้าที่ของตัวทำนาย X หากต้องการดูเพิ่มเติมว่าสังหรณ์ใจทำไม var (Y) ขึ้นกับ X เมื่อมีการสุ่มลาดให้ตรวจสอบหน้า 30 ของสไลด์เหล่านี้ ("ทำไมความแปรปรวนขึ้นอยู่กับ x ? ")

เนื่องจาก ICC เป็นฟังก์ชันของตัวทำนาย (ค่า x) จึงสามารถคำนวณได้เฉพาะสำหรับชุดค่า x เฉพาะ คุณอาจลองทำอะไรบางอย่างเช่นการรายงาน ICC ที่ค่าเฉลี่ยร่วมของค่า x แต่การประมาณนี้จะไม่ถูกต้องสำหรับการสังเกตส่วนใหญ่

ทุกสิ่งที่ฉันพูดยังคงหมายถึงเฉพาะกรณีที่มีปัจจัยสุ่มเดียว ด้วยปัจจัยสุ่มหลายอย่างมันยิ่งซับซ้อนมากขึ้น ตัวอย่างเช่นในโครงการหลายไซต์ที่ผู้เข้าร่วมในแต่ละไซต์ตอบสนองต่อสิ่งเร้า (เช่น 3 ปัจจัยสุ่ม: ไซต์ผู้เข้าร่วมการกระตุ้น) เราสามารถถามเกี่ยวกับ ICCs ที่แตกต่างกันมากมาย: ความสัมพันธ์ที่คาดหวังระหว่างสองคำตอบคืออะไร ที่ไซต์เดียวกันไปยังสิ่งกระตุ้นเดียวกันจากผู้เข้าร่วมที่ต่างกัน วิธีการเกี่ยวกับสถานที่ต่าง ๆ การกระตุ้นเดียวกันและผู้เข้าร่วมที่แตกต่างกันอย่างไร และอื่น ๆ @rvl กล่าวถึงภาวะแทรกซ้อนเหล่านี้ในคำตอบที่ OP เชื่อมโยงกับ

อย่างที่คุณเห็นกรณีเดียวที่เราสามารถสรุประดับของการทำคลัสเตอร์ด้วยค่าเดียวคือกรณีสุ่มปัจจัยสกัดกั้นแบบสุ่มปัจจัยเดียว เนื่องจากนี่เป็นสัดส่วนที่เล็กมากของคดีในโลกแห่งความเป็นจริง ICC จึงไม่ค่อยมีประโยชน์ ดังนั้นคำแนะนำทั่วไปของฉันคือไม่ต้องกังวลกับมัน ฉันขอแนะนำเพียงแค่รายงานส่วนประกอบความแปรปรวน (โดยเฉพาะอย่างยิ่งในรูปแบบค่าเบี่ยงเบนมาตรฐาน)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.