การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer


28

ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

ฉันเชื่อว่าวิธีการนี้สามารถใช้ในการคำนวณความน่าเชื่อถือของเอฟเฟกต์ (เช่นผลรวมความเปรียบต่างของตัวแปรที่มี 2 ระดับ) ดังที่:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

คำถามสามข้อ:

  1. การคำนวณข้างต้นเพื่อให้ได้การประมาณค่าจุดของความสามารถในการทำซ้ำของเอฟเฟกต์ทำให้รู้สึกหรือไม่?
  2. เมื่อฉันมีตัวแปรหลายตัวที่ฉันต้องการประเมินซ้ำการเพิ่มพวกเขาทั้งหมดให้พอดี (เช่นlmer(dv~(iv1+iv2|unit)+iv1+iv2) ดูเหมือนว่าจะให้ค่าการประเมินซ้ำที่สูงกว่าการสร้างแบบจำลองแยกสำหรับแต่ละเอฟเฟกต์ สิ่งนี้ทำให้เกิดความรู้สึกคำนวณกับฉันเนื่องจากการรวมของเอฟเฟ็กต์หลายอย่างมีแนวโน้มที่จะลดความแปรปรวนที่เหลืออยู่ แต่ฉันไม่แน่ใจว่าการประเมินความสามารถในการทำซ้ำที่เกิดขึ้นนั้นถูกต้อง ที่พวกเขา?
  3. ดังกล่าวข้างต้นกระดาษอ้างให้เห็นว่าโปรไฟล์โอกาสอาจช่วยฉันได้รับช่วงความเชื่อมั่นสำหรับการประมาณการการทำซ้ำ แต่เท่าที่ฉันสามารถบอกconfint(profile(fit))ให้เพียงช่วงเวลาสำหรับการตัดและผลกระทบความแปรปรวนในขณะที่ผมยังจะต้องช่วงเวลาสำหรับการแปรปรวนที่เหลือในการคำนวณ ช่วงเวลาสำหรับการทำซ้ำได้หรือไม่

คำตอบ:


6

ฉันคิดว่าฉันสามารถตอบคำถามของคุณอย่างน้อยที่สุดเกี่ยวกับการประเมินความสามารถในการทำซ้ำที่ไม่ได้ปรับปรุงเช่นความสัมพันธ์ภายในคลาสสิก (ICCs) สำหรับการประเมินความสามารถในการทำซ้ำ "ที่ปรับแล้ว" ฉันอ่านผ่านกระดาษที่คุณเชื่อมโยงและไม่เห็นว่าสูตรที่คุณใช้สามารถพบได้ที่ไหนในกระดาษ? จากการแสดงออกทางคณิตศาสตร์ดูเหมือนว่าเป็นการทำซ้ำของคะแนนเฉลี่ย (มากกว่าคะแนนแต่ละคะแนน) แต่มันไม่ชัดเจนว่านี่เป็นส่วนสำคัญของคำถามของคุณอยู่แล้วดังนั้นฉันจะไม่สนใจมัน

(1. ) การคำนวณข้างต้นสำหรับการได้รับการประมาณค่าจุดของความสามารถในการทำซ้ำของเอฟเฟกต์ทำให้รู้สึกหรือไม่?

ใช่นิพจน์ที่คุณเสนอนั้นสมเหตุสมผล แต่จำเป็นต้องแก้ไขสูตรที่เสนอของคุณเล็กน้อย ด้านล่างฉันแสดงให้เห็นว่ามีวิธีใดที่จะได้ค่าสัมประสิทธิ์การทำซ้ำที่คุณเสนอ ฉันหวังว่าสิ่งนี้จะอธิบายความหมายของสัมประสิทธิ์และอธิบายว่าทำไมมันจึงเป็นที่พึงปรารถนาที่จะปรับเปลี่ยนเล็กน้อย

เพื่อเริ่มต้นก่อนอื่นลองหาค่าสัมประสิทธิ์การทำซ้ำในกรณีแรกของคุณและชี้แจงว่ามันหมายถึงอะไรและมาจากที่ใด การทำความเข้าใจสิ่งนี้จะช่วยให้เราเข้าใจกรณีที่สองที่ซับซ้อนมากขึ้น

ดักแบบสุ่มเท่านั้น

ij

yij=β0+u0j+eij,
u0jσu02eijσe2

xy

corr=cov(x,y)var(x)var(y).

xyj

ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j),
ICC=σu02σu02+σe2.

การสกัดกั้นแบบสุ่มและความลาดชันแบบสุ่ม

ตอนนี้สำหรับกรณีที่สองเราต้องอธิบายให้ชัดเจนก่อนว่า "ความน่าเชื่อถือของเอฟเฟ็กต์คืออะไร (เช่นผลรวมความเปรียบต่างของตัวแปรที่มี 2 ระดับ)" - คำพูดของคุณ

ijkx

yijk=β0+β1xk+u0j+u1jxk+eijk,
σu02σu12σu01eijσe2

ji

x|x1|=|x2|=x

yi1jk2yi1jk1=(β0β0)+β1(xk2xk1)+(u0ju0j)+u1j(xk2xk1)+(ei1jk2ei1jk1)=2xβ1+2xu1j+ei1jk2ei1jk1
yi2jk2yi2jk1=2xβ1+2xu1j+ei2jk2ei2jk1.

ICC=cov(2xβ1+2xu1j+ei1jk2ei1jk1,2xβ1+2xu1j+ei2jk2ei2jk1)var(2xβ1+2xu1j+ei1jk2ei1jk1)var(2xβ1+2xu1j+ei2jk2ei2jk1),
ICC=2x2σu122x2σu12+σe2.
xx

x±12

(2. ) เมื่อฉันมีตัวแปรหลายตัวที่มีความสามารถในการทำซ้ำฉันต้องการประมาณการเพิ่มพวกเขาทั้งหมดให้พอดี (เช่นlmer(dv~(iv1+iv2|unit)+iv1+iv2) ดูเหมือนว่าจะให้ผลการประเมินความสามารถในการทำซ้ำที่สูงกว่าการสร้างแบบจำลองแยกต่างหากสำหรับแต่ละเอฟเฟ็กต์ สิ่งนี้ทำให้เกิดความรู้สึกคำนวณกับฉันเนื่องจากการรวมหลายเอฟเฟกต์มีแนวโน้มที่จะลดความแปรปรวนที่เหลือ แต่ฉันไม่แน่ใจว่าการประเมินความสามารถในการทำซ้ำที่เกิดขึ้นนั้นถูกต้อง ที่พวกเขา?

ผมเชื่อว่าการทำงานผ่านมาเช่นเดียวกับที่นำเสนอข้างต้นสำหรับรุ่นที่มีการพยากรณ์หลายมีความลาดชันแบบสุ่มของตัวเองจะแสดงให้เห็นว่าค่าสัมประสิทธิ์การทำซ้ำข้างต้นจะยังคงเป็นที่ถูกต้องยกเว้นสำหรับภาวะแทรกซ้อนเพิ่มว่าคะแนนความแตกต่างที่เรามีความสนใจแนวคิดในขณะนี้จะ มีคำจำกัดความแตกต่างกันเล็กน้อย: เราสนใจในความสัมพันธ์ที่คาดหวังของความแตกต่างระหว่างค่าเฉลี่ยที่ปรับหลังจากการควบคุมสำหรับตัวทำนายอื่น ๆ ในแบบจำลอง

หากผู้ทำนายคนอื่นเป็นผู้ตั้งฉากกับตัวทำนายความสนใจ (เช่นในการทดลองที่สมดุล) ฉันจะคิดว่าค่าสัมประสิทธิ์การทำซ้ำของ ICC / การทำซ้ำที่กล่าวถึงข้างต้นควรทำงานโดยไม่มีการดัดแปลงใด ๆ หากพวกเขาไม่ใช่ orthogonal คุณจะต้องแก้ไขสูตรเพื่อพิจารณาสิ่งนี้ซึ่งอาจซับซ้อน แต่หวังว่าคำตอบของฉันได้ให้คำแนะนำเกี่ยวกับสิ่งที่อาจมีลักษณะ


RRn
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.