การคำนวณความน่าเชื่อถือระหว่างผู้ใช้ใน R พร้อมกับจำนวนเรตติ้งที่หลากหลาย?


9

วิกิพีเดียแสดงให้เห็นว่าวิธีหนึ่งที่จะดูที่ความน่าเชื่อถือระหว่างผู้ประเมินคือการใช้แบบจำลองผลกระทบแบบสุ่มเพื่อคำนวณintraclass สัมพันธ์ ตัวอย่างของความสัมพันธ์ภายใน intraclass พูดถึงการมอง

σα2σα2+σϵ2

จากแบบจำลอง

Yij=μ+αi+ϵij

"ที่ Y IJเป็นเจTHสังเกตในฉันTHกลุ่มμเป็นค่าเฉลี่ยโดยรวมไม่มีใครสังเกต, α ฉันเป็นผลสุ่มสังเกตร่วมกันโดยค่าทั้งหมดในกลุ่ม i และε IJเป็นคำที่ไม่มีใครสังเกตเสียง."

นี่เป็นรูปแบบที่น่าสนใจโดยเฉพาะอย่างยิ่งเพราะในข้อมูลของฉันไม่มีผู้ให้คะแนนทุกสิ่ง (แม้ว่าส่วนใหญ่จะได้อันดับ 20+) และสิ่งต่าง ๆ ได้รับการจัดอันดับเป็นจำนวนตัวแปรหลายครั้ง (โดยปกติ 3-4)

คำถาม # 0: "group i" ในตัวอย่างนั้น ("group i") เป็นการจัดกลุ่มสิ่งต่าง ๆ หรือไม่

คำถาม # 1: ถ้าฉันกำลังมองหาความน่าเชื่อถือระหว่างผู้ประเมินฉันไม่จำเป็นต้องมีโมเดลเอฟเฟกต์แบบสุ่มที่มีสองคำหนึ่งคำสำหรับผู้ประเมินและอีกหนึ่งสำหรับสิ่งที่ได้รับการจัดอันดับ ท้ายที่สุดแล้วทั้งคู่มีรูปแบบที่เป็นไปได้

คำถาม # 2: ฉันจะแสดงโมเดลนี้ใน R ได้ดีที่สุดอย่างไร

ดูเหมือนว่าคำถามนี้มีข้อเสนอที่ดูดี:

lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata)

ฉันดูคำถามสองสาม ข้อและไวยากรณ์ของพารามิเตอร์ "random" สำหรับ lme นั้นทึบแสงสำหรับฉัน ฉันอ่านหน้าช่วยเหลือของ lmeแต่คำอธิบายสำหรับ "random" นั้นไม่สามารถเข้าใจได้โดยไม่มีตัวอย่าง

คำถามนี้เป็นคำถามที่ค่อนข้างคล้ายกับยาว รายการของคำถามกับนี้ที่อยู่ใกล้ที่สุด อย่างไรก็ตามรายละเอียดส่วนใหญ่ไม่ได้ระบุที่อยู่ R


โมเดลเอฟเฟกต์ผสมและเอฟเฟกต์แบบสุ่มจะถูกเข้ารหัสด้วยวิธีเดียวกันในอาร์ดูที่ncbi.nlm.nih.gov/pmc/articles/PMC3402032สำหรับข้อมูล tuto เพิ่มเติม!
noé

คำตอบ:


6

แบบจำลองที่คุณอ้างถึงในคำถามของคุณเรียกว่า "แบบทางเดียว" สันนิษฐานว่าเอฟเฟกต์แถวสุ่มเป็นแหล่งที่มาของความแปรปรวนอย่างเป็นระบบเท่านั้น ในกรณีของความน่าเชื่อถือระหว่างผู้ใช้แถวจะสอดคล้องกับวัตถุของการวัด (เช่นตัวแบบ)

แบบจำลองทางเดียว :โดยที่เป็นค่าเฉลี่ยสำหรับวัตถุทั้งหมดคือเอฟเฟกต์แถวและเป็นเอฟเฟกต์ที่เหลือ

xij=μ+ri+wij
μriwij

อย่างไรก็ตามยังมี "รุ่นสองทาง" สิ่งเหล่านี้ถือว่ามีความแปรปรวนที่เกี่ยวข้องกับเอฟเฟกต์แถวแบบสุ่มรวมถึงผลแบบคอลัมน์แบบสุ่มหรือแบบคงที่ ในกรณีของความน่าเชื่อถือระหว่างผู้ใช้คอลัมน์จะสอดคล้องกับแหล่งที่มาของการวัด (เช่นผู้ประเมิน)

แบบจำลองสองทาง :โดยที่คือค่าเฉลี่ยสำหรับทุกคน วัตถุเป็นเอฟเฟกต์แถวเป็นเอฟเฟกต์คอลัมน์คือเอฟเฟกต์การโต้ตอบและคือเอฟเฟกต์ที่เหลือ ความแตกต่างระหว่างสองรุ่นนี้คือการรวมหรือแยกผลกระทบจากการโต้ตอบ

xij=μ+ri+cj+rcij+eij
xij=μ+ri+cj+eij
μricjrcijeij

กำหนดรูปแบบสองทางคุณสามารถคำนวณหนึ่งในสี่ของค่าสัมประสิทธิ์ ICC: ความสอดคล้องคะแนนเดียว ICC (C, 1), ความสอดคล้องคะแนนเฉลี่ย ICC (C, k), ข้อตกลงคะแนนเดียว ICC (A, 1) หรือ ข้อตกลงคะแนนเฉลี่ย ICC (A, k) คะแนน ICC แบบเดี่ยวจะใช้กับการวัดเดี่ยว (เช่นผู้ประเมินรายบุคคล) ในขณะที่คะแนนเฉลี่ย ICCs นำไปใช้กับการวัดค่าเฉลี่ย (เช่นค่าเฉลี่ยของผู้ประเมินทั้งหมด) ความสอดคล้องกัน ICCs ไม่รวมความแปรปรวนของคอลัมน์จากความแปรปรวนของตัวส่วน (เช่นการอนุญาตให้ผู้ให้ข้อมูลเปลี่ยนวิธีการของตนเอง) ในขณะที่ข้อตกลง ICCs รวมถึงความแปรปรวนของคอลัมน์ในความแปรปรวนของตัวหาร (เช่นต้องการให้ผู้ประเมินแตกต่างกันxijx¯i

นี่คือคำจำกัดความถ้าคุณถือว่าผลคอลัมน์แบบสุ่ม:

ข้อกำหนดแบบสุ่มผลสองทาง ICC (มีหรือไม่มีเอฟเฟกต์การโต้ตอบ) :

ICC(C,1)=σr2σr2+(σrc2+σe2) or σr2σr2+σe2
ICC(C,k)=σr2σr2+(σrc2+σe2)/k or σr2σr2+σe2/k
ICC(A,1)=σr2σr2+(σc2+σrc2+σe2) or σr2σr2+(σc2+σe2)
ผม(A,k)=σR2σR2+(σ2+σR2+σอี2)/k หรือ σR2σR2+(σ2+σอี2)/k

คุณสามารถประมาณค่าเหล่านี้โดยใช้ค่าเฉลี่ยกำลังสองจาก ANOVA:

การประมาณค่า ICC แบบสองทาง :

ผม(,1)=MSR-MSEMSR+(k-1)MSE
ผม(,k)=MSR-MSEMSR
ผม(A,1)=MSR-MSEMSR+(k-1)MSE+k/n(MS-MSE)
ผม(A,k)=MSR-MSEMSR+(MS-MSE)/n

คุณสามารถคำนวณค่าสัมประสิทธิ์เหล่านี้ใน R โดยใช้แพคเกจ irr :

icc(ratings, model = c("oneway", "twoway"),
type = c("consistency", "agreement"),
unit = c("single", "average"), r0 = 0, conf.level = 0.95)

อ้างอิง

McGraw, KO, & Wong, SP (1996) การหาข้อสรุปเกี่ยวกับสัมประสิทธิ์สหสัมพันธ์อินทราเน็ต วิธีการทางจิตวิทยา, 1 (1), 30–46

Shrout, PE, & Fleiss, JL (1979) สหสัมพันธ์ Intraclass: ใช้ในการประเมินความน่าเชื่อถือของผู้ประเมิน กระดานข่าวทางจิตวิทยา, 86 (2), 420–428


ขอบคุณสำหรับคำตอบที่ยอดเยี่ยม! ในแบบจำลองสองทางภายใน icc ใน R เราจะแสดงการเลือกแบบสุ่มของผู้ประเมินต่อแถวได้อย่างไร ฉันหมายความว่าลองนึกภาพเรามีสระว่ายน้ำ 100 คนและแต่ละคนมีคะแนนประมาณ 5-10 คน สถานการณ์ดังกล่าวสามารถจัดการได้ด้วยแพ็คเกจ ICC หรือไม่
michal

ผู้ทดสอบแต่ละคนควรมีคอลัมน์ของตนเองในเมทริกซ์ที่คุณป้อนไปยังฟังก์ชัน icc มิฉะนั้นการคำนวณจะเหมือนกันสำหรับโมเดลเอฟเฟกต์แบบสุ่มและผสม - ความแตกต่างหลักคือในการตีความ (วิธีพิจารณาผลลัพธ์โดยทั่วไป)
Jeffrey Girard

ขอบคุณสำหรับคำตอบ! ฉันพยายามที่จะทำเช่นนั้นโดยส่วนใหญ่มี NA ในเซลล์ (และมีเพียงไม่กี่ค่าที่มีตัวเลขจริงต่อคอลัมน์ซึ่งผู้ประเมินรายหนึ่งจัดอันดับเรื่องที่สอดคล้องกับแถว) อย่างไรก็ตามในผลลัพธ์ฉันได้รับข้อความแจ้งว่าไม่มีการบันทึกหัวเรื่อง (เช่นหัวเรื่อง = 0 Raters = 9) บางทีอาจหมายความว่าไม่ว่าที่ใดก็ตามที่พบ NA อย่างน้อยหนึ่งแถวจะถูกกรองออกทั้งหมด? แต่แล้วฉันจะแสดงถึงการให้คะแนนที่ขาดหายไปจากผู้ประเมินได้อย่างไร?
michal

อืมนั่นอาจเป็นข้อ จำกัด ของฟังก์ชั่น icc เฉพาะนี้ ฉันมีสคริปต์ MATLAB ที่สามารถจัดการกับสถานการณ์นี้ คุณมีสิทธิ์เข้าถึง MATLAB หรือไม่
Jeffrey Girard

1
ใช่ตรวจสอบเว็บไซต์ของฉัน: mreliability.jmgirard.com
Jeffrey Girard
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.