การทดสอบทางสถิติเพื่อเปรียบเทียบความแม่นยำของอุปกรณ์ทั้งสอง


10

ฉันกำลังเปรียบเทียบอุปกรณ์ควบคุมอุณหภูมิสองอย่างที่ออกแบบมาเพื่อรักษาอุณหภูมิของร่างกายที่ 37 องศาในผู้ป่วยที่ได้รับยาสลบ อุปกรณ์ถูกติดตั้งกับผู้ป่วย 500 คนก่อตัวเป็นสองกลุ่ม กลุ่ม A (ผู้ป่วย 400 ราย) - อุปกรณ์ 1, กลุ่ม B (ผู้ป่วย 100 ราย) - อุปกรณ์ 2 ผู้ป่วยแต่ละรายมีการวัดอุณหภูมิของพวกเขาทุกๆ 36 ชั่วโมงเป็นเวลา 36 ชั่วโมงให้ข้อมูล 18,000 จุดกับทั้งสองกลุ่ม ฉันต้องตรวจสอบว่าอุปกรณ์ใดควบคุมอุณหภูมิร่างกายของผู้ป่วยอย่างแม่นยำมากขึ้นในช่วง 36 ชั่วโมง ฉันได้สร้างกราฟเส้นที่เข้าร่วมกับค่ามัธยฐาน ณ จุดแต่ละครั้งด้วยบาร์ควอไทล์และดูเหมือนว่าจะมีความแตกต่าง ฉันควรวิเคราะห์ข้อมูลเพื่อพิสูจน์ความแตกต่างทางสถิติอย่างไร


คุณแชร์ผู้ป่วยระหว่างอุปกรณ์หรือไม่? หากคุณไม่ทำเช่นนั้นจะต้องมีการสันนิษฐานเพิ่มเติมว่าผู้ป่วยในสองกลุ่มนั้นมีความคล้ายคลึงกันในวงกว้าง
Aksakal

แบบผสมลักษณะพิเศษเป็นอย่างไร ข้อผิดพลาดมาตรฐานสำหรับแต่ละระดับ (กลุ่ม A / B) จะบอกให้คุณทราบว่าการวัดนั้นแม่นยำเพียงใด คุณสามารถบัญชีสำหรับอนุกรมเวลาและผู้ป่วย
Roman Luštrik

คำตอบ:


2

โอ

เมื่อคุณกำหนดตัวชี้วัดประเภทนี้คุณจะใช้ "ฟังก์ชันการลงโทษ" โดยปริยายซึ่งลงโทษอุณหภูมิที่เบี่ยงเบนจากอุณหภูมิที่คุณต้องการ ทางเลือกหนึ่งคือการวัด "ความแม่นยำ" โดยลดความแปรปรวนรอบอุณหภูมิที่ต้องการ (ถือว่านี่เป็นค่าเฉลี่ยคงที่สำหรับการคำนวณผลต่าง) ความแปรปรวนลงโทษด้วยความคลาดเคลื่อนกำลังสองดังนั้นมันจึงได้รับการลงโทษอย่างสมเหตุสมผลสำหรับความเบี่ยงเบนสูง อีกทางเลือกหนึ่งคือการลงโทษอย่างหนักยิ่งขึ้น (เช่น cubed-error) อีกทางเลือกหนึ่งคือการวัดระยะเวลาที่แต่ละอุปกรณ์มีผู้ป่วยนอกช่วงอุณหภูมิที่ปลอดภัยทางการแพทย์ ไม่ว่าในกรณีใดก็ตามสิ่งที่คุณเลือกควรสะท้อนถึงอันตรายที่รับรู้ของการเบี่ยงเบนจากอุณหภูมิที่ต้องการ

เมื่อคุณได้พิจารณาแล้วว่าสิ่งใดที่ถือเป็นตัวชี้วัดของ "ความแม่นยำที่ดี" คุณจะต้องกำหนด "การทดสอบ heteroscedasticity" บางประเภทซึ่งกำหนดขึ้นในความหมายที่กว้างขึ้นของการวัดความแม่นยำที่คุณใช้ ฉันไม่แน่ใจว่าฉันเห็นด้วยกับความเห็นของ whuber เกี่ยวกับการปรับค่าความสัมพันธ์อัตโนมัติ มันขึ้นอยู่กับสูตรการสูญเสียของคุณ - จริงๆแล้วการอยู่ในช่วงอุณหภูมิสูงเป็นระยะเวลานานอาจเป็นสิ่งที่อันตรายที่สุดดังนั้นถ้าคุณปรับกลับไปที่บัญชีสำหรับความสัมพันธ์อัตโนมัติคุณอาจสิ้นสุด ล้มเหลวในการลงโทษผลลัพธ์ที่เป็นอันตรายอย่างมากอย่างเพียงพอ


0

นี่คือการทดสอบความเป็นเนื้อเดียวกัน และเนื่องจากนี่เป็นอนุกรมเวลาตัวเลือกที่เหมาะสมคือการทดสอบBreusch-Paganไม่ใช่การทดสอบ F การทดสอบนี้จะตอบเพียงคำถามของความเท่าเทียมกันของความแม่นยำระหว่างอุปกรณ์ทั้งสองเท่านั้น ระดับความแม่นยำเป็นอีกวิธีหนึ่งในการคิดถึงความแปรปรวน

[แก้ไข: เปลี่ยนการทดสอบเป็นแบบทดสอบที่ถูกต้องโดยคำนึงถึงการพึ่งพาเวลา]


3
วิธีนี้มีความสมเหตุสมผล แต่ทำไมไม่บรรลุเป้าหมายทั้งสองโดยตรงโดยเปรียบเทียบการกระจายรอบอุณหภูมิเป้าหมายมากกว่าความแปรปรวน (ซึ่งวัดการกระจายรอบอุณหภูมิเฉลี่ยเท่านั้น) ประเด็นสำคัญหนึ่งที่ต้องตรวจสอบก่อนเกี่ยวกับความสัมพันธ์แบบอนุกรม: ถ้าสูงจำเป็นต้องทำการแก้ไขบางอย่าง (เช่นการลดองศาอิสระในการทดสอบ) ปัญหาอื่นที่เกี่ยวข้องกับการสูญเสีย : ฟังก์ชันการสูญเสียอาจไม่ใช่กำลังสอง บางทีผู้คนสามารถทนต่อความผันผวนเล็กน้อยได้อย่างง่ายดาย แต่การเกิดขึ้นของความผันผวนครั้งใหญ่อาจทำให้เกิดความเสียหายได้ ที่ควรสำรวจ
whuber

@whuber เกี่ยวกับการเปรียบเทียบรอบ temp เป้าหมายถ้าเป็นฉันนั่นคือสิ่งที่ฉันจะทำ ผู้ปฏิบัติการเฉพาะถามคำถามเกี่ยวกับความแปรปรวนดังนั้นโดยไม่คำนึงถึงความโน้มเอียงของเราเราต้องพูดถึงโดยตรงใช่ไหม :)
Gary Chung

2
ปัญหาสำหรับการทดสอบ F จะไม่เป็นไปตามปกติ แต่น่าจะเป็นอิสระ นี่คืออนุกรมเวลา
Glen_b -Reinstate Monica

@Glen_b ไม่อยากจะเชื่อว่าฉันพลาดจุดนั้นไป ขอบคุณสำหรับการจับที่ แก้ไข
Gary Chung

9
ด้วยความเคารพไม่: ความแตกต่างระหว่างไซต์นี้กับไซต์คณิตศาสตร์คือส่วนสำคัญของการตอบคำถามเชิงสถิติที่เกี่ยวข้องกับการช่วยเฟรม OP ตามที่พวกเขาต้องการ บ่อยครั้งการตอบคำถามที่ถูกต้องตามที่ถามไว้ที่นี่มีประโยชน์น้อยกว่าหรือทำให้เข้าใจผิด ดังนั้นงานแรกของเราในฐานะผู้อ่านที่กระตือรือร้นและผู้ตอบแบบสำรวจคือการยืนยันว่าเรากำลังตีความคำถามด้วยวิธีที่เป็นประโยชน์และเหมาะสมและเพื่อให้คำตอบที่ตอบสนองวัตถุประสงค์ของ OP ได้ดีที่สุด ใช้ความคิดเห็นกับคำถามเพื่อถามคำถามที่ชัดเจนและตรวจสอบความถูกต้อง
whuber

0

หากคุณสนใจว่าอุปกรณ์รักษาอุณหภูมิ 37C ได้ดีเพียงใดคุณสามารถ:

  1. ใช้ข้อมูลที่มีทั้งหมดจากแต่ละคนตามที่เป็นหรือ
  2. ประมาณค่าเบี่ยงเบนเฉลี่ยต่อคนจาก 37C โดยใช้ 36 การทดลองของแต่ละคน

ข้อมูลจะถูกนำไปใช้ในการรักษาซ้ำหลายครั้ง เมื่อทำการทดลองภายในบุคคลเป็นกลุ่มคุณจะลดโอกาสของช่วงความเชื่อมั่นโดยประมาณที่ไม่ถูกต้องรอบ ๆ ผลของอุปกรณ์ นอกจากนี้คุณสามารถทดสอบผลกระทบของเวลาระหว่างอุปกรณ์ทั้งสองหรือเป็นปฏิสัมพันธ์กับอุปกรณ์เพื่อยืนยันว่าการบำรุงรักษาอุณหภูมิในช่วงเวลาที่ดี การหาวิธีที่จะมองเห็นภาพทั้งหมดนี้มีความสำคัญที่สำคัญและอาจแนะนำวิธีการหนึ่งเหนืออีกวิธีหนึ่ง บางสิ่งบางอย่างตาม:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.