ความไวหรือความจำเพาะเป็นหน้าที่ของการแพร่หลายหรือไม่


10

การสอนมาตรฐานกล่าวว่าความไวและความจำเพาะเป็นคุณสมบัติของแบบทดสอบและไม่ขึ้นกับความชุก แต่นี่ไม่ใช่แค่ข้อสันนิษฐานใช่ไหม

หลักการของแฮร์ริสันเกี่ยวกับอายุรศาสตร์ที่ 19 เอ็ดกล่าวว่า

มีการยืนยันมานานแล้วว่าความไวและความจำเพาะเป็นพารามิเตอร์ที่ไม่ขึ้นอยู่กับความแม่นยำของการทดสอบและข้อความจำนวนมากยังคงสร้างข้อความนี้ อย่างไรก็ตามสมมติฐานที่มีประโยชน์เชิงสถิตินี้เป็นแบบง่าย ๆ ในทางคลินิก ... ความไวของการทดสอบจะสูงขึ้นในผู้ป่วยในโรงพยาบาลและการทดสอบความจำเพาะสูงในผู้ป่วยนอก

(ความชุกโดยทั่วไปจะสูงกว่าในผู้ป่วยในกว่าผู้ป่วยนอก)

มีความสัมพันธ์ทางคณิตศาสตร์หรือกราฟิกโดยประมาณระหว่างพารามิเตอร์เหล่านี้หรือไม่?

แม้แต่ลิงค์นี้ก็เรียกว่า 'การทำให้เข้าใจง่าย' ทำไม?

แก้ไข: ฉันรู้วิธีการกำหนดความไว ไม่มีคำศัพท์ใดที่เกี่ยวข้องกับการแพร่หลายดังที่ได้กล่าวไว้ในคำตอบ ตัวฉันเองยืนยันว่าสิ่งเหล่านี้เป็นคุณสมบัติของการทดสอบที่ไม่ได้รับผลกระทบจากประชากรที่ใช้จนกระทั่งฉันเจอข้อความนี้ดังนั้นคำถาม แต่ฉันคิดว่าความสับสนนี้เกิดขึ้นไม่ใช่เพราะคำจำกัดความ แต่การคำนวณค่าเหล่านี้ในทางปฏิบัติ ความเจาะจงและความไวถูกคำนวณโดยใช้ตาราง 2x2 ความชุกของประชากรอ้างอิงที่นี่สำคัญหรือไม่ นั่นคือสิ่งที่พวกเขากำลังอ้างถึง? ถ้าเป็นเช่นนั้นฟังก์ชั่นคืออะไร?

คำตอบ:


4

แม้ว่าคำตอบของ @ Tim ♦และ @ gung ♦จะครอบคลุมทุกอย่างมาก แต่ฉันจะพยายามสังเคราะห์พวกเขาทั้งสองเป็นหนึ่งเดียวและให้คำอธิบายเพิ่มเติม

บริบทของบรรทัดที่ยกมาอาจอ้างถึงการทดสอบทางคลินิกในรูปแบบของเกณฑ์ที่แน่นอนเช่นกันมากที่สุด ลองนึกภาพโรคและทุกอย่างที่นอกเหนือจากรวมทั้งสุขภาพของรัฐเรียกว่าค สำหรับการทดสอบของเราต้องการหาการวัดค่าพร็อกซีที่ช่วยให้เราได้รับการคาดการณ์ที่ดีสำหรับ (1) เหตุผลที่เราไม่ได้รับความเจาะจง / ความไวแน่นอนคือค่าของปริมาณพร็อกซีของเรานั้นไม่มีความสัมพันธ์อย่างสมบูรณ์ สถานะของโรค แต่โดยทั่วไปจะเชื่อมโยงกับมันและด้วยเหตุนี้ในการวัดแต่ละครั้งเราอาจมีโอกาสของปริมาณนั้นข้ามเกณฑ์ของเราสำหรับD D c D D cDDDDDบุคคลและในทางกลับกัน เพื่อความชัดเจนลองสมมติว่าแบบเกาส์เซียนสำหรับความแปรปรวน

ให้เราบอกว่าเราใช้เป็นปริมาณพร็อกซี่ หากเลือกอย่างดีแล้วจะต้องสูงกว่า (เป็นตัวดำเนินการค่าที่คาดหวัง) ตอนนี้ปัญหาเกิดขึ้นเมื่อเราตระหนักดีว่าเป็นสถานการณ์คอมโพสิต (เพื่อให้เป็น ) ทำจริง 3 เกรดความรุนแรง , ,แต่ละคนมีค่าที่คาดหวังความก้าวหน้าที่เพิ่มขึ้นสำหรับxสำหรับบุคคลเดี่ยวเลือกจากหมวดหรือจากx E [ x D ] E [ x D c ] E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cxxE[xD]E[xD]EDDD1D2D3xDDหมวดหมู่ความน่าจะเป็นของการ 'ทดสอบ' ที่มาเป็นบวกหรือไม่ขึ้นอยู่กับค่าเกณฑ์ที่เราเลือก ให้เราบอกว่าเราเลือกจากการศึกษาตัวอย่างแบบสุ่มอย่างแท้จริงที่มีทั้งและบุคคล ของเราจะทำให้เกิดผลบวกและเชิงลบบางอย่าง หากเราเลือกคนแบบสุ่มความน่าจะเป็นเป็นตัวควบคุมค่าของเขา / เธอหากได้รับจากกราฟสีเขียวและของบุคคลสุ่มเลือกโดยกราฟสีแดงxTDDxTDxDป้อนคำอธิบายรูปภาพที่นี่

ตัวเลขจริงที่ได้รับจะขึ้นอยู่กับจำนวนจริงของบุคคลและแต่ความจำเพาะและความไวของผลลัพธ์จะไม่ ให้เป็นฟังก์ชันความน่าจะเป็นแบบสะสม จากนั้นสำหรับความชุกของของโรคนี่คือตาราง 2x2 ตามที่คาดไว้ในกรณีทั่วไปเมื่อเราพยายามที่จะดูว่าการทดสอบของเรามีประสิทธิภาพอย่างไรในประชากรที่รวมกันD c F ( ) p DDDF()พีD

( D c , - ) = ( 1 - p ) ( 1 - F D c ( x T ) ) ( D , - ) = p ( F D ( x T ) ) ( D c , + )

(D,+)=พี(1-FD(xT))
(D,-)=(1-พี)(1-FD(xT))
(D,-)=พี(FD(xT))
(D,+)=(1-พี)* * * *FD(xT)

ตัวเลขที่เกิดขึ้นจริงมีขึ้น แต่ไวและความจำเพาะมีอิสระ แต่ทั้งสองคนนี้จะขึ้นอยู่กับและ{} ดังนั้นปัจจัยทั้งหมดที่มีผลต่อสิ่งเหล่านี้จะเปลี่ยนการวัดเหล่านี้อย่างแน่นอน ถ้าเราเช่นการทำงานในห้องไอซียูของเราจะแทนที่จะถูกแทนที่ด้วยและถ้าเราได้พูดคุยเกี่ยวกับผู้ป่วยนอกแทนที่ด้วย{} มันเป็นเรื่องแยกต่างหากที่ในโรงพยาบาลความชุกก็แตกต่างกันp F D F D c F D F D 3 F D 1 D c D c x D D c F D F D c D F FพีพีFDFDFDFD3FD1แต่มันไม่ได้เป็นความชุกแตกต่างกันซึ่งเป็นสาเหตุของความเปราะบางและ specifities จะแตกต่างกัน แต่การกระจายที่แตกต่างกันตั้งแต่รุ่นที่เกณฑ์กำหนดไว้ก็ไม่ได้ใช้บังคับกับประชากรที่ปรากฏเป็นผู้ป่วยนอกหรือผู้ป่วยใน คุณสามารถไปข้างหน้าและแยกย่อยในหลาย ๆ กลุ่มย่อยได้เนื่องจากส่วนย่อยผู้ป่วยในของจะต้องมีค่าเพิ่มขึ้นเนื่องจากเหตุผลอื่น (เนื่องจากพร็อกซีส่วนใหญ่ยังอยู่ในสภาพร้ายแรงอื่น ๆ ด้วย) การแบ่งประชากรออกเป็นประชากรย่อยอธิบายการเปลี่ยนแปลงความไวในขณะที่ประชากรอธิบายการเปลี่ยนแปลงของความจำเพาะ (โดยการเปลี่ยนแปลงที่สอดคล้องกันในและDDxDDFDFD ) นี้เป็นสิ่งที่คอมโพสิตกราฟจริงประกอบด้วย แต่ละสีจะมีของตนเองและด้วยเหตุนี้ตราบใดที่สิ่งนี้แตกต่างจากที่คำนวณความไวและความเฉพาะเจาะจงดั้งเดิมการวัดเหล่านี้จะเปลี่ยนไปDFF

ป้อนคำอธิบายรูปภาพที่นี่

ตัวอย่าง

สมมติว่าประชากร 11550 มี 10,000 Dc, 500,750,300 D1, D2, D3 ตามลำดับ ส่วนที่ถูกคอมเม้นท์คือโค้ดที่ใช้สำหรับกราฟข้างต้น

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

เราสามารถคำนวณค่าเฉลี่ย x สำหรับประชากรต่าง ๆ ได้ง่ายเช่น Dc, D1, D2, D3 และคอมโพสิต D

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

ในการรับตาราง 2x2 สำหรับกรณีทดสอบดั้งเดิมของเราอันดับแรกเราจะกำหนดเกณฑ์ตามข้อมูล (ซึ่งในกรณีจริงจะถูกตั้งค่าหลังจากรันการทดสอบตามที่ @gung แสดง) อย่างไรก็ตามสมมติว่ามีเกณฑ์ 13.5 เราจะได้รับความไวและความจำเพาะต่อไปนี้เมื่อคำนวณจากประชากรทั้งหมด

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

ให้เราสมมติว่าเรากำลังทำงานกับผู้ป่วยนอกและเราได้รับผู้ป่วยโรคจากสัดส่วน D1 หรือเรากำลังทำงานในห้องไอซียูที่เราได้รับ D3 เท่านั้น (สำหรับกรณีทั่วไปมากขึ้นเราจำเป็นต้องแยกส่วนประกอบ Dc ด้วย) ความไวและความเฉพาะเจาะจงของเราเปลี่ยนไปอย่างไร โดยการเปลี่ยนความชุก (เช่นโดยการเปลี่ยนสัดส่วนสัมพัทธ์ของผู้ป่วยที่เป็นของทั้งสองกรณีเราจะไม่เปลี่ยนความจำเพาะและความไวเลยมันเกิดขึ้นที่ความชุกนี้เปลี่ยนไปตามการกระจายตัวที่เปลี่ยนไป)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

โดยสรุปพล็อตที่แสดงการเปลี่ยนแปลงของความไว (ความจำเพาะจะเป็นไปตามแนวโน้มที่คล้ายกันหากเรายังประกอบประชากร Dc จากประชากรย่อย) ด้วยค่าเฉลี่ย x ที่แตกต่างกันสำหรับประชากรนี่คือกราฟ

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

ป้อนคำอธิบายรูปภาพที่นี่

  1. D

9

ก่อนอื่นคุณควรตระหนักว่าคุณไม่สามารถเปลี่ยนความไวได้ตามความเป็นอิสระและในทางกลับกัน นี่คือจุดของเส้นโค้ง ROC ด้วยลักษณะของกระบวนการสร้างข้อมูลและข้อมูลและรูปแบบเฉพาะของคุณคุณจะติดอยู่กับการแลกเปลี่ยนระหว่างความไวและความเฉพาะเจาะจง แน่นอนว่าคุณต้องการความไว 100% และความจำเพาะ 100% ในเวลาเดียวกัน แต่โดยทั่วไปแล้วคุณไม่สามารถทำได้ คุณสามารถรับความไวได้ดีขึ้น แต่เสียค่าใช้จ่ายของความจำเพาะที่แย่ลงหรือความจำเพาะที่ดีกว่า เส้นโค้ง ROC แสดงชุดของการแลกเปลี่ยนที่คุณถูกบังคับให้เลือก 1เส้นโค้งROCเป็นความไวตามหน้าที่ 1 กำหนดความไวในการพล็อตเทียบกับความจำเพาะตัวเองจะเป็นเส้นโค้ง ROC ที่สะท้อน)

ป้อนคำอธิบายรูปภาพที่นี่

ในทุก ๆ ด้านความไวและความจำเพาะที่ชัดเจนสามารถเปลี่ยนไปอย่างไรกับความชุก? นี่เป็นปัญหาที่ช่วยในการจำลองและเล่นกับข้อมูลบางอย่างเพื่อดูว่าวิธีนี้สามารถใช้งานได้จริงในทางปฏิบัติ ลองจินตนาการว่ารูปแบบคือพอดีกับชุดข้อมูลขนาดใหญ่พอสมควรที่มีความชุกโดยเฉพาะและเกณฑ์ที่ตั้งอยู่บนแกน x 1 ต่อมาประสิทธิภาพของการทดสอบนี้จะถูกคำนวณด้วยตัวอย่างที่มีความชุกแตกต่างกันอย่างมาก (และทำให้ค่า x แตกต่างกัน) ผลลัพธ์คือโมเดลเดียวกันโดยใช้ threshold เดียวกันจะทำงานต่างกันเมื่อใช้กับชุดข้อมูลที่มีความชุกแตกต่างกัน

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

นี่คือความไวและความเฉพาะเจาะจงในฐานะที่เป็นหน้าที่ของความชุกด้วยช่วงความเชื่อมั่นที่แน่นอน 95%:

ป้อนคำอธิบายรูปภาพที่นี่

แล้วเกิดอะไรขึ้นที่นี่? พิจารณาว่าการถดถอยโลจิสติกต้นแบบอาจมีลักษณะคล้ายรูปด้านล่าง โปรดทราบว่าการกระทำทั้งหมดกำลังเกิดขึ้นในช่วง [4, 6] บนแกน x ข้อมูลด้านล่างที่จะมีความชุกต่ำมากและโมเดลจะแสดงการเลือกปฏิบัติและความไวต่ำ ข้อมูลด้านบนช่วงเวลานั้นจะมีความชุกสูงมาก แต่ตัวแบบจะไม่แยกแยะได้ดีและจะมีความจำเพาะต่ำ

ป้อนคำอธิบายรูปภาพที่นี่

เพื่อช่วยให้เข้าใจว่าสิ่งนี้เกิดขึ้นได้อย่างไรลองพิจารณาการทดสอบของ Alanine transaminase เพื่อตรวจสอบว่าตับของผู้ป่วยล้มเหลว2 หรือไม่. แนวคิดก็คือตับปกติจะใช้ ALT แต่ถ้าตับหยุดทำงาน ALT จะถูกทิ้งลงในกระแสเลือด ดังนั้นหากระดับของ ALT ในกระแสเลือดของผู้ป่วยสูงกว่าระดับที่กำหนดแสดงว่าตับล้มเหลว หากคุณวาดตัวอย่างที่มีความชุกสูงของภาวะตับวายคุณจะต้องวาดตัวอย่างที่มีระดับ ALT ในเลือดสูง ดังนั้นคุณจะมีผู้ป่วยมากกว่าเกณฑ์ ไม่ใช่ทุกคนที่มีระดับเลือดสูงของ ALT จะมีภาวะตับวายสำหรับผู้ป่วยบางรายจะมีสาเหตุอื่น แต่ผู้ที่มีภาวะตับวายควรถูกจับได้ สิ่งนี้นำไปสู่ความไวที่สูงขึ้น ในทำนองเดียวกันผู้ป่วยทุกรายที่มีระดับปกติของ ALT จะมีตับที่มีสุขภาพดี แต่ตัวอย่างที่มีความชุกต่ำจะมีระดับ ALT ที่ต่ำกว่าและผู้ป่วยจำนวนมากจะผ่านการทดสอบ ผู้ที่ตับของพวกเขาไม่อยู่ ไม่ล้มเหลว แต่ผู้ที่มีระดับปกติของ ALT จะพลาด สิ่งนี้นำไปสู่การลดความไว แต่มีความจำเพาะสูงกว่า

โดยทั่วไปแล้วความคิดทั้งหมดของการทดสอบทางการแพทย์ก็คือสิ่งหนึ่งหรือหลายอย่างนั้นมีความสัมพันธ์กับสถานะของโรคที่คุณอาจต้องการใช้มาตรการโดยตรง แต่ไม่สามารถทำได้ การวัดความสัมพันธ์จะช่วยให้คุณเข้าใจถึงสถานะของโรค การทดสอบ (ความเป็นไปได้) ที่ซึ่งสิ่งนี้ไม่เป็นความจริงจะไม่มีค่าและจะไม่ถูกใช้ ดังนั้นในทางปฏิบัติตัวอย่างความชุกที่สูงขึ้นควรมีการแจกแจงความสัมพันธ์กับค่าที่ผิดปกติมากขึ้นซึ่งนำไปสู่ความไวที่สูงขึ้นและในทางกลับกัน (โปรดทราบว่าความสัมพันธ์ไม่จำเป็นต้องเป็นสาเหตุของโรค; ในตัวอย่าง ALT มันเป็นผลกระทบในตัวอย่างอื่น ๆ ทั้งโรคและสหสัมพันธ์อาจเป็นผลของสาเหตุทั่วไป ฯลฯ )

1. จริง ๆ แล้วนี่เป็นเรื่องธรรมดาในยา พิจารณาว่าโคเลสเตอรอลควรเป็น <200 ความดันโลหิตซิสโตลิกควรเป็น <140 เป็นต้นซึ่งไม่ใช่การทดสอบจริง ๆ แต่มีการทดสอบมากมายที่ทำงานเช่นนั้น สำหรับการสนทนาที่เกี่ยวกับขีด จำกัด บางอย่าง (อาจอยู่ห่างไกล) มันอาจช่วยอ่านคำตอบของฉันเป็นขีด จำกัด 0-1 เสมอเท่ากับขีด จำกัด แกน x หรือไม่? และทำไมจำนวนของผลบวกปลอมจึงไม่ขึ้นกับขนาดตัวอย่างถ้าเราใช้ค่า p เพื่อเปรียบเทียบสองชุดข้อมูลอิสระ
2. โปรดทราบว่าฉันไม่ใช่แพทย์และตัวอย่างนี้อาจไม่เรียบร้อย ถามแพทย์จริงหากคุณต้องการข้อมูลที่ถูกต้องเกี่ยวกับการทำงานของตับการทดสอบและเรื่องที่เกี่ยวข้อง


ขอบคุณ! เพื่อแสดงว่ามันเปลี่ยนไปจริง ๆ แต่มันจะพิจารณาคำตอบของ @Tim อย่างไร? มันขัดแย้งกับอะไรเหรอ?
Polisetty

1
@Polisetty ทิมกล่าวว่า "ผู้ป่วยในและผู้ป่วยนอกอาจแตกต่างกันในหลาย ๆ ด้านไม่เพียง แต่ในความชุกเพียงอย่างเดียวดังนั้นปัจจัยอื่น ๆ ที่อาจมีผลต่อความรู้สึกไว" หากการทดสอบเป็นหน้าที่ของคุณสมบัติบางอย่างของผู้ป่วย (พูดคอเลสเตอรอล) และโรคนั้นมีความสัมพันธ์อย่างมากกับคุณสมบัตินั้นเช่นกัน (ซึ่งโดยทั่วไปเป็นจุดรวม) แล้ว "ปัจจัยอื่น ๆ " จะต้องย้ายร่วมกับ w / ความชุก ดังนั้นเมื่อความชุกเปลี่ยนไปความสัมพันธ์อื่นก็เปลี่ยนไปและการทดสอบก็มีความไวมากขึ้นหรือน้อยลงโดยเฉพาะกลุ่มนั้น
gung - Reinstate Monica

7

ตามที่ผู้อื่นพูดไว้แล้วความไวและความจำเพาะไม่ได้ขึ้นอยู่กับความชุก ความไวเป็นสัดส่วนของผลบวกที่แท้จริงในทุกบวกและความจำเพาะเป็นสัดส่วนของเชิงลบที่แท้จริงในเชิงลบทั้งหมด ดังนั้นหากความไวเป็น 90% การทดสอบจะถูกต้องสำหรับ 90% ของกรณีที่เป็นบวก เห็นได้ชัดว่า 90% ของสิ่งที่เล็กกว่าและ 90% ของบางสิ่งที่ใหญ่กว่านั้นยังคง 90% ...

ให้ข้อมูลตารางที่คุณพูดถึง

บวกเงื่อนไขเชิงลบเงื่อนไขบวกทดสอบaเชิงลบทดสอบd

ไวaa+++d/a+a+++d=aa+ พี(Y|X)=พี(YX)พี(X)da+++d/+da+++d=d+d

แต่ดูเหมือนว่าคำพูดจะพูดอย่างอื่น

ความไวในการทดสอบจะมีแนวโน้มสูงขึ้นในผู้ป่วยในโรงพยาบาลและการทดสอบความจำเพาะสูงในผู้ป่วยนอก

ดังนั้นผู้เขียนจึงบอกว่าความไวนั้นแตกต่างกันในแต่ละกลุ่ม ฉันเดาว่าผู้ป่วยในและผู้ป่วยนอกอาจแตกต่างกันในหลาย ๆ ด้านไม่เพียง แต่ในความชุกเพียงอย่างเดียวดังนั้นปัจจัยอื่น ๆ ที่อาจมีผลต่อความไว ดังนั้นฉันยอมรับว่าพวกเขาอาจเปลี่ยนแปลงระหว่างชุดข้อมูลที่แตกต่างกันซึ่งแตกต่างกันไปในความชุก แต่การเปลี่ยนแปลงจะไม่เป็นหน้าที่ของความชุกตัวเอง (ดังที่@gungแสดงในคำตอบของเขา)

พี(การทดสอบเชิงบวก|เงื่อนไข)

พี(เงื่อนไข|การทดสอบเชิงบวก)αพี(การทดสอบเชิงบวก|เงื่อนไข)×พี(เงื่อนไข)

และในหลายกรณีนี่คือความน่าจะเป็นที่ผู้คนให้ความสนใจ ("ผู้ป่วยที่มีผลการทดสอบในเชิงบวกน่าจะเป็นโรคนี้จริงหรือไม่") และขึ้นอยู่กับความชุก โปรดสังเกตว่าลิงก์ของคุณยังกล่าวถึงผลกระทบของความชุกชุมต่อค่าทำนายเชิงบวกเช่นความน่าจะเป็นด้านหลังไม่ใช่ความไว


ดังที่ฉันได้กล่าวถึงหนึ่งในคำตอบก่อนหน้านี้ฉันค่อนข้างแน่ใจว่าช่วงเวลาที่ไม่ได้สับสนกับความน่าจะเป็นหลังเนื่องจากพวกเขากล่าวถึงอย่างชัดเจนว่า "ข้อความจำนวนมากยังคงทำให้คำสั่งนี้" และฉันยังอ้างถึงแหล่งข้อมูลอื่นแม้ว่าจะไม่น่าเชื่อถือเท่ากับของแฮร์ริสันที่บอกว่ามันเป็น 'สมมติฐาน' ที่ปลอดภัย ทั้งหมดที่ฉันต้องการถามคือ 'สมมติฐาน' คืออะไร?
Polisetty

2
@Polisetty ฉันไม่สามารถพูดได้สำหรับผู้เขียน แต่จากอ้างพวกเขาดูเหมือนจะเรียกความเป็นอิสระในการแพร่หลาย "สมมติฐาน" แต่นี่เป็นความจริงทางคณิตศาสตร์แล้วสมมติฐาน ถ้ามันไม่ได้หมายความว่าทฤษฎีความน่าจะเป็นเสียและไม่ใช่
ทิม

ความไวและความจำเพาะสามารถพิจารณาคุณสมบัติคงที่ของการทดสอบการวินิจฉัย [นี่คือการทำให้เข้าใจง่ายเล็กน้อย แต่ก็ดีพอสำหรับวัตถุประสงค์ของเรา] - นั่นคือสิ่งที่มันบอกว่า
Polisetty

3

ดูคำตอบของฉันที่นี่เกี่ยวกับอัตราบวก / ลบจริง / เท็จ

ความไวเป็นเพียงชื่ออื่นสำหรับอัตราการบวกที่แท้จริงและความจำเพาะจะเหมือนกับอัตราการลบที่แท้จริง ทั้งความไวและความจำเพาะเป็นเงื่อนไขที่น่าจะเป็น; เงื่อนไขเกี่ยวกับสถานะโรคของผู้ป่วย ดังนั้นความชุกของโรค (เช่นความน่าจะเป็นเบื้องต้นที่ผู้ป่วยมีโรค) ไม่เกี่ยวข้องเนื่องจากคุณกำลังสมมติว่าเป็นโรคเฉพาะ

ฉันไม่สามารถออกความเห็นเกี่ยวกับสาเหตุที่ผู้เขียนตำราอ้างว่าความไวและความจำเพาะนั้นขึ้นอยู่กับบริบททางคลินิก ข้อสังเกตเชิงประจักษ์เหล่านี้หรือไม่


เผง ดังนั้นคำถาม ความไวของการทดสอบขึ้นอยู่กับจำนวนประชากรที่ใช้ สมมติฐานที่ว่ามันเป็นอิสระไม่จริงเสมอไป ฉันถามว่าอย่างไรและทำไม หนังสือเล่มนี้ก็เสนอราคาเช่นกัน
Polisetty

อาจมีปัจจัยเฉพาะประชากรที่มีผลต่อความไวและความจำเพาะ แต่มันตามมาจากคำจำกัดความทางคณิตศาสตร์ของความไวและความเฉพาะเจาะจงที่ความชุกไม่สามารถเป็นหนึ่งในปัจจัยเหล่านี้อย่างน้อยก็ไม่ได้โดยตรง (โดยวิธีการรู้สึกอิสระที่จะยอมรับคำตอบของฉันถ้าคุณพอใจกับคำอธิบายของฉันของคำจำกัดความทางคณิตศาสตร์.)
tddevlin

ขออภัยฉันเดาไม่ชัดเจน ฉันต้องการทราบความสัมพันธ์ระหว่างความไวและความชุกทางคณิตศาสตร์ ฉันรู้ว่ามันถูกนิยามอย่างไร ฉันเดาว่าความสัมพันธ์เข้ามาเพราะวิธีการคำนวณ ความไวคือ tp / (tp + fn) ในขณะที่ความชุกคือ tp + fn / (tp + fn + fp + tn)
Polisetty

P(โรค)P(+|โรค)

แฮร์ริสันคงไม่เข้าใจผิด แม้ลิงค์นี้จะเรียกว่าการทำให้เข้าใจง่าย med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm
Polisetty

1

แน่นอนฉันไม่สามารถพูดคุยกับความตั้งใจของผู้เขียน แต่นี่จะเป็นเหตุผลของฉันสำหรับคำสั่งที่:

พิจารณาบริบททางคลินิกเป็นการทดสอบวินิจฉัย หนึ่งที่มีความไวและความจำเพาะต่ำมากแต่การทดสอบก็ไม่มีน้อย หากคุณอยู่ในโรงพยาบาลคุณอาจป่วย หากคุณไม่ได้อยู่ในโรงพยาบาลคุณจะไม่ป่วย

จากมุมมองนี้การทดสอบการวินิจฉัยจริงที่คุณทำจริง ๆ แล้วเป็นส่วนที่สองของการทดสอบสองแบบที่ทำในซีเรียล


ในคำอธิบายของคุณนิรนัยกำลังเปลี่ยนไปซึ่งนำไปสู่ความน่าจะเป็นหลังใหญ่ขึ้น นั่นเป็นความจริง. แต่ความไวของตัวเองเปลี่ยนไปอย่างไรเป็นคำถาม
Polisetty

@Polisetty เกิดอะไรขึ้นถ้าคุณเรียกผู้ทดสอบรุ่นหลังสูง ๆ "บริบททางคลินิกเป็นการทดสอบเอง" ฉันคิดว่าการทดสอบใด ๆ ที่ตัดสินใจตามอำเภอใจสามารถขึ้นอยู่กับความชุกในลักษณะนี้ดังนั้น "การทดสอบ" จะต้องกำหนดไว้โดยเฉพาะ ฉันคิดว่าข้อความนี้ใช้กับการทดสอบที่หลากหลายตามเกณฑ์ของการวัดพร็อกซี
Satwik Pasani

1

นี่จะต้องเป็นความผิดพลาด ฉันคิดว่าบางทีผู้เขียนพยายามแนะนำว่าค่าทำนายผลบวกและลบ (PPV และ NPV) ขึ้นอยู่กับความชุก (เช่นเดียวกับความไวและความจำเพาะ) สิ่งเหล่านี้มักถูกกล่าวถึงด้วยการตรวจวินิจฉัยและอาจมีค่ามากกว่าการตีความความไวและความจำเพาะ

กราฟนี้แสดงให้เห็นถึงความสัมพันธ์ระหว่าง PPV และ NPV ด้วยความชุกสำหรับการทดสอบที่มีความไว 95% และความจำเพาะ 85%

จาก Mausner JS, Kramer S: Mausner และ Bahn ระบาดวิทยา: ข้อความเกริ่นนำ  ฟิลาเดลเฟียดับบลิวแซนเดอร์ 2528 พี.  221

จาก Mausner JS, Kramer S: Mausner และ Bahn ระบาดวิทยา: ข้อความเกริ่นนำ ฟิลาเดลเฟียดับบลิวแซนเดอร์ 2528 พี. 221


1

@Satwik, @gung และ @Tim ได้ให้รายละเอียดมากมาย แต่ฉันจะพยายามเพิ่มตัวอย่างเล็ก ๆ ของกรณีของปัจจัยพื้นฐานที่อาจทำให้เกิดผลกระทบดังกล่าว

หลักการสำคัญ: อคติ

ความไว / ความจำเพาะและการทดสอบทางสถิติทั้งหมดมีข้อแม้เหมือนกัน: ใช้เฉพาะกับการทำซ้ำขั้นตอนการสุ่มตัวอย่างแบบเดิมเหมือนในลักษณะที่ไม่เอนเอียง

โรงพยาบาลเป็นองค์กรที่ทำหน้าที่ออกแบบมาเพื่อทำการสุ่มตัวอย่างแบบลำเอียงโดยใช้นโยบายการรับสมัครเพื่อกรองประชากรทั่วไปลงในผู้ที่ต้องเข้ารับการรักษาและการรักษา นี่เป็นสิ่งที่ตรงกันข้ามกับกระบวนการทางวิทยาศาสตร์ หากคุณต้องการทราบว่าการทดสอบมีประสิทธิภาพอย่างไรในกลุ่มประชากรที่แตกต่างกันจำเป็นต้องมีการทดสอบในกลุ่มประชากรที่แตกต่างกัน

ผลแฝง: สหสัมพันธ์

มันเป็นของหายาก (หรือเป็นไปไม่ได้ในโลกแห่งความเป็นจริงถ้าคุณต้องการเข้มงวด) สำหรับการวินิจฉัยที่เป็นอิสระ / orthogonal กับปัจจัยเสี่ยงอื่น ๆ ทั้งหมดสำหรับโรคดังนั้นจึงมีความสัมพันธ์ในระดับหนึ่ง

หากหน้าจอสำหรับการเข้าโรงพยาบาลมีความสัมพันธ์เชิงบวกกับการวินิจฉัยสิ่งที่คุณจะพบคือคนที่ผ่านการทดสอบการรับสมัครนั้นมักจะชอบผลลัพธ์ที่เป็นบวกโดยการวินิจฉัยตามสัดส่วนที่สัมพันธ์กัน ดังนั้นผลบวกที่แท้จริงจะได้รับการทำให้ดีขึ้นและเชิงลบที่ผิดพลาดจะลดลงตามสัดส่วนกับความสัมพันธ์

สิ่งนี้ทำให้ความไวปรากฏมากขึ้น

คำอธิบายของปรากฏการณ์

การสังเกตว่าความไวอาจสูงกว่าในบริบทของโรงพยาบาลดังนั้นจึงไม่สมจริง ในความเป็นจริงหากนโยบายการรับสมัครเป็นความคิดที่ดีและเหมาะสมกับวัตถุประสงค์หนึ่งคาดว่าจะเกิดขึ้น

มันไม่ได้เป็นหลักฐานของการสลายในสมมติฐานที่ว่าความไวและความจำเพาะมีความชุกอิสระ แต่มันเป็นหลักฐานของการสุ่มตัวอย่างลำเอียงตามนโยบายการเข้าโรงพยาบาล

ซึ่งให้โรงพยาบาลอยู่ที่นั่นเพื่อรักษาผู้คนและไม่ทำการทดลองทางวิทยาศาสตร์เป็นสิ่งที่ดีแน่นอน

แต่มันทำให้นักวิทยาศาสตร์ปวดหัว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.