การทดสอบทางสถิติสำหรับค่าทำนายผลบวกและลบ


12

ฉันอ่านกระดาษและเห็นตารางเปรียบเทียบ PPV (Positive Predictive Value) กับ NPV (Negative Predictive Value) พวกเขาทำการทดสอบทางสถิติบางอย่างสำหรับพวกเขานี่เป็นภาพร่างของตาราง:

PPV    NPV    p-value
65.9   100    < 0.00001
...

ทุกแถวหมายถึงตารางฉุกเฉินเฉพาะ

พวกเขาทดสอบสมมติฐานอะไร ขอบคุณ!

คำตอบ:


17

สมมติว่ามีการจัดหมวดหมู่ไขว้เหมือนที่แสดงด้านล่าง (ที่นี่สำหรับเครื่องมือคัดกรอง)

ข้อความแสดงแทน

เราสามารถกำหนดสี่มาตรการของการคัดกรองความแม่นยำและพลังการทำนาย

  • ความไว (se), a / (a ​​+ c), คือความน่าจะเป็นของหน้าจอที่ให้ผลลัพธ์ที่เป็นบวกเมื่อโรคนั้นปรากฏ;
  • ความจำเพาะ (sp), d / (b + d), คือความน่าจะเป็นของหน้าจอที่ให้ผลลัพธ์เชิงลบเนื่องจากโรคขาดหายไป;
  • ค่าพยากรณ์เชิงบวก (PPV), a / (a ​​+ b), ความน่าจะเป็นของผู้ป่วยที่มีผลการทดสอบเป็นบวกที่ได้รับการวินิจฉัยอย่างถูกต้อง (เป็นบวก);
  • ค่าพยากรณ์เชิงลบ (NPV), d / (c + d), ความน่าจะเป็นของผู้ป่วยที่มีผลการทดสอบเชิงลบที่ได้รับการวินิจฉัยอย่างถูกต้อง (เป็นเชิงลบ)

แต่ละมาตรการสี่อย่างเป็นสัดส่วนอย่างง่ายที่คำนวณจากข้อมูลที่สังเกตได้ การทดสอบทางสถิติที่เหมาะสมจึงเป็นการทดสอบแบบทวินาม (แน่นอน)ซึ่งควรมีอยู่ในแพ็คเกจสถิติส่วนใหญ่หรือเครื่องคิดเลขออนไลน์จำนวนมาก สมมติฐานที่ทดสอบคือสัดส่วนที่สังเกตได้แตกต่างจาก 0.5 อย่างมีนัยสำคัญหรือไม่ อย่างไรก็ตามฉันพบว่าน่าสนใจมากกว่าที่จะให้ช่วงความมั่นใจมากกว่าการทดสอบนัยสำคัญเดียวเนื่องจากมันให้ข้อมูลเกี่ยวกับความแม่นยำของการวัด อย่างไรก็ตามสำหรับการทำซ้ำผลลัพธ์ที่คุณแสดงคุณจำเป็นต้องทราบระยะขอบทั้งหมดของตารางสองทางของคุณ (คุณให้ PPV และ NPV เป็น% เท่านั้น)

ตัวอย่างเช่นสมมติว่าเราสังเกตข้อมูลต่อไปนี้ (แบบสอบถาม CAGE เป็นแบบสอบถามคัดกรองแอลกอฮอล์):

ข้อความแสดงแทน

จากนั้นใน R PPV จะถูกคำนวณดังนี้:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

หากคุณใช้ SAS คุณสามารถดูได้ที่หมายเหตุการใช้งาน 24170: ฉันจะประมาณค่าความไวความจำเพาะค่าเชิงบวกและเชิงลบความน่าจะเป็นเชิงบวกและเชิงลบเท็จและอัตราส่วนความน่าจะเป็นได้อย่างไร .

p±1.96×p(1p)/np=0.9751α/2α=5

สำหรับการอ้างอิงเพิ่มเติมคุณสามารถดู

Newcombe, RG สองด้านช่วงความเชื่อมั่นสำหรับสัดส่วนเดี่ยว: การเปรียบเทียบเจ็ดวิธี สถิติทางการแพทย์ , 17, 857-872 (1998)


ขอบคุณ ตกลงฉันอ่านตอนต้นของกระดาษที่พวกเขาใช้การทดสอบ Chi-Square สำหรับตัวแปรเด็ดขาดทั้งหมด ตารางการจำแนกที่เขียนไม่ได้อ้างถึงตัวแปรโดยเฉพาะมันเป็นผลลัพธ์ของงานการจำแนกประเภท มันไม่ชัดเจนมาก! ตอนนี้ผมคิดว่าพวกเขาได้ทดสอบคลาสสิกในสัดส่วน .. บางที Chi-square ..
Simone

ฉันได้ดูคำถามนี้อีกครั้งและฉันได้เห็นว่า p-value ไม่ได้อ้างอิง PPV หรือ NPV เลยมันหมายถึงทั้งแถว ฉันคิดว่าการทดสอบที่พวกเขาควรเกี่ยวข้องกับตารางฉุกเฉินทั้งหมด
Simone

@Simone ดังนั้นถ้าฉันเข้าใจคุณอย่างถูกต้องคุณแนะนำให้ผู้เขียนให้ค่า PPV และ NPV แต่ให้ค่า p ที่สอดคล้องกับการทดสอบการเชื่อมโยงทั่วโลกของตาราง 2x2 หรือไม่ มันเกี่ยวข้องกับคำถามล่าสุดนี้stats.stackexchange.com/questions/9464/หรือไม่?
chl

ใช่มันจะเกี่ยวข้องกับคำถามนั้นถ้าค่า p ถูกเชื่อมโยงกับ PPV หรือ NPV และในกรณีนั้นคุณให้ทางออก การทดสอบตรงกับตาราง 2x2 ทั้งหมดฉันไม่เคยรู้เลยว่าเป็นแบบทดสอบประเภทใด!
Simone

1

โปรดมอง

Kosinski, Andrzej S. สถิติคะแนนทั่วไปแบบถ่วงน้ำหนักสำหรับการเปรียบเทียบค่าทำนายการทดสอบวินิจฉัย สถิติในการแพทย์http://dx.doi.org/10.1002/sim.5587 เผยแพร่ออนไลน์: 22 สิงหาคม 2012

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.