ทำไมผลงานตีพิมพ์ส่วนใหญ่ในการถ่ายภาพทางการแพทย์จึงพยายามลดผลบวกปลอม?


20

ในการประมวลผลภาพทางการแพทย์ผลงานที่ตีพิมพ์ส่วนใหญ่พยายามลดอัตราการบวกผิด ๆ (FPR) ในขณะที่ในความเป็นจริงการปฏิเสธเชิงลบนั้นมีอันตรายมากกว่าการปลอมแปลงบวก เหตุผลเบื้องหลังมันคืออะไร?


1
จากมุมมองของen.wikipedia.org/wiki/Primum_non_nocereผลบวกที่ผิดพลาดอาจถูกพิจารณาว่าเป็นความล้มเหลวที่อันตรายยิ่งกว่าเดิมก่อนที่จะพิจารณาถึงความแตกต่างของจำนวนสัมบูรณ์ที่ Dragon ชี้ให้เห็นอย่างถูกต้อง
jpa

คำตอบ:


29

TL; DR: โรคเป็นของหายากดังนั้นจำนวนที่แน่นอนของผลบวกที่ผิดพลาดนั้นมีจำนวนมากกว่าเท็จเชิงลบ

สมมติว่าระบบของเรามีอัตราการบวกลบและเท็จที่ผิดพลาดเท่ากับ 1% (ค่อนข้างดี!) และเรากำลังตรวจพบมะเร็งชนิดใหม่ในปีนี้: 439.2 / 100,000 คนหรือ 0.5% ของประชากร [ แหล่งที่มา ]

  • ไม่มีมะเร็งไม่มีการตรวจจับ: 99.5% x 99% = 98.5% (98.505%)
  • ไม่มีมะเร็งการตรวจจับ: 99.5% x 1% = 1.0% (0.995%)
  • มะเร็งการตรวจจับ: 0.5% x 99% = 0.5% (0.495%)
  • มะเร็งไม่มีการตรวจจับ: 0.5% x 1% = 0.005%

ดังนั้นเราจะเห็นได้ว่าเรามีปัญหา: สำหรับทุกคนที่เป็นมะเร็งคนสองคนที่ไม่ได้เป็นมะเร็งด้วยการผ่าตัดแบบผ่าตัดเคมีบำบัดหรือรังสีบำบัด

สำหรับทุกคนที่ล้มเหลวในการตรวจพบมะเร็งปัจจุบันคนสองร้อยคนได้รับการรักษาที่เป็นอันตรายอย่างแข็งขันที่พวกเขาไม่ต้องการและไม่สามารถจ่ายได้จริง


1
สำหรับการตรวจคัดกรองจำนวนมากอัตราการเกิด (ไม่มีโรคที่วินิจฉัยใหม่ต่อประชากร 100,000 คน) นั้นต่ำกว่าจริง: 0.5% เป็นอัตราการเกิดมะเร็งโดยรวม
cbeleites รองรับโมนิก้า

6
@cbeleites เพื่อเป็นตัวอย่างที่ชัดเจน adenocarcinoma ตับอ่อนเกือบจะตายเพราะมันไม่มีอาการจนกว่าจะถึงขั้นสูง หากคุณใช้การทดสอบแบบคัดกรองที่มีอัตราการติดลบ 1% เท็จ / 1% เท็จกับประชากรทั้งหมดของสหรัฐอเมริกาคุณจะระบุผู้ป่วยประมาณสามล้านคนซึ่งมีมะเร็งเพียง 46,000 คนเท่านั้นที่ให้ผลบวก มูลค่าการทำนายเพียง 1.5%
ทำเครื่องหมาย

2
สำหรับการถ่ายภาพทางการแพทย์(fMRI เป็นต้น) ปัญหาอาจเกิดจากความจริงที่ว่าภาพเดียวประกอบด้วย "voxels" จำนวนมากการเปิดใช้งานของแต่ละภาพซึ่งถือเป็นสมมติฐาน - ดูตัวอย่างZen และ Art of Comparisons หลายรายการ - ฉันคิดว่านี่อาจเป็นสิ่งที่ OP อ้างถึง
steeldriver

16

คุณรู้เรื่องราวของเด็กชายผู้ร้องหมาป่าใช่มั้ย

มันเป็นความคิดเดียวกัน หลังจากตัวจําแนกบางตัวให้สัญญาณเตือนที่ผิดพลาด (ร้องให้หมาป่า) หลายครั้งเจ้าหน้าที่ทางการแพทย์จะปิดหรือเพิกเฉย

"โอ้นี่สิอีกครั้ง! NOPE!"

อย่างน้อยกับกลุ่มวิศวกรรมชีวภาพที่ฉันเคยทำงานด้วยการเน้นคือการลด FPR โดยเฉพาะเพราะเป้าหมายคือการสร้างเครื่องมือที่จะเตือนแพทย์ถึงพยาธิสภาพที่อาจเกิดขึ้นและพวกเขาบอกเราว่าพวกเขาจะไม่สนใจผลิตภัณฑ์ที่ร้องหมาป่า มากเกินไป

สำหรับผลิตภัณฑ์ที่ช่วยแพทย์เราต้องยื่นอุทธรณ์ต่อจิตวิทยาของพวกเขาแม้จะมีข้อโต้แย้งที่ถูกต้องตามกฎหมายที่หายไปจากหมาป่าในฟาร์มนั้นแย่กว่าการร้องไห้ด้วยหมาป่า

แก้ไข : การลดผลบวกปลอมมีข้อโต้แย้งที่ชอบด้วยกฎหมาย หากคอมพิวเตอร์ของคุณยังคงร้องไห้กับหมาป่าในขณะที่ได้รับผลบวกที่แน่นอนในบางโอกาส พวกเขาอยู่ในโรงพยาบาล แพทย์รู้ว่าผู้ป่วยอาจป่วย


7

สรุป:คำถามที่อาจจะไม่ได้ * ไม่ว่าจะเป็นหนึ่งลบเท็จเลวร้ายยิ่งกว่าหนึ่งการบวกที่ผิดพลาดหรืออาจเป็นได้มากกว่านั้นเช่นการยอมรับว่ามีการบวก 500 รายการที่เป็นเท็จหรือไม่

* ขึ้นอยู่กับแอปพลิเคชัน


ฉันขอขยายคำตอบของ @ Dragon:

  • การคัดกรองหมายความว่าเรากำลังมองหาโรคในประชากรที่มีสุขภาพดี ตามที่ @ Dragon อธิบายไว้สำหรับสิ่งเหล่านี้เราต้องการ FPR ที่ต่ำมาก (หรือความไวสูง) มิฉะนั้นเราจะจบลงด้วยผลบวกที่ผิดพลาดมากกว่าผลบวกที่แท้จริง เช่นค่าการทำนายเชิงบวก (# โรคที่แท้จริงในบรรดาการวิเคราะห์เชิงบวกทั้งหมด) จะต่ำอย่างไม่สามารถยอมรับได้

  • ความไว (TPR) และความจำเพาะ (TNR) นั้นง่ายต่อการวัดสำหรับระบบการวินิจฉัย: ใช้จำนวนของกรณีที่เป็นโรค (ไม่ใช่) จริงและวัดเศษส่วนของคนที่ตรวจพบอย่างถูกต้อง

  • OTOH ทั้งจากมุมมองของแพทย์และผู้ป่วยค่าการตรวจจะเพิ่มขึ้นเรื่อย ๆ พวกมันคือ "ผกผัน" ต่อความไวและความเฉพาะเจาะจงและบอกคุณในการคาดการณ์เชิงบวก (เชิงลบ) ทั้งหมดว่าเศษส่วนใดถูกต้อง กล่าวอีกนัยหนึ่งหลังจากการทดสอบบอกว่า "โรค" ความน่าจะเป็นที่ผู้ป่วยจะมีโรคนี้คืออะไร

  • เมื่อ @Dagon แสดงให้คุณเห็นเหตุการณ์ (หรือความชุกขึ้นอยู่กับการทดสอบที่เรากำลังพูดถึง) มีบทบาทสำคัญที่นี่ อุบัติการณ์อยู่ในระดับต่ำในการตรวจคัดกรอง / การวินิจฉัยโรคมะเร็งทุกชนิด
    เพื่อแสดงให้เห็นสิ่งนี้การคัดกรองมะเร็งรังไข่สำหรับผู้หญิงวัยหมดประจำเดือนมีความชุกของ 0.04% ในประชากรทั่วไปและ 0.5% ในผู้หญิงที่มีความเสี่ยงสูงที่มีประวัติครอบครัวและ / หรือการกลายพันธุ์ที่รู้จักของยีนต้านมะเร็ง BRCA1 และ 2 [Buchen, L. มะเร็ง: ไม่มีเครื่องหมาย ธรรมชาติ, 2011, 471, 428-432]

  • ดังนั้นคำถามมักจะไม่ว่าการลบเชิงลบหนึ่งครั้งนั้นเลวร้ายยิ่งกว่าการบวกเท็จหนึ่งอัน แต่เฉพาะ 99% (1% FPR) และความไว 95% (ตัวเลขที่นำมาจากกระดาษที่เชื่อมโยงด้านบน) นั้นหมายถึง .

  • โปรดทราบว่าการวินิจฉัยโรคมะเร็งตั้งแต่ระยะเริ่มต้นในตัวเองนั้นไม่ใช่วิธีการรักษาโรคมะเร็งที่วิเศษ เช่นการตรวจคัดกรองมะเร็งเต้านมเต้านมเพียง 3-13% ของจริงผู้ป่วยที่เป็นบวกจริงได้รับประโยชน์จากการตรวจคัดกรอง
    ดังนั้นเราจึงต้องจับตาดูจำนวนผลบวกปลอมสำหรับผู้ป่วยแต่ละรายที่ได้รับผลประโยชน์ เช่นการตรวจเต้านมพร้อมตัวเลขเหล่านี้เราคาดเดาได้ยากว่าเรามีที่ไหนสักแห่งในช่วง 400 - 1800 ผลบวกปลอมต่อการได้รับผลบวกที่แท้จริง (กลุ่มอายุ 39 - 49 ปี)

  • ด้วยการบวกเท็จหลายร้อยต่อการลบเชิงลบ (และอาจจะหลายร้อยหรือหลายพันของการบวกเท็จต่อผู้ป่วยที่ได้รับประโยชน์จากการตรวจคัดกรอง) สถานการณ์ไม่ชัดเจนเท่ากับ "เป็นมะเร็งพลาดหนึ่งเลวร้ายยิ่งกว่าการวินิจฉัยมะเร็งบวกเท็จหนึ่ง" มีผลกระทบตั้งแต่จิตวิทยาและจิต - โซมาติก (กังวลว่าคุณเป็นมะเร็งในตัวเองไม่แข็งแรง) ถึงความเสี่ยงทางกายภาพของการวินิจฉัยติดตามเช่นการตรวจชิ้นเนื้อ (ซึ่งเป็นการผ่าตัดขนาดเล็กและมาพร้อมกับของตัวเอง ความเสี่ยง)
    แม้ว่าผลกระทบของผลบวกปลอมหนึ่งตัวจะมีขนาดเล็กความเสี่ยงที่เกี่ยวข้องอาจเพิ่มขึ้นอย่างมากหากพิจารณาผลบวกที่ผิดพลาดหลายร้อยรายการ

    การอ่านที่แนะนำ: Gerd Gigerenzer: ความเสี่ยง: วิธีการตัดสินใจที่ดี (2014)

  • อย่างไรก็ตามสิ่งที่ PPV และ NPV ต้องการสำหรับการทดสอบวินิจฉัยนั้นมีประโยชน์นั้นขึ้นอยู่กับแอปพลิเคชันเป็นอย่างมาก
    ตามที่ได้อธิบายไว้ในการคัดกรองเพื่อตรวจหามะเร็งระยะเริ่มต้นนั้นมักจะมุ่งเน้นไปที่ PPV นั่นคือการทำให้แน่ใจว่าคุณไม่ได้รับอันตรายมากเกินไปจากการปฏิเสธเชิงลบ: การค้นหาเศษส่วนที่มีขนาดใหญ่มาก สภาพที่เป็นอยู่โดยไม่มีการตรวจคัดกรอง
    OTOH การทดสอบเอชไอวีในการบริจาคเลือดมุ่งเน้นที่ NPV เป็นอันดับแรก (เช่นทำให้แน่ใจว่าเลือดปลอดจากเอชไอวี) ถึงกระนั้นในขั้นตอนที่ 2 (และ 3) ผลบวกปลอมจะถูกลดลงโดยการทดสอบเพิ่มเติมก่อนที่จะกังวลคนที่มีผลการตรวจ HIV ที่เป็นบวก (เท็จ)

  • ท้ายสุด แต่ไม่ท้ายสุดยังมีแอปพลิเคชันทดสอบทางการแพทย์ที่มีอุบัติการณ์หรือความชุกไม่มากเท่าที่ควรในการคัดกรองประชากรที่มีความเสี่ยงสูงโดยเฉพาะอย่างยิ่งเช่นการวินิจฉัยที่แตกต่างกัน


1
นี่เป็นความหนาแน่นเล็กน้อย สามารถใช้การจัดรูปแบบใหม่เพื่อให้อ่านง่ายขึ้น ดูเหมือนคำตอบที่ดี แต่ยากที่จะขุดลงไปโดยไม่ต้องใช้เวลามาก
บ๊อบ

3

จากมุมมองส่วนบุคคลมากกว่าประสบการณ์ด้านข้อมูลเชิงบวกเท็จบวกมีผลกระทบต่อคุณภาพชีวิตของผู้ป่วยมากกว่าลบเท็จ (อย่างน้อยในการใช้งานส่วนใหญ่ของการประมวลผลภาพทางการแพทย์เราไม่ได้พูดถึงผลการทดลองที่นี่) .

ดู Let 's ที่ตัวอย่างที่เป็นรูปธรรม: การตรวจคัดกรองเนื้องอก

ข้อผิดพลาดเชิงลบหมายถึงเนื้องอกในระยะเริ่มแรกมีเวลามากขึ้นในการเติบโตและพัฒนาเป็นมะเร็งที่เป็นอันตราย โดยรวมแล้วกระบวนการนี้ใช้เวลานานและการตรวจคัดกรองแต่ละครั้งนั้นมีโอกาสสูงที่จะตรวจพบ แต่ในระยะยาวผู้ป่วยจะมีสุขภาพที่ดี

นอกจากนี้ยังมีมนุษย์ที่เกี่ยวข้องในการวินิจฉัยอยู่เสมอ การประมวลผลภาพทางการแพทย์ในขั้นตอนเทคโนโลยีมันในปัจจุบันจะหมายถึงการจะเป็นความช่วยเหลือสำหรับ personell ทางการแพทย์ไม่ได้ใช้แทน มันมักจะหมายถึงการชี้รอยโรคหรือการเปลี่ยนแปลงในเนื้อเยื่อที่บอบบางจนมนุษย์อาจมองข้ามพวกเขา ไม่มีโอกาสที่แพทย์จะมองข้ามเนื้องอกระยะลุกลาม พวกเขาไม่ต้องการการประมวลผลภาพสำหรับสิ่งนั้น

ในแง่ของวิธีการทางการแพทย์ถ้าเนื้องอกไม่สามารถใช้การไม่ได้ก่อนการตรวจคัดกรองครั้งต่อไปไม่มีความแตกต่างอย่างใหญ่หลวงระหว่างการเอาเนื้องอกระยะเริ่มต้นหรือเนื้องอกที่มีเวลาเติบโตเพิ่มขึ้นเล็กน้อย ปริมาณของเนื้อเยื่อที่ถูกกำจัดออกไปนั้นมีมากขึ้น แต่ชนิดของการผ่าตัดมักจะเหมือนกัน (สิ่งนี้ถือว่าผู้ป่วยทำการตรวจสุขภาพเป็นประจำ)

ผลบวกปลอมมีหลายนัยที่ไม่เกี่ยวข้องโดยตรงกับความเจ็บป่วย:

  • ขั้นตอนเพิ่มเติม หลังจากกระบวนการถ่ายภาพให้ผลลัพธ์ที่เป็นบวกจะมีการทดสอบเพิ่มเติมสำหรับการสกัดเลือดหรือเนื้อเยื่อ (การตรวจชิ้นเนื้อ) การพูดวัตถุของผู้ป่วยอย่างเป็นกลางเพื่อให้สามารถตรวจสอบผลลัพธ์การถ่ายภาพได้
  • กลัว. การทดสอบในห้องปฏิบัติการต้องใช้เวลา บุคคลที่ได้รับผลกระทบมักอาศัยอยู่เป็นเวลาหลายวันหรือบางครั้งหลายสัปดาห์ที่มีสภาพอากาศไม่แน่นอนหรือไม่ใช่แผลจริง ๆ แล้วเป็นมะเร็ง หลายคนที่เคยมีประสบการณ์เชิงบวกที่ผิด ๆ อธิบายเหตุการณ์นี้ว่าเป็น "ความเจ็บปวด" และประสบกับความวิตกกังวลทางสุขภาพเป็นเวลานาน
  • เวลาลงทุน หากการตรวจสอบผลการถ่ายภาพด้วยการทดสอบในห้องปฏิบัติการหรือการทดสอบที่คล้ายกันนั้นต้องใช้เวลาหลายครั้งในการตรวจผู้ป่วยและแพทย์ต้องใช้เวลา แม้ว่าจะใช้การทดสอบเพียงครั้งเดียว แต่ก็มีหลายคนที่เกี่ยวข้องรวมถึงพยาบาลแพทย์และช่างเทคนิคในห้องปฏิบัติการ ในช่วงเวลาที่แพทย์ทำงานหนักเกินไปควรหลีกเลี่ยงหากเป็นไปได้
  • ยาที่ไม่จำเป็น ในกรณีที่เลวร้ายที่สุดผู้ป่วยจะได้รับการรักษาโรคที่พวกเขาไม่ได้มีและร่างกายของพวกเขาจะอยู่ภายใต้ความเครียดที่ไม่จำเป็นโดยผลข้างเคียงของยา
  • การสูญเสียผลกระทบ บุคลากรทางการแพทย์จะเพิกเฉยต่อผลบวกที่แท้จริงหากกระบวนการให้ผลบวกปลอมมากเกินไป (ดังที่อธิบายไว้ในคำตอบอื่น ๆ )

การประเมินความเสี่ยงและผลประโยชน์แสดงให้เห็นว่าการลบที่ผิดพลาดนั้นมีความเสี่ยงน้อยกว่าผู้ป่วยที่เป็นบวก ดังนั้นลำดับความสำคัญของการลดผลบวกปลอมมักสูง


1

เวลาของแพทย์มีค่า

จากภายในสาขาการแพทย์แพทย์มักจะมีความเจ็บป่วยที่หลากหลายเพื่อพยายามตรวจสอบและวินิจฉัยและนี่คือกระบวนการที่ใช้เวลานาน เครื่องมือที่แสดงผลบวกที่ผิดพลาด (แม้ว่าในอัตราที่ต่ำ) จะมีประโยชน์น้อยกว่าเพราะไม่สามารถไว้ใจการวินิจฉัยนั้นได้ซึ่งหมายถึงทุกครั้งที่ทำการวินิจฉัยนั้นจะต้องมีการตรวจสอบ คิดว่ามันเหมือน WebMD ของซอฟต์แวร์ - ทุกอย่างเป็นสัญญาณของโรคมะเร็ง!

เครื่องมือที่นำเสนอเชิงลบที่เป็นเท็จ แต่มักจะแสดงผลบวกที่แท้จริงมีประโยชน์มากกว่าเนื่องจากแพทย์ไม่ต้องเสียเวลาในการตรวจสอบซ้ำหรือคาดเดาการวินิจฉัยครั้งที่สอง หากทำเครื่องหมายว่ามีคนป่วยด้วยการวินิจฉัยโรคเฉพาะงานที่ทำ หากไม่เป็นเช่นนั้นคนที่ไม่ได้เน้นว่าป่วยจะได้รับการทดสอบเพิ่มเติม

มันจะดีกว่าถ้ามีเครื่องมือที่สามารถระบุอาการของโรคได้อย่างแม่นยำกว่าเครื่องมือที่อาจทำให้หลายลักษณะ


0

False Positive Rate (FPR) หรือที่เรียกว่า False alarm rate (FAR); อัตราการบวกที่ผิดพลาดมากสามารถสร้างประสิทธิภาพที่ไม่ดีของระบบตรวจจับภาพทางการแพทย์ ผลบวกปลอมคือที่ที่คุณได้รับผลบวกสำหรับการทดสอบเมื่อคุณควรได้รับผลลัพธ์เชิงลบ ตัวอย่างเช่นการทดสอบการตั้งครรภ์เป็นบวกเมื่อในความเป็นจริงคนไม่ได้ตั้งครรภ์


4
นี่ไม่ใช่การตอบคำถาม OP ไม่ได้ถามความหมายเชิงบวกที่ผิด แต่ทำไมมันถึงมีความสำคัญมากกว่าการปฏิเสธเชิงลบ
Llewellyn

0

ในทุกโอกาสทุกคนในหัวข้อนี้รู้อยู่แล้วว่านี่เป็นปัญหาที่เป็นแกนหลักของการวิเคราะห์แบบเบย์ เพียงเพื่อประโยชน์ของผู้แสวงบุญในอนาคตที่อาจคิดในแง่บวกว่าเป็นปัญหาทางรังสีวิทยาฉันหวังว่าความคิดเห็นนี้จะให้มุมมองที่กว้างกว่า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.