ในการประมวลผลภาพทางการแพทย์ผลงานที่ตีพิมพ์ส่วนใหญ่พยายามลดอัตราการบวกผิด ๆ (FPR) ในขณะที่ในความเป็นจริงการปฏิเสธเชิงลบนั้นมีอันตรายมากกว่าการปลอมแปลงบวก เหตุผลเบื้องหลังมันคืออะไร?
ในการประมวลผลภาพทางการแพทย์ผลงานที่ตีพิมพ์ส่วนใหญ่พยายามลดอัตราการบวกผิด ๆ (FPR) ในขณะที่ในความเป็นจริงการปฏิเสธเชิงลบนั้นมีอันตรายมากกว่าการปลอมแปลงบวก เหตุผลเบื้องหลังมันคืออะไร?
คำตอบ:
TL; DR: โรคเป็นของหายากดังนั้นจำนวนที่แน่นอนของผลบวกที่ผิดพลาดนั้นมีจำนวนมากกว่าเท็จเชิงลบ
สมมติว่าระบบของเรามีอัตราการบวกลบและเท็จที่ผิดพลาดเท่ากับ 1% (ค่อนข้างดี!) และเรากำลังตรวจพบมะเร็งชนิดใหม่ในปีนี้: 439.2 / 100,000 คนหรือ 0.5% ของประชากร [ แหล่งที่มา ]
ดังนั้นเราจะเห็นได้ว่าเรามีปัญหา: สำหรับทุกคนที่เป็นมะเร็งคนสองคนที่ไม่ได้เป็นมะเร็งด้วยการผ่าตัดแบบผ่าตัดเคมีบำบัดหรือรังสีบำบัด
สำหรับทุกคนที่ล้มเหลวในการตรวจพบมะเร็งปัจจุบันคนสองร้อยคนได้รับการรักษาที่เป็นอันตรายอย่างแข็งขันที่พวกเขาไม่ต้องการและไม่สามารถจ่ายได้จริง
คุณรู้เรื่องราวของเด็กชายผู้ร้องหมาป่าใช่มั้ย
มันเป็นความคิดเดียวกัน หลังจากตัวจําแนกบางตัวให้สัญญาณเตือนที่ผิดพลาด (ร้องให้หมาป่า) หลายครั้งเจ้าหน้าที่ทางการแพทย์จะปิดหรือเพิกเฉย
"โอ้นี่สิอีกครั้ง! NOPE!"
อย่างน้อยกับกลุ่มวิศวกรรมชีวภาพที่ฉันเคยทำงานด้วยการเน้นคือการลด FPR โดยเฉพาะเพราะเป้าหมายคือการสร้างเครื่องมือที่จะเตือนแพทย์ถึงพยาธิสภาพที่อาจเกิดขึ้นและพวกเขาบอกเราว่าพวกเขาจะไม่สนใจผลิตภัณฑ์ที่ร้องหมาป่า มากเกินไป
สำหรับผลิตภัณฑ์ที่ช่วยแพทย์เราต้องยื่นอุทธรณ์ต่อจิตวิทยาของพวกเขาแม้จะมีข้อโต้แย้งที่ถูกต้องตามกฎหมายที่หายไปจากหมาป่าในฟาร์มนั้นแย่กว่าการร้องไห้ด้วยหมาป่า
แก้ไข : การลดผลบวกปลอมมีข้อโต้แย้งที่ชอบด้วยกฎหมาย หากคอมพิวเตอร์ของคุณยังคงร้องไห้กับหมาป่าในขณะที่ได้รับผลบวกที่แน่นอนในบางโอกาส พวกเขาอยู่ในโรงพยาบาล แพทย์รู้ว่าผู้ป่วยอาจป่วย
สรุป:คำถามที่อาจจะไม่ได้ * ไม่ว่าจะเป็นหนึ่งลบเท็จเลวร้ายยิ่งกว่าหนึ่งการบวกที่ผิดพลาดหรืออาจเป็นได้มากกว่านั้นเช่นการยอมรับว่ามีการบวก 500 รายการที่เป็นเท็จหรือไม่
* ขึ้นอยู่กับแอปพลิเคชัน
ฉันขอขยายคำตอบของ @ Dragon:
การคัดกรองหมายความว่าเรากำลังมองหาโรคในประชากรที่มีสุขภาพดี ตามที่ @ Dragon อธิบายไว้สำหรับสิ่งเหล่านี้เราต้องการ FPR ที่ต่ำมาก (หรือความไวสูง) มิฉะนั้นเราจะจบลงด้วยผลบวกที่ผิดพลาดมากกว่าผลบวกที่แท้จริง เช่นค่าการทำนายเชิงบวก (# โรคที่แท้จริงในบรรดาการวิเคราะห์เชิงบวกทั้งหมด) จะต่ำอย่างไม่สามารถยอมรับได้
ความไว (TPR) และความจำเพาะ (TNR) นั้นง่ายต่อการวัดสำหรับระบบการวินิจฉัย: ใช้จำนวนของกรณีที่เป็นโรค (ไม่ใช่) จริงและวัดเศษส่วนของคนที่ตรวจพบอย่างถูกต้อง
OTOH ทั้งจากมุมมองของแพทย์และผู้ป่วยค่าการตรวจจะเพิ่มขึ้นเรื่อย ๆ พวกมันคือ "ผกผัน" ต่อความไวและความเฉพาะเจาะจงและบอกคุณในการคาดการณ์เชิงบวก (เชิงลบ) ทั้งหมดว่าเศษส่วนใดถูกต้อง กล่าวอีกนัยหนึ่งหลังจากการทดสอบบอกว่า "โรค" ความน่าจะเป็นที่ผู้ป่วยจะมีโรคนี้คืออะไร
เมื่อ @Dagon แสดงให้คุณเห็นเหตุการณ์ (หรือความชุกขึ้นอยู่กับการทดสอบที่เรากำลังพูดถึง) มีบทบาทสำคัญที่นี่ อุบัติการณ์อยู่ในระดับต่ำในการตรวจคัดกรอง / การวินิจฉัยโรคมะเร็งทุกชนิด
เพื่อแสดงให้เห็นสิ่งนี้การคัดกรองมะเร็งรังไข่สำหรับผู้หญิงวัยหมดประจำเดือนมีความชุกของ 0.04% ในประชากรทั่วไปและ 0.5% ในผู้หญิงที่มีความเสี่ยงสูงที่มีประวัติครอบครัวและ / หรือการกลายพันธุ์ที่รู้จักของยีนต้านมะเร็ง BRCA1 และ 2 [Buchen, L. มะเร็ง: ไม่มีเครื่องหมาย ธรรมชาติ, 2011, 471, 428-432]
ดังนั้นคำถามมักจะไม่ว่าการลบเชิงลบหนึ่งครั้งนั้นเลวร้ายยิ่งกว่าการบวกเท็จหนึ่งอัน แต่เฉพาะ 99% (1% FPR) และความไว 95% (ตัวเลขที่นำมาจากกระดาษที่เชื่อมโยงด้านบน) นั้นหมายถึง .
โปรดทราบว่าการวินิจฉัยโรคมะเร็งตั้งแต่ระยะเริ่มต้นในตัวเองนั้นไม่ใช่วิธีการรักษาโรคมะเร็งที่วิเศษ เช่นการตรวจคัดกรองมะเร็งเต้านมเต้านมเพียง 3-13% ของจริงผู้ป่วยที่เป็นบวกจริงได้รับประโยชน์จากการตรวจคัดกรอง
ดังนั้นเราจึงต้องจับตาดูจำนวนผลบวกปลอมสำหรับผู้ป่วยแต่ละรายที่ได้รับผลประโยชน์ เช่นการตรวจเต้านมพร้อมตัวเลขเหล่านี้เราคาดเดาได้ยากว่าเรามีที่ไหนสักแห่งในช่วง 400 - 1800 ผลบวกปลอมต่อการได้รับผลบวกที่แท้จริง (กลุ่มอายุ 39 - 49 ปี)
ด้วยการบวกเท็จหลายร้อยต่อการลบเชิงลบ (และอาจจะหลายร้อยหรือหลายพันของการบวกเท็จต่อผู้ป่วยที่ได้รับประโยชน์จากการตรวจคัดกรอง) สถานการณ์ไม่ชัดเจนเท่ากับ "เป็นมะเร็งพลาดหนึ่งเลวร้ายยิ่งกว่าการวินิจฉัยมะเร็งบวกเท็จหนึ่ง" มีผลกระทบตั้งแต่จิตวิทยาและจิต - โซมาติก (กังวลว่าคุณเป็นมะเร็งในตัวเองไม่แข็งแรง) ถึงความเสี่ยงทางกายภาพของการวินิจฉัยติดตามเช่นการตรวจชิ้นเนื้อ (ซึ่งเป็นการผ่าตัดขนาดเล็กและมาพร้อมกับของตัวเอง ความเสี่ยง)
แม้ว่าผลกระทบของผลบวกปลอมหนึ่งตัวจะมีขนาดเล็กความเสี่ยงที่เกี่ยวข้องอาจเพิ่มขึ้นอย่างมากหากพิจารณาผลบวกที่ผิดพลาดหลายร้อยรายการ
การอ่านที่แนะนำ: Gerd Gigerenzer: ความเสี่ยง: วิธีการตัดสินใจที่ดี (2014)
อย่างไรก็ตามสิ่งที่ PPV และ NPV ต้องการสำหรับการทดสอบวินิจฉัยนั้นมีประโยชน์นั้นขึ้นอยู่กับแอปพลิเคชันเป็นอย่างมาก
ตามที่ได้อธิบายไว้ในการคัดกรองเพื่อตรวจหามะเร็งระยะเริ่มต้นนั้นมักจะมุ่งเน้นไปที่ PPV นั่นคือการทำให้แน่ใจว่าคุณไม่ได้รับอันตรายมากเกินไปจากการปฏิเสธเชิงลบ: การค้นหาเศษส่วนที่มีขนาดใหญ่มาก สภาพที่เป็นอยู่โดยไม่มีการตรวจคัดกรอง
OTOH การทดสอบเอชไอวีในการบริจาคเลือดมุ่งเน้นที่ NPV เป็นอันดับแรก (เช่นทำให้แน่ใจว่าเลือดปลอดจากเอชไอวี) ถึงกระนั้นในขั้นตอนที่ 2 (และ 3) ผลบวกปลอมจะถูกลดลงโดยการทดสอบเพิ่มเติมก่อนที่จะกังวลคนที่มีผลการตรวจ HIV ที่เป็นบวก (เท็จ)
ท้ายสุด แต่ไม่ท้ายสุดยังมีแอปพลิเคชันทดสอบทางการแพทย์ที่มีอุบัติการณ์หรือความชุกไม่มากเท่าที่ควรในการคัดกรองประชากรที่มีความเสี่ยงสูงโดยเฉพาะอย่างยิ่งเช่นการวินิจฉัยที่แตกต่างกัน
จากมุมมองส่วนบุคคลมากกว่าประสบการณ์ด้านข้อมูลเชิงบวกเท็จบวกมีผลกระทบต่อคุณภาพชีวิตของผู้ป่วยมากกว่าลบเท็จ (อย่างน้อยในการใช้งานส่วนใหญ่ของการประมวลผลภาพทางการแพทย์เราไม่ได้พูดถึงผลการทดลองที่นี่) .
ดู Let 's ที่ตัวอย่างที่เป็นรูปธรรม: การตรวจคัดกรองเนื้องอก
ข้อผิดพลาดเชิงลบหมายถึงเนื้องอกในระยะเริ่มแรกมีเวลามากขึ้นในการเติบโตและพัฒนาเป็นมะเร็งที่เป็นอันตราย โดยรวมแล้วกระบวนการนี้ใช้เวลานานและการตรวจคัดกรองแต่ละครั้งนั้นมีโอกาสสูงที่จะตรวจพบ แต่ในระยะยาวผู้ป่วยจะมีสุขภาพที่ดี
นอกจากนี้ยังมีมนุษย์ที่เกี่ยวข้องในการวินิจฉัยอยู่เสมอ การประมวลผลภาพทางการแพทย์ในขั้นตอนเทคโนโลยีมันในปัจจุบันจะหมายถึงการจะเป็นความช่วยเหลือสำหรับ personell ทางการแพทย์ไม่ได้ใช้แทน มันมักจะหมายถึงการชี้รอยโรคหรือการเปลี่ยนแปลงในเนื้อเยื่อที่บอบบางจนมนุษย์อาจมองข้ามพวกเขา ไม่มีโอกาสที่แพทย์จะมองข้ามเนื้องอกระยะลุกลาม พวกเขาไม่ต้องการการประมวลผลภาพสำหรับสิ่งนั้น
ในแง่ของวิธีการทางการแพทย์ถ้าเนื้องอกไม่สามารถใช้การไม่ได้ก่อนการตรวจคัดกรองครั้งต่อไปไม่มีความแตกต่างอย่างใหญ่หลวงระหว่างการเอาเนื้องอกระยะเริ่มต้นหรือเนื้องอกที่มีเวลาเติบโตเพิ่มขึ้นเล็กน้อย ปริมาณของเนื้อเยื่อที่ถูกกำจัดออกไปนั้นมีมากขึ้น แต่ชนิดของการผ่าตัดมักจะเหมือนกัน (สิ่งนี้ถือว่าผู้ป่วยทำการตรวจสุขภาพเป็นประจำ)
ผลบวกปลอมมีหลายนัยที่ไม่เกี่ยวข้องโดยตรงกับความเจ็บป่วย:
การประเมินความเสี่ยงและผลประโยชน์แสดงให้เห็นว่าการลบที่ผิดพลาดนั้นมีความเสี่ยงน้อยกว่าผู้ป่วยที่เป็นบวก ดังนั้นลำดับความสำคัญของการลดผลบวกปลอมมักสูง
เวลาของแพทย์มีค่า
จากภายในสาขาการแพทย์แพทย์มักจะมีความเจ็บป่วยที่หลากหลายเพื่อพยายามตรวจสอบและวินิจฉัยและนี่คือกระบวนการที่ใช้เวลานาน เครื่องมือที่แสดงผลบวกที่ผิดพลาด (แม้ว่าในอัตราที่ต่ำ) จะมีประโยชน์น้อยกว่าเพราะไม่สามารถไว้ใจการวินิจฉัยนั้นได้ซึ่งหมายถึงทุกครั้งที่ทำการวินิจฉัยนั้นจะต้องมีการตรวจสอบ คิดว่ามันเหมือน WebMD ของซอฟต์แวร์ - ทุกอย่างเป็นสัญญาณของโรคมะเร็ง!
เครื่องมือที่นำเสนอเชิงลบที่เป็นเท็จ แต่มักจะแสดงผลบวกที่แท้จริงมีประโยชน์มากกว่าเนื่องจากแพทย์ไม่ต้องเสียเวลาในการตรวจสอบซ้ำหรือคาดเดาการวินิจฉัยครั้งที่สอง หากทำเครื่องหมายว่ามีคนป่วยด้วยการวินิจฉัยโรคเฉพาะงานที่ทำ หากไม่เป็นเช่นนั้นคนที่ไม่ได้เน้นว่าป่วยจะได้รับการทดสอบเพิ่มเติม
มันจะดีกว่าถ้ามีเครื่องมือที่สามารถระบุอาการของโรคได้อย่างแม่นยำกว่าเครื่องมือที่อาจทำให้หลายลักษณะ
False Positive Rate (FPR) หรือที่เรียกว่า False alarm rate (FAR); อัตราการบวกที่ผิดพลาดมากสามารถสร้างประสิทธิภาพที่ไม่ดีของระบบตรวจจับภาพทางการแพทย์ ผลบวกปลอมคือที่ที่คุณได้รับผลบวกสำหรับการทดสอบเมื่อคุณควรได้รับผลลัพธ์เชิงลบ ตัวอย่างเช่นการทดสอบการตั้งครรภ์เป็นบวกเมื่อในความเป็นจริงคนไม่ได้ตั้งครรภ์
ในทุกโอกาสทุกคนในหัวข้อนี้รู้อยู่แล้วว่านี่เป็นปัญหาที่เป็นแกนหลักของการวิเคราะห์แบบเบย์ เพียงเพื่อประโยชน์ของผู้แสวงบุญในอนาคตที่อาจคิดในแง่บวกว่าเป็นปัญหาทางรังสีวิทยาฉันหวังว่าความคิดเห็นนี้จะให้มุมมองที่กว้างกว่า