การตีความทฤษฎีบท Bayes นำไปใช้กับผลลัพธ์การตรวจเต้านมในเชิงบวก


11

ฉันพยายามที่จะคลุมศีรษะของฉันรอบ ๆ ผลลัพธ์ของทฤษฎีบทของเบย์ที่ใช้กับตัวอย่างแมมโมแกรมแบบคลาสสิกโดยการบิดของแมมโมแกรมนั้นสมบูรณ์แบบ

นั่นคือ,

อุบัติการณ์ของมะเร็ง: .01

ความน่าจะเป็นของการตรวจด้วยคลื่นบวกด้วยการให้ผู้ป่วยเป็นมะเร็ง: 1

ความน่าจะเป็นของการตรวจคัดกรองด้วยวิธีทางบวกเนื่องจากผู้ป่วยไม่มีมะเร็ง: .01

โดย Bayes:

P (มะเร็ง | mammogram +) = 1.01(1.01)+(0.091.99)

=0.5025

ดังนั้นถ้าคนที่สุ่มจากประชากรใช้แมมโมแกรมและรับผลบวกมีโอกาส 50% ที่พวกเขาเป็นมะเร็งหรือไม่? ฉันไม่สามารถเข้าใจได้โดยสัญชาตญาณว่าโอกาส 1% เล็กน้อยของการบวกที่ผิดพลาดใน 1% ของประชากรสามารถกระตุ้นผลลัพธ์ 50% ได้อย่างไร อย่างมีเหตุผลฉันคิดว่าการคัดกรองเชิงบวกอย่างแท้จริงที่มีอัตราบวกผิดพลาดเล็กน้อยจะแม่นยำยิ่งขึ้น


2
อัตราบวกผิด ๆ ไม่ได้อยู่ที่ 1% แต่เป็น 99% ของประชากร นั่นเป็นเหตุผลที่คุณได้รับความน่าจะเป็นที่อาจต่ำเพราะความน่าจะเป็นก่อนสูงมากที่มีคนแข็งแรง โปรดจำไว้ว่านี่เป็นเพียงการทดสอบครั้งเดียวจะเกิดอะไรขึ้นถ้าคุณทำการทดสอบมากกว่าหนึ่งครั้ง จากนั้นความแม่นยำของการทดสอบเริ่มมีความสำคัญมากขึ้น
dsaxton

ถ้ามันเป็นแมมโมแกรมที่สมบูรณ์แบบอัตราบวกที่ผิดพลาดจะเป็นศูนย์และจากนั้น p (C | M) = 1 * 0.01 / (1 * 0.01 + 0 * 0.99) = 1.0 ในฐานะที่เป็นอัตราบวกที่ผิดพลาดของแมมโมแกรม ความสมบูรณ์แบบ (0) ดังนั้นเทอมที่สองที่ด้านล่างจะเข้าใกล้ศูนย์ อัตราบวกปลอม 'จิ๋ว' รวมกับอัตราฐานขนาดเล็กในทำนองเดียวกันเพื่อให้ได้ผลลัพธ์ที่ตรงข้าม
Dave X

fwiw ประสบการณ์ของฉันแสดงให้เห็นว่าตรรกะของชนิดนิรนัยเป็นสิ่งที่ยอดเยี่ยม แต่สร้างสัญชาติญาณที่ไม่ดีอย่างมากเกี่ยวกับการอนุมานความน่าจะเป็น เครื่องมือที่นี่bmj.com/content/343/bmj.d6386อาจช่วยสัญชาตญาณของคุณ
ผัน

ในความเข้าใจของฉันคำถามจะขอปรีชาว่าความน่าจะเป็นที่มีเงื่อนไขสามารถต่ำได้อย่างไรเมื่อตั้งสมมติฐาน ไม่ได้เกี่ยวกับสถิติการตรวจเต้านมในชีวิตจริง (ซึ่งคำตอบดูเหมือนจะเป็นเรื่องจริง)
Juho Kokkala

ฉันมีความผิดในตัวส่วน (คำที่ 2 ควรเป็น (.01 * 0.99) หรือไม่ผลลัพท์ที่ถูกต้องไม่ใช่ปรีชา แต่ทำให้คุณมี P (C | +) = P (C) / (P) (P) + (P (+ |! C) P (! C)) และ P (C) ต่ำมากดังนั้น P (C | +) จึงอ่อนไหวอย่างยิ่งต่อ P (+ |! C) นั่นคือคุณต้องมี P ( + |! C) << P (C) เพื่อรับ P (C | +) เข้าหา 1
David Waterworth

คำตอบ:


11

ฉันจะตอบคำถามนี้ทั้งจากแพทย์และมุมมองสถิติ มันได้รับความสนใจอย่างมากในสื่อมวลชนโดยเฉพาะอย่างยิ่งหลังจากผู้ขายThe Signal และเสียงดังโดย Nate Silver รวมถึงบทความในสิ่งพิมพ์จำนวนมากเช่นThe New York Timesอธิบายแนวคิด ดังนั้นฉันดีใจมากที่ @ user2666425 เปิดหัวข้อนี้ในประวัติย่อ

ปิดแรกให้ฉันโปรดชี้แจงว่าไม่ถูกต้อง ฉันสามารถบอกคุณได้ว่ารูปนี้จะเป็นความฝันที่เป็นจริง น่าเสียดายที่มีแมมโมแกรมลบปลอมจำนวนมากโดยเฉพาะในผู้หญิงที่มีเนื้อเยื่อเต้านมหนาแน่น ตัวเลขโดยประมาณอาจเป็น 20 %หรือสูงกว่าทั้งนี้ขึ้นอยู่กับว่าคุณเป็นมะเร็งเต้านมชนิดต่าง ๆ ทั้งหมดในรูปแบบเดียว (invasive v DCIS) และปัจจัยอื่น ๆ นี่คือเหตุผลที่ทำให้มีการใช้รังสีอื่น ๆ ที่ใช้เทคโนโลยี sonographic หรือ MRI ความแตกต่างระหว่าง 0.8และ 1พี(+|)=120%0.81เป็นสิ่งสำคัญในการทดสอบการคัดกรอง

ทฤษฎีบทของเบย์บอกเราว่าและมีอากาศเมื่อเร็ว ๆ นี้ความสนใจเป็นจำนวนมากที่เกี่ยวข้องกับการตรวจเต้านมในอายุน้อยกว่าผู้หญิงที่มีความเสี่ยงต่ำ ฉันรู้ว่านี่ไม่ใช่สิ่งที่คุณขออย่างแน่นอนซึ่งฉันพูดถึงในย่อหน้าสุดท้าย แต่เป็นหัวข้อที่ถกเถียงกันมากที่สุด นี่คือรสชาติของปัญหา:พี(|+)=พี(+|)พี(+)* * * *พี()

  1. ก่อน (หรือความน่าจะเป็นของการมีมะเร็งอยู่บนพื้นฐานของความชุก) ในอายุน้อยกว่าผู้ป่วยบอกว่า 40-50 ปีอายุค่อนข้างเล็ก จากข้อมูลของNCIมันสามารถปัดเศษขึ้นที่ (ดูตารางด้านล่าง) ความน่าจะเป็น pre-test ที่ค่อนข้างต่ำในตัวเองลดความน่าจะเป็นหลังการทดสอบตามเงื่อนไขของการเป็นมะเร็งเนื่องจาก mammogram เป็นบวกโดยไม่คำนึงถึงความน่าจะเป็นหรือข้อมูลที่รวบรวม~1.5%

  2. ความน่าจะเป็นของการมองโลกในแง่ผิดพลาดกลายเป็นประเด็นที่สำคัญมากในกระบวนการคัดกรองที่จะนำไปใช้กับผู้หญิงที่มีสุขภาพดีจำนวนนับพันคน ดังนั้นแม้ว่าอัตราการบวกเป็นเท็จที่ (ซึ่งสูงกว่ามากหากคุณมุ่งเน้นไปที่ความเสี่ยงสะสม ) อาจไม่ได้แย่ขนาดนั้นจริงๆแล้วมันเป็นปัญหาของค่าใช้จ่ายทางจิตวิทยาและเศรษฐกิจมหึมาโดยเฉพาะอย่างยิ่ง ความน่าจะเป็นในผู้ป่วยอายุน้อยที่มีความเสี่ยงต่ำ รูปของคุณ1 %ปิดเครื่องหมายอย่างกว้างขวาง - ความจริงก็คือ "กลัว" เป็นเรื่องธรรมดาอย่างไม่น่าเชื่อเนื่องจากปัจจัยหลายประการรวมถึงความกังวลเกี่ยวกับยา7-10%1%

ดังนั้นการคำนวณใหม่และที่สำคัญมากสำหรับผู้หญิงอายุน้อยที่ไม่มีปัจจัยเสี่ยง :

พี(|+)=พี(+|)พี(+)* * * *พี()=

=พี(+|)พี(+|)* * * *พี()+พี(+|¯)* * * *พี(¯)* * * *พี()=0.80.8* * * *0.015+0.07* * * *0.985* * * *0.015=0.148

15%

4045 45

ในผู้หญิงที่มีอายุมากกว่าความชุก (และความน่าจะเป็นก่อนการทดสอบ) จะเพิ่มขึ้นตามอายุ จากรายงานปัจจุบันความเสี่ยงที่ผู้หญิงจะได้รับการวินิจฉัยว่าเป็นมะเร็งเต้านมในช่วง 10 ปีข้างหน้าเริ่มตั้งแต่อายุต่อไปนี้มีดังนี้:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

10%

4%

พี(|+)=0.80.8* * * *0.04+0.07* * * *0.96* * * *0.04=0.32~32%

พี(|+)

คำตอบสำหรับคำถามของคุณโดยเฉพาะ:

พี(+|¯)7-10%1%พี(¯) ) โดยเฉพาะอย่างยิ่งในหญิงอายุน้อยกว่าที่บัญชีสำหรับความน่าจะเป็นหลังการทดสอบนี้ลดลงในทุกเพศทุกวัยโปรดสังเกตว่า "อัตราการเตือนภัยที่ผิดพลาด" นี้ถูกคูณด้วยสัดส่วนที่มากขึ้นของผู้ป่วยที่ไม่มีโรคมะเร็ง (เมื่อเทียบกับผู้ป่วยที่เป็นมะเร็ง) ในตัวส่วนไม่ใช่ "โอกาส 1% เล็ก ๆ ที่เป็นบวกปลอมใน 1% ของประชากร" คุณ กล่าวถึง ฉันเชื่อว่านี่คือคำตอบสำหรับคำถามของคุณ เพื่อเน้นถึงแม้ว่าสิ่งนี้จะไม่สามารถยอมรับได้ในการทดสอบวินิจฉัย แต่ก็ยังคุ้มค่าในขั้นตอนการตรวจคัดกรอง

ปัญหาปรีชา: @Juho Kokkala นำขึ้นปัญหาที่ OP ถูกถามเกี่ยวกับสัญชาตญาณ ฉันคิดว่ามันส่อให้เห็นในการคำนวณและย่อหน้าปิด แต่ยุติธรรมพอ ... นี่คือวิธีที่ฉันจะอธิบายให้เพื่อน ... ลองแกล้งทำเป็นว่าเรากำลังตามล่าเศษดาวตกด้วยเครื่องตรวจจับโลหะในวินสโลว์รัฐแอริโซนา ที่นี่:

ภาพจาก meteorcrater.com

... และเครื่องตรวจจับโลหะก็ดับลง ถ้าคุณบอกว่าโอกาสที่มาจากการที่เหรียญนักท่องเที่ยวลดลงคุณอาจจะพูดถูก แต่คุณได้รับส่วนสำคัญ: ถ้าสถานที่ไม่ได้รับการตรวจสอบอย่างละเอียดมันจะเป็นไปได้มากกว่าที่เสียงบี๊บจากเครื่องตรวจจับในสถานที่เช่นนี้มาจากเศษอุกกาบาตมากกว่าที่เราอยู่บนถนนของนิวยอร์ค

สิ่งที่เราทำกับการตรวจแมมโมแกรมนั้นจะทำให้ประชากรมีสุขภาพที่ดีกำลังมองหาโรคเงียบที่หากไม่ได้รับการตรวจเร็วอาจทำให้ถึงตายได้ โชคดีที่ความชุก (แม้ว่าสูงมากเมื่อเทียบกับมะเร็งที่รักษาได้น้อยกว่าอื่น ๆ ) อยู่ในระดับต่ำพอที่ความเป็นไปได้ที่จะเกิดมะเร็งแบบสุ่มต่ำแม้ว่าผลลัพธ์จะเป็น "บวก"และโดยเฉพาะอย่างยิ่งในหญิงสาว

พี(¯|+)=0

พี(+|)พี(+|)* * * *พี()+พี(+|¯)* * * *พี(¯)* * * *พี()=พี(+|)พี(+|)* * * *พี()* * * *พี()=1100%

ความเป็นไปได้ไม่มีเงื่อนไข p (+)=พี(+|)พี(+|)* * * *พี()+พี(+|¯)* * * *พี(¯)<1พี()ด้านหลัง=α* * * *ก่อนด้านหลัง<ก่อนค่าพยากรณ์เชิงบวก (PPV) : ความน่าจะเป็นที่ผู้ทดสอบที่มีการตรวจคัดกรองเชิงบวกมีโรคอย่างแท้จริง


5

ปัญหาสำคัญของการตรวจเต้านมที่ไม่ได้รับการกล่าวถึงอย่างเพียงพอในคำปราศรัยคือคำจำกัดความที่ผิดพลาดของ "บวก" นี่คือคำอธิบายในบทการวินิจฉัยในhttp://biostat.mc.vanderbilt.edu/ClinStat - ดูลิงค์สำหรับชีวสถิติในการวิจัยด้านชีวการแพทย์ที่นั่น

หนึ่งในระบบการวินิจฉัยที่ใช้กันอย่างแพร่หลายในการตรวจแมมโมแกรมคือคะแนน BI-RADS และคะแนน 4 คือผลลัพธ์ "บวก" ที่พบบ่อย คำจำกัดความของหมวดหมู่ที่ 4 คือ "ไม่ใช่ลักษณะของมะเร็งเต้านม แต่น่าจะเป็นที่สมเหตุสมผลในการเป็นมะเร็ง (3 ถึง 94%) การตรวจชิ้นเนื้อควรได้รับการพิจารณา" ด้วยช่วงความเสี่ยงที่ไปตลอดทางจาก 0.03 ถึง 0.94 สำหรับหมวดหมู่หนึ่งเช่นความหลากหลายที่น่าเหลือเชื่อในสิ่งที่ "บวก" จริงๆหมายถึงมันไม่น่าแปลกใจที่เรามีระเบียบในมือของเรา

นอกจากนี้ยังเป็นสัญญาณของความคิดที่ไม่ชัดเจนว่าระบบ BI-RADS ไม่มีหมวดหมู่สำหรับผู้ที่มีความเสี่ยงโดยประมาณ 0.945

ในฐานะที่เนทซิลเวอร์ได้กล่าวอย่างละเอียดถี่ถ้วนในสัญญาณและเสียงถ้าเราคิดว่าน่าจะเป็นเราจะตัดสินใจได้ดีขึ้น การลบคำเช่น "บวก" และ "เชิงลบ" สำหรับการทดสอบทางการแพทย์จะลบผลบวกปลอมและลบเชิงลบและถ่ายทอดความไม่แน่นอน (และเหตุผลสำหรับการทดสอบเพิ่มเติมก่อนทำการวินิจฉัย) อย่างเหมาะสม


เราเขียนในแบบซิงค์กัน - ตรวจสอบความคิดเห็นของฉันด้านล่างเกี่ยวกับ BI-RADS ฉันไม่สามารถเห็นด้วยมากขึ้น (ประสบการณ์ส่วนตัวมากมายเกี่ยวกับเรื่องนี้ในฐานะนักรังสีวิทยา)
Antoni Parellada

3

มีการอภิปรายที่ดีเกี่ยวกับเรื่องนี้ในหนังสือความเสี่ยงจากการคำนวณ

หนังสือส่วนใหญ่เกี่ยวกับการค้นหาวิธีที่ชัดเจนในการพูดคุยและคิดถึงความน่าจะเป็นและความเสี่ยง ตัวอย่าง:

ความน่าจะเป็นที่ผู้หญิงอายุ 40 ปีเป็นมะเร็งเต้านมอยู่ที่ประมาณ 1 เปอร์เซ็นต์ ถ้าเธอมีมะเร็งเต้านมความน่าจะเป็นที่เธอจะทดสอบบวกกับการคัดกรองแมมโมแกรมประมาณ 90 เปอร์เซ็นต์ หากเธอไม่มีมะเร็งเต้านมความน่าจะเป็นที่เธอจะได้รับการทดสอบในเชิงบวกคือร้อยละ 9 โอกาสที่ผู้หญิงที่มีผลการทดสอบเป็นบวกจะมีมะเร็งเต้านม

นี่คือวิธีที่หนังสือนำเสนอการแก้ปัญหาโดยใช้ 'ความถี่ธรรมชาติ' พิจารณาผู้หญิง 10,000 คน 1% เป็นมะเร็งดังนั้นนั่นคือผู้หญิง 100 คน ในจำนวนนี้ 90% จะกลับมาตรวจในเชิงบวก (เช่นผู้หญิง 90 คนที่เป็นมะเร็งจะทำการทดสอบในเชิงบวก) จาก 9900 ที่ไม่มีโรคมะเร็ง 9% จะกลับมาทดสอบในเชิงบวกหรือ 891 ผู้หญิง ดังนั้นจึงมี 891 + 90 = 981 ผู้หญิงที่มีการทดสอบเชิงบวกซึ่ง 90 คนเป็นมะเร็ง ดังนั้นโอกาสที่ผู้หญิงที่มีการทดสอบในเชิงบวกจะเป็นมะเร็ง 90/981 = 0.092

ถ้าผู้หญิง 100% ที่มีการตรวจมะเร็งเป็นบวกนั้นเพียงแค่เปลี่ยนตัวเลขเป็น 100 / (100 + 891) = 0.1

วิธีความถี่ธรรมชาติในการทำความเข้าใจบวกเท็จ


1

บางทีแนวความคิดนี้ถูกต้องหรือไม่:

สำหรับคนที่สุ่มมีโอกาส 1% ที่พวกเขาเป็นมะเร็งและดังนั้นจึงมี .01* * * *1โอกาสที่ mammogram ของคนสุ่มจะเป็นบวก หากพวกเขาไม่มีโรคมะเร็งมีโอกาส 1% ที่เต้านมจะเป็นบวก

ดังนั้นจึงใกล้เคียงกับการพลิกเหรียญสำหรับคนที่สุ่ม ฉันไม่แน่ใจว่าจะอธิบายเพิ่มเติมอย่างไร0.0025 ในความโปรดปรานของโรคมะเร็งได้รับ mammogram บวก


1

ต่อไปนี้เป็นวิธีที่ง่ายเกินไป แต่ง่ายต่อการดู พิจารณา 100 คน หนึ่งมีมะเร็งและจะทดสอบในเชิงบวก จาก 99 คนที่ไม่ได้รับหนึ่งในนั้นจะได้รับการทดสอบในเชิงบวกที่ผิดพลาด ดังนั้นจากสองข้อหนึ่งเราก็จะเป็นมะเร็ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.