5
วิธีแก้ปัญหาความขัดแย้งของซิมป์สัน
ความขัดแย้งของ Simpson เป็นปริศนาคลาสสิกที่กล่าวถึงในหลักสูตรสถิติเบื้องต้นทั่วโลก อย่างไรก็ตามหลักสูตรของฉันคือเนื้อหาที่จะต้องทราบว่ามีปัญหาเกิดขึ้นและไม่ได้ให้การแก้ปัญหา ฉันต้องการทราบวิธีแก้ไขข้อขัดแย้ง นั่นคือเมื่อเผชิญหน้ากับความขัดแย้งของ Simpson ที่สองตัวเลือกที่แตกต่างกันดูเหมือนจะแข่งขันกันเพื่อให้เป็นทางเลือกที่ดีที่สุดขึ้นอยู่กับวิธีการแบ่งพาร์ติชันข้อมูลตัวเลือกใดควรเลือก? เพื่อให้คอนกรีตปัญหาให้พิจารณาตัวอย่างแรกที่ให้ไว้ในบทความวิกิพีเดียที่เกี่ยวข้อง มันขึ้นอยู่กับการศึกษาจริงเกี่ยวกับการรักษานิ่วในไต สมมติว่าฉันเป็นหมอและการทดสอบพบว่าผู้ป่วยมีนิ่วในไต ใช้เฉพาะข้อมูลที่ให้ไว้ในตารางฉันต้องการตรวจสอบว่าฉันควรนำการรักษา A หรือการรักษา B มาใช้หรือไม่ดูเหมือนว่าถ้าฉันรู้ขนาดของหินแล้วเราควรเลือกการรักษา A แต่ถ้าเราไม่ทำ เราควรเลือกการรักษาแบบ B แต่ให้คิดวิธีอื่นที่น่าเชื่อถือเพื่อให้ได้คำตอบ ถ้าหินมีขนาดใหญ่เราควรเลือก A และถ้ามันเล็กเราควรเลือก A อีกครั้งดังนั้นแม้ว่าเราจะไม่ทราบขนาดของหินโดยวิธีการของคดีเราเห็นว่าเราน่าจะชอบ A. สิ่งนี้ขัดแย้งกับเหตุผลก่อนหน้าของเรา ดังนั้น: ผู้ป่วยเดินเข้าไปในสำนักงานของฉัน การทดสอบพบว่าพวกเขามีนิ่วในไต แต่ไม่ได้ให้ข้อมูลเกี่ยวกับขนาดของพวกเขา การรักษาแบบไหนที่ฉันแนะนำ มีวิธีแก้ไขปัญหานี้ที่ยอมรับได้หรือไม่? Wikipedia ให้คำแนะนำอย่างละเอียดโดยใช้ "เครือข่าย Bayesian ที่เป็นสาเหตุ" และการทดสอบ "back-door" แต่ฉันไม่รู้ว่าสิ่งเหล่านี้คืออะไร