คำถามติดแท็ก simpsons-paradox

5
วิธีแก้ปัญหาความขัดแย้งของซิมป์สัน
ความขัดแย้งของ Simpson เป็นปริศนาคลาสสิกที่กล่าวถึงในหลักสูตรสถิติเบื้องต้นทั่วโลก อย่างไรก็ตามหลักสูตรของฉันคือเนื้อหาที่จะต้องทราบว่ามีปัญหาเกิดขึ้นและไม่ได้ให้การแก้ปัญหา ฉันต้องการทราบวิธีแก้ไขข้อขัดแย้ง นั่นคือเมื่อเผชิญหน้ากับความขัดแย้งของ Simpson ที่สองตัวเลือกที่แตกต่างกันดูเหมือนจะแข่งขันกันเพื่อให้เป็นทางเลือกที่ดีที่สุดขึ้นอยู่กับวิธีการแบ่งพาร์ติชันข้อมูลตัวเลือกใดควรเลือก? เพื่อให้คอนกรีตปัญหาให้พิจารณาตัวอย่างแรกที่ให้ไว้ในบทความวิกิพีเดียที่เกี่ยวข้อง มันขึ้นอยู่กับการศึกษาจริงเกี่ยวกับการรักษานิ่วในไต สมมติว่าฉันเป็นหมอและการทดสอบพบว่าผู้ป่วยมีนิ่วในไต ใช้เฉพาะข้อมูลที่ให้ไว้ในตารางฉันต้องการตรวจสอบว่าฉันควรนำการรักษา A หรือการรักษา B มาใช้หรือไม่ดูเหมือนว่าถ้าฉันรู้ขนาดของหินแล้วเราควรเลือกการรักษา A แต่ถ้าเราไม่ทำ เราควรเลือกการรักษาแบบ B แต่ให้คิดวิธีอื่นที่น่าเชื่อถือเพื่อให้ได้คำตอบ ถ้าหินมีขนาดใหญ่เราควรเลือก A และถ้ามันเล็กเราควรเลือก A อีกครั้งดังนั้นแม้ว่าเราจะไม่ทราบขนาดของหินโดยวิธีการของคดีเราเห็นว่าเราน่าจะชอบ A. สิ่งนี้ขัดแย้งกับเหตุผลก่อนหน้าของเรา ดังนั้น: ผู้ป่วยเดินเข้าไปในสำนักงานของฉัน การทดสอบพบว่าพวกเขามีนิ่วในไต แต่ไม่ได้ให้ข้อมูลเกี่ยวกับขนาดของพวกเขา การรักษาแบบไหนที่ฉันแนะนำ มีวิธีแก้ไขปัญหานี้ที่ยอมรับได้หรือไม่? Wikipedia ให้คำแนะนำอย่างละเอียดโดยใช้ "เครือข่าย Bayesian ที่เป็นสาเหตุ" และการทดสอบ "back-door" แต่ฉันไม่รู้ว่าสิ่งเหล่านี้คืออะไร

3
โรงพยาบาลไหนควรเลือก หนึ่งมีอัตราความสำเร็จที่สูงขึ้น แต่อื่น ๆ มีอัตราความสำเร็จโดยรวมที่สูงขึ้น
ฉันมีคำถามเกี่ยวกับสิ่งที่ครูสถิติของฉันพูดเกี่ยวกับปัญหาต่อไปนี้ คำถามของฉันไม่ได้เกี่ยวกับการเกิดขึ้นของความขัดแย้งของ Simpson ในสถานการณ์นี้ คำถามของฉันเป็นเพียงการยืนยันของอาจารย์ว่า A) และ D) เป็นคำตอบที่ถูกต้องแทนที่จะเป็น A) และ F) เขาพูดว่า: "เนื่องจากอัตราความสำเร็จต่ำมากสำหรับการผ่าตัด Type E เราจึงสามารถสรุปได้ว่ามันยากและไม่ใช่เรื่องแปลกดังนั้นความเมตตาอาจมีเครื่องมือ / แพทย์ที่ดีกว่าเมื่อเทียบกับ Hope" ฉันไม่เข้าใจว่าเขาสามารถอนุมานได้อย่างไรว่าความเมตตาทำให้ "การผ่าตัดยากขึ้น" เห็นได้ชัดว่าความเมตตามีอัตราความสำเร็จดีกว่าในการทำศัลยกรรมประเภท E แต่เหตุใดจึงหมายความว่าพวกเขาทำ "การผ่าตัดที่ยากขึ้น" ฉันคิดว่าฉันกำลังเมาเพราะถ้อยคำของปัญหานี้และอาจารย์ไม่ได้ทำอะไร ใครช่วยอธิบายหน่อยได้ไหมว่าทำไมฉันถึงทำผิดหรืออธิบายได้อย่างไรกับอาจารย์? มีโรงพยาบาลสองแห่งชื่อ Mercy and Hope ในเมืองของคุณ คุณต้องเลือกหนึ่งในสิ่งเหล่านี้ที่จะเข้ารับการผ่าตัด คุณตัดสินใจที่จะตัดสินใจบนพื้นฐานของความสำเร็จของทีมผ่าตัดของพวกเขา โชคดีที่ภายใต้แผนสุขภาพใหม่โรงพยาบาลให้ข้อมูลเกี่ยวกับความสำเร็จในการดำเนินงานของพวกเขาแบ่งออกเป็นห้าประเภทกว้างของการดำเนินงาน สมมติว่าคุณได้รับข้อมูลต่อไปนี้สำหรับโรงพยาบาลสองแห่ง: Mercy Hospital Type A B C D E All Operations 359 1836 299 …

3
ทำความเข้าใจกับความขัดแย้งของซิมป์สัน: ตัวอย่างของแอนดรูว์เจลแมนด้วยการลดรายได้เกี่ยวกับเรื่องเพศและส่วนสูง
Andrew Gelman หนึ่งในบล็อกโพสต์ล่าสุดของเขาพูดว่า: ฉันไม่คิดว่าการต่อต้านหรือผลที่อาจเกิดขึ้นเป็นสิ่งจำเป็นสำหรับความขัดแย้งของซิมป์สัน ฉันพูดแบบนี้เพราะเราสามารถตั้งค่าความขัดแย้งของซิมป์สันด้วยตัวแปรที่ไม่สามารถจัดการได้หรือการจัดการที่ไม่ได้สนใจโดยตรง ความขัดแย้งของซิมป์สันเป็นส่วนหนึ่งของปัญหาทั่วไปที่โคย์การถดถอยเปลี่ยนแปลงหากคุณเพิ่มตัวทำนายมากขึ้นการพลิกสัญญาณไม่จำเป็นจริงๆ นี่คือตัวอย่างที่ฉันใช้ในการสอนที่แสดงทั้งสองประเด็น: ฉันสามารถใช้การถดถอยเพื่อทำนายรายได้จากเพศและส่วนสูง ฉันพบว่า coef ของเพศคือ$ 10,000 (เช่นการเปรียบเทียบชายและหญิงที่มีความสูงเท่ากันโดยเฉลี่ยแล้วผู้ชายจะเพิ่มอีก$ 10,000) และค่าสัมประสิทธิ์ของความสูงคือ$ 500 (เช่นการเปรียบเทียบผู้ชายสองคนหรือผู้หญิงสองคน ความสูงที่แตกต่างกันโดยเฉลี่ยคนที่สูงกว่าจะทำเงินได้สูงกว่า$ 500 ต่อนิ้ว) ฉันจะแปลความหมายเหล่านี้ได้อย่างไร ฉันรู้สึกว่า coef of height นั้นง่ายต่อการตีความ (มันเป็นเรื่องง่ายที่จะจินตนาการเปรียบเทียบคนสองคนที่มีเพศเดียวกันกับความสูงที่แตกต่างกัน) แน่นอนว่ามันผิด“ ผิด” ที่จะถอยกลับที่ความสูงโดยไม่ควบคุมเพศ ความแตกต่างระหว่างคนที่สั้นและสูงสามารถ“ อธิบาย” ได้โดยการเป็นความแตกต่างระหว่างผู้ชายกับผู้หญิง แต่การมีเพศสัมพันธ์ในโมเดลด้านบนนั้นยากที่จะตีความ: ทำไมเปรียบเทียบผู้ชายกับผู้หญิงที่สูง 66 นิ้ว? นั่นจะเป็นการเปรียบเทียบชายร่างเตี้ยกับผู้หญิงสูง เหตุผลทั้งหมดนี้ดูเหมือนว่ามีสาเหตุเชิงลบ แต่ฉันไม่คิดว่ามันสมเหตุสมผลที่จะใช้ผลลัพธ์ที่เป็นไปได้ ฉันไตร่ตรองมากกว่านั้น (และแสดงความคิดเห็นในโพสต์) และคิดว่ามีบางสิ่งที่จะเข้าใจได้ชัดเจนยิ่งขึ้นที่นี่ จนกว่าส่วนในการตีความของเพศมันก็โอเค แต่ฉันไม่เห็นสิ่งที่เป็นปัญหาที่อยู่เบื้องหลังการเปรียบเทียบชายสั้นและผู้หญิงสูง นี่คือประเด็นของฉัน: ในความเป็นจริงมันสมเหตุสมผลดีกว่า (จากสมมติฐานที่ว่าผู้ชายสูงโดยเฉลี่ย) คุณไม่สามารถเปรียบเทียบ 'ชายร่างเตี้ย' …

2
คุณช่วยอธิบายความขัดแย้งของ Simpson ด้วยสมการแทนที่จะเป็นตารางฉุกเฉินได้ไหม
ฉันอาจไม่ได้มีความเข้าใจที่ชัดเจนของความขัดแย้งซิมป์สัน ฉันรู้ว่าค่าเฉลี่ยของการตอบสนอง Y1 ซึ่งจัดกลุ่มตามระดับของปัจจัย A ที่เป็นไปได้ทั้งหมดอาจสูงกว่าค่าเฉลี่ยของการตอบสนอง Y2 ในทุกระดับของ A แม้ว่าค่าเฉลี่ยของ Y1 สำหรับแต่ละระดับของ A (แต่ละกลุ่ม) คือ น้อยกว่าค่าเฉลี่ยของ Y2 ที่สอดคล้องกันเสมอ ฉันได้อ่านตัวอย่าง แต่ฉันก็ยังประหลาดใจในแต่ละครั้งที่ฉันเห็นอาจเป็นเพราะฉันไม่ได้เรียนรู้อย่างดีจากตัวอย่างที่เฉพาะเจาะจง: ฉันมีปัญหาในการพูดคุยทั่วไป ฉันเรียนรู้ได้ดีที่สุดและอยากจะเห็นคำอธิบายในสูตร คุณช่วยอธิบายความขัดแย้งที่อาศัยสมการแทนที่จะเป็นตารางนับได้ไหม นอกจากนี้ฉันคิดว่าเหตุผลที่ทำให้ฉันประหลาดใจก็คือฉันอาจตั้งสมมติฐานบางอย่างเกี่ยวกับค่าเฉลี่ยที่เกี่ยวข้องในความขัดแย้งซึ่งอาจไม่เป็นความจริงโดยทั่วไปโดยไม่รู้ตัว บางทีฉันอาจลืมน้ำหนักด้วยจำนวนตัวอย่างในแต่ละกลุ่ม? แต่จากนั้นฉันอยากเห็นสมการที่แสดงให้ฉันเห็นว่าการประเมินค่าเฉลี่ยโดยรวมมีความแม่นยำมากขึ้นถ้าฉันให้น้ำหนักแต่ละกลุ่มเฉลี่ยตามจำนวนตัวอย่างในแต่ละกลุ่มเพราะ (ถ้าเป็นจริง) จะไม่ชัดเจน ถึงฉันโดยทั่วไป อย่างไร้เดียงสาฉันคิดว่าการประมาณค่าของE [ Y1]E[Y1]\mathbf{E}[Y_1]มีข้อผิดพลาดมาตรฐานที่ต่ำกว่าเมื่อฉันมีตัวอย่างมากขึ้นโดยไม่คำนึงถึงน้ำหนัก

2
Paradox ของ Simpson ครอบคลุมการกลับรายการทั้งหมดจากตัวแปรที่ซ่อนอยู่หรือไม่?
ต่อไปนี้เป็นคำถามเกี่ยวกับการสร้างภาพข้อมูลจำนวนมากที่เสนอเป็น 'พิสูจน์ด้วยภาพ' ของการดำรงอยู่ของบุคคลที่ผิดธรรมดาของ Simpson และอาจเป็นคำถามเกี่ยวกับคำศัพท์ ซิมป์สัน Paradox เป็นปรากฏการณ์ที่ค่อนข้างง่ายที่จะอธิบายและยกตัวอย่างตัวเลขของ (เหตุผลที่ว่าทำไมนี้สามารถเกิดขึ้นได้เป็นลึกและน่าสนใจ) ความขัดแย้งก็คือมีตารางฉุกเฉิน 2x2x2 อยู่ (Agresti, การวิเคราะห์ข้อมูลอย่างมีหมวดหมู่) ซึ่งสมาคมร่อแร่มีทิศทางที่แตกต่างจากความสัมพันธ์ตามเงื่อนไข นั่นคือการเปรียบเทียบอัตราส่วนในสองประชากรย่อยสามารถไปในทิศทางเดียว แต่การเปรียบเทียบในประชากรที่รวมกันไปในทิศทางอื่น ในสัญลักษณ์: มีเช่นนั้น a + ba , b , c , d, e , f, g, ชั่วโมงa,b,c,d,e,f,g,ha,b,c,d,e,f,g,ha + bc + d&gt; e + fก.+ ชมa+bc+d&gt;e+fg+h \frac{a+b}{c+d} > \frac{e+f}{g+h} แต่ และaค&lt; eก.ac&lt;eg \frac{a}{c} < \frac{e}{g} …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.