Paradox ของ Simpson ครอบคลุมการกลับรายการทั้งหมดจากตัวแปรที่ซ่อนอยู่หรือไม่?


10

ต่อไปนี้เป็นคำถามเกี่ยวกับการสร้างภาพข้อมูลจำนวนมากที่เสนอเป็น 'พิสูจน์ด้วยภาพ' ของการดำรงอยู่ของบุคคลที่ผิดธรรมดาของ Simpson และอาจเป็นคำถามเกี่ยวกับคำศัพท์

ซิมป์สัน Paradox เป็นปรากฏการณ์ที่ค่อนข้างง่ายที่จะอธิบายและยกตัวอย่างตัวเลขของ (เหตุผลที่ว่าทำไมนี้สามารถเกิดขึ้นได้เป็นลึกและน่าสนใจ) ความขัดแย้งก็คือมีตารางฉุกเฉิน 2x2x2 อยู่ (Agresti, การวิเคราะห์ข้อมูลอย่างมีหมวดหมู่) ซึ่งสมาคมร่อแร่มีทิศทางที่แตกต่างจากความสัมพันธ์ตามเงื่อนไข

นั่นคือการเปรียบเทียบอัตราส่วนในสองประชากรย่อยสามารถไปในทิศทางเดียว แต่การเปรียบเทียบในประชากรที่รวมกันไปในทิศทางอื่น ในสัญลักษณ์:

มีเช่นนั้น a + ba,b,c,d,e,f,g,h

a+bc+d>e+fg+h

แต่ และ

ac<eg

bd<fh

สิ่งนี้แสดงอย่างถูกต้องในการสร้างภาพข้อมูลต่อไปนี้ (จากWikipedia ):

ซิมป์สัน 'เส้นขนานในเวกเตอร์

เศษส่วนเป็นเพียงความชันของเวกเตอร์ที่สอดคล้องกันและมันง่ายที่จะเห็นในตัวอย่างที่เวกเตอร์ B ที่สั้นกว่านั้นมีความชันที่ใหญ่กว่าเวกเตอร์ L ที่สอดคล้องกัน แต่เวกเตอร์ B ที่รวมกันนั้นมีความชันน้อยกว่าเวกเตอร์ L ที่รวมกัน

มีการสร้างภาพข้อมูลที่พบบ่อยมากในหลายรูปแบบโดยเฉพาะที่ด้านหน้าของการอ้างอิงวิกิพีเดียใน Simpson's:

ในทางตรงกันข้ามกับประชากรย่อย

นี่เป็นตัวอย่างที่ดีของการทำให้สับสนว่าตัวแปรที่ซ่อนอยู่ (ซึ่งแยกประชากรย่อยสองคน) สามารถแสดงรูปแบบที่แตกต่างกันได้อย่างไร

อย่างไรก็ตามทางคณิตศาสตร์เช่นภาพในทางที่ไม่มีสอดคล้องกับการแสดงผลของตารางฉุกเฉินที่อยู่ในพื้นฐานของปรากฏการณ์ที่รู้จักกันเป็นความขัดแย้งของซิมป์สัน ก่อนอื่นเส้นถดถอยจะอยู่เหนือข้อมูลชุดค่าที่มีมูลค่าจริงไม่นับข้อมูลจากตารางฉุกเฉิน

นอกจากนี้เราสามารถสร้างชุดข้อมูลที่มีความสัมพันธ์โดยพลการของความชันในเส้นถดถอย แต่ในตารางฉุกเฉินอาจมีข้อ จำกัด ในความแตกต่างของความลาดชัน นั่นคือเส้นการถดถอยของประชากรสามารถตั้งฉากกับการถดถอยทั้งหมดของประชากรย่อยที่ได้รับ แต่ใน Paradox ของซิมป์สันอัตราส่วนของประชากรย่อยแม้ว่าจะไม่ใช่ทางลาดชัน แต่ก็ไม่สามารถหลงทางไกลเกินไปจากประชากรที่รวมกันแม้ว่าจะไปในทิศทางอื่น (อีกครั้งให้ดูภาพเปรียบเทียบอัตราส่วนจากวิกิพีเดีย)

สำหรับฉันแล้วมันก็มากพอที่จะถูกผงะทุกครั้งที่ฉันเห็นภาพหลังเป็นภาพของความขัดแย้งของ Simpson แต่เนื่องจากฉันเห็นตัวอย่าง (สิ่งที่ฉันเรียกผิด) ทุกที่ฉันอยากรู้:

  • ฉันขาดการแปลงอย่างละเอียดจากตัวอย่าง Simpson / Yule ดั้งเดิมของตารางฉุกเฉินเป็นค่าจริงที่แสดงให้เห็นถึงการแสดงภาพเส้นถดถอย
  • แน่นอนซิมป์สันเป็นตัวอย่างหนึ่งของข้อผิดพลาดที่รบกวน ได้คำว่า 'ซิมป์สัน Paradox' ตอนนี้กลายเป็นบรรจุด้วยรบกวนข้อผิดพลาดเพื่อที่ใดคณิตศาสตร์ใด ๆการเปลี่ยนแปลงในทิศทางที่ผ่านตัวแปรที่ซ่อนอยู่สามารถเรียกว่าซิมป์สัน Paradox?

ภาคผนวก: นี่คือตัวอย่างของการวางนัยทั่วไปไปยังตาราง 2xmxn (หรือ 2 คูณด้วยการต่อเนื่องตามตาราง): ร้อยละตะกร้าทำด้วยความเคารพระยะทางตัวแปรที่ซ่อนอยู่เป็นประเภทของการยิง

หากรวมกับประเภท shot ดูเหมือนว่าผู้เล่นจะยิงได้มากขึ้นเมื่อกองหลังใกล้เข้ามา จัดกลุ่มตามประเภทของการยิง (ระยะห่างจากตะกร้าจริงๆ) ยิ่งมีสถานการณ์ที่คาดหวังมากเท่าไหร่ก็ยิ่งมีการยิงมากขึ้นเท่านั้น

ภาพนี้เป็นสิ่งที่ฉันคิดว่าเป็นลักษณะทั่วไปของ Simpson ต่อสถานการณ์ที่ต่อเนื่องมากขึ้น (ระยะทางของผู้พิทักษ์) แต่ฉันก็ยังไม่เห็นว่าตัวอย่างบรรทัดการถดถอยเป็นตัวอย่างของ Simpson อย่างไร


5
Paradox ของ Simpson ไม่ได้ใช้กับข้อมูลเป้าหมายที่เป็นหมวดหมู่เท่านั้น ข้อมูลเป้าหมายต่อเนื่องที่มีปัจจัยหมวดหมู่ที่ส่งผลกระทบต่อมันเช่นเดียวกับในกราฟสุดท้ายของคุณอาจอยู่ภายใต้การขัดแย้ง กุญแจสำคัญคือ "ปัจจัยเชิงหมวดหมู่" ไม่ว่าตัวแปรดอกเบี้ยจะจัดหมวดหมู่หรือไม่หรือปัจจัยอื่นใดหรือทั้งหมดที่มีผลต่อตัวแปรดอกเบี้ยนั้นเป็นหมวดหมู่
jbowman

@ jbowman โอเคฉันเห็นได้ว่า SP อาจใช้การได้มากกว่าข้อมูลที่เป็นหมวดหมู่ไปเป็นแบบต่อเนื่อง (ฉันไม่เห็นการวางนัยทั่วไปนั้นดูเหมือนว่า SP จะถูกนำเสนอด้วยตารางฉุกเฉินเสมอ) แต่ฉันไม่เห็นว่ากราฟที่สองมีความสอดคล้องกันอย่างไร ฉันหมายถึงฉันเห็นคำอุปมาที่ชัดเจน แต่คลุมเครือ "ตัวแปรที่ซ่อนอยู่สามารถเปลี่ยนทิศทาง" แต่ฉันไม่เห็นว่าการวางนัยทั่วไปทำงานทางคณิตศาสตร์ / แม่นยำอย่างไร
มิทช์

1
คุณมีปัจจัยการจัดหมวดหมู่ที่ซ่อนอยู่ซึ่งทำให้ข้อมูล "ของจริง" เป็นไปตามเส้นสีสองเส้น แต่หากไม่มีความรู้ข้อมูลก็จะปรากฏตามเส้นประ พิจารณาขับอุบัติเหตุตามอายุเป็นเป้าหมายและตัวแปรแกน - ไม่ใช่หมวดหมู่ ดูเหมือนว่าจะลงไปตามอายุใช่มั้ย ตอนนี้เพิ่ม "ปัจจัยที่ซ่อนอยู่" ของ "การขับรถขณะเมา" เส้นสีน้ำเงินจะเป็น "การขับขี่ขณะเมา" สีแดง "การขับรถขณะไม่เมา" จากปัจจัยที่ซ่อนเร้นซึ่งมีความสัมพันธ์กับเยาวชนอุบัติเหตุขึ้นกับอายุ! (ไม่ใช่ตัวอย่างที่สมจริงที่สุดฉันต้องยอมรับ แต่มันเป็นความคิดที่นับ ... )
jbowman

@ jbowman นั่นฟังดูเหมือนเป็นการอธิบายข้อผิดพลาดที่น่าสับสนมากกว่า SP บางทีคุณกำลังพูดว่า SP และการรบกวนเหมือนกัน แต่ฟังดูเป็นคำตอบ บางทีคุณอาจทำให้เป็นทางการได้มากขึ้นและทำให้การเชื่อมต่อกับ SP ชัดเจนยิ่งขึ้น (บัญชีทางคณิตศาสตร์สำหรับวิธีการที่เส้นการถดถอยมีความคล้ายคลึงกับการเปรียบเทียบอัตราส่วนในกรณีตารางฉุกเฉิน)
มิทช์

1
ฉันเห็นด้วยกับรุ่นที่อาจเกิดขึ้นแตกต่างกันสองสามวิธีจากตัวอย่างการถดถอยในคำถามของคุณ (1) ตัวแปรปัจจัยรบกวนไม่ได้เป็นตัวแปรร่วมอธิบายตัวอย่างของแต่ละบุคคลก็บางสัดส่วนซึ่งแตกต่างระหว่างการรักษาและกลุ่มควบคุม ในตัวอย่างของนิ่วในไตสัดส่วนของผู้ป่วยหินก้อนใหญ่มีความแตกต่างกันระหว่างสองกลุ่มและทำให้เกิดความขัดแย้ง (2) ในตัวอย่างของไตการรักษาไม่สัมพันธ์กับการเปลี่ยนแปลงของตัวแปรรบกวนมันเป็นผลที่แยกจากกัน xp
พอล

คำตอบ:


8

ความขัดแย้งก็คือว่ามีตารางฉุกเฉิน 2x2x2 (Agresti, Categorical Data Analysis) ที่สมาคมร่อแร่มีทิศทางที่แตกต่างจากแต่ละเงื่อนไขสมาคม [... ] ฉันไม่มีการเปลี่ยนแปลงที่ลึกซึ้งจากเดิมซิมป์สัน / เทศกาลคริสต์มาสตัวอย่างของตารางฉุกเฉิน ค่าจริงที่แสดงให้เห็นถึงการสร้างภาพการถดถอยเส้น?

ปัญหาหลักคือคุณกำลังใช้วิธีการง่ายๆในการแสดงความขัดแย้งในฐานะที่เป็นความขัดแย้ง ตัวอย่างง่ายๆของตารางฉุกเฉินไม่ได้ขัดแย้งกัน ซิมป์สันขัดแย้งเป็นเรื่องเกี่ยวกับความขัดแย้งสัญชาติญาณสาเหตุเมื่อเปรียบเทียบกับสมาคมขอบและเงื่อนไขส่วนใหญ่มักจะเกิดจากการพลิกผันเข้าสู่ระบบ (หรือ attenuations มากเช่นเอกราชในตัวอย่างเดิมที่กำหนดโดยซิมป์สันตัวเองซึ่งมีอยู่ไม่โอนกลับเข้าสู่ระบบ) ความขัดแย้งเกิดขึ้นเมื่อคุณตีความการประมาณค่าทั้งสองแบบซึ่งอาจนำไปสู่ข้อสรุปที่แตกต่างกัน - การรักษาช่วยหรือทำร้ายผู้ป่วยหรือไม่? แล้วคุณควรใช้ประมาณแบบไหน?

ไม่ว่ารูปแบบที่ขัดแย้งจะปรากฏขึ้นบนโต๊ะฉุกเฉินหรือในการถดถอยมันไม่สำคัญ ตัวแปรทั้งหมดสามารถเป็นแบบต่อเนื่องและความขัดแย้งอาจเกิดขึ้นได้ตัวอย่างเช่นคุณอาจมีกรณีที่ยังคE(Y|X)X>0E(Y|X,C=c)X<0,c

แน่นอนซิมป์สันเป็นตัวอย่างหนึ่งของข้อผิดพลาดที่รบกวน

มันไม่ถูกต้อง! ความขัดแย้งของซิมป์สันไม่ได้เป็นเพียงตัวอย่างหนึ่งของข้อผิดพลาดที่น่าสับสน - หากเป็นเช่นนั้นก็จะไม่มีข้อขัดแย้งใด ๆ เลย ท้ายที่สุดถ้าคุณแน่ใจว่าความสัมพันธ์บางอย่างสับสนคุณจะไม่แปลกใจที่เห็นการกลับรายการหรือการลดทอนในตารางฉุกเฉินหรือสัมประสิทธิ์การถดถอย --- บางทีคุณอาจคาดหวังว่า

ดังนั้นในขณะที่ความขัดแย้งของซิมป์สันอ้างถึงการพลิกกลับ (หรือการลดทอนสุดขีด) ของ "เอฟเฟ็กต์" เมื่อเปรียบเทียบความสัมพันธ์ที่มีเงื่อนไขและไม่มีเงื่อนไขซึ่งอาจไม่ได้เกิดจากการรบกวนและเป็นนิรนัย "คำปรึกษาเพื่อตอบคำถามสาเหตุของคุณ ในการทำเช่นนั้นคุณจำเป็นต้องรู้เพิ่มเติมเกี่ยวกับโครงสร้างสาเหตุของปัญหา

ลองพิจารณาตัวอย่างเหล่านี้ที่ให้ไว้ในไข่มุก : ป้อนคำอธิบายรูปภาพที่นี่

ลองจินตนาการว่าคุณมีความสนใจในผลสาเหตุทั้งหมดของในYการพลิกกลับของความสัมพันธ์อาจเกิดขึ้นในกราฟเหล่านี้ทั้งหมด ใน (ก) และ (ง) เราได้รบกวนและคุณจะปรับZใน (ข) ไม่มีการรบกวน,เป็นคนกลางและคุณไม่ควรปรับZใน (c)เป็น collider และไม่มีการรบกวนดังนั้นคุณไม่ควรปรับสำหรับเช่นกัน นั่นคือในสองตัวอย่างเหล่านี้ (b และ c) คุณสามารถสังเกตความขัดแย้งของ Simpson ได้ แต่ก็ไม่มีอะไรที่น่าสับสนและคำตอบที่ถูกต้องสำหรับคำถามเชิงสาเหตุของคุณจะได้รับการประเมินโดยไม่ต้องปรับปรุงXYZZZZZ

คำอธิบายของ Pearl ว่าทำไมสิ่งนี้จึงถือว่าเป็น "ความขัดแย้ง" และทำไมมันยังคงไขปริศนาผู้คนมีเหตุผลมาก ยกตัวอย่างกรณีง่าย ๆ ที่อธิบายใน (a): เอฟเฟกต์เชิงสาเหตุไม่สามารถย้อนกลับได้เช่นนั้น ดังนั้นหากเราเข้าใจผิดว่าการประมาณการทั้งสองเป็นสาเหตุ (ขอบและเงื่อนไข) เราจะต้องประหลาดใจเมื่อเห็นเหตุการณ์เช่นนี้เกิดขึ้น --- และมนุษย์ดูเหมือนจะเป็นสายเพื่อดูสาเหตุในสมาคมส่วนใหญ่

ดังนั้นกลับไปที่คำถามหลัก (ชื่อเรื่อง) ของคุณ:

Paradox ของ Simpson ครอบคลุมการกลับรายการทั้งหมดจากตัวแปรที่ซ่อนอยู่หรือไม่?

เรียกได้ว่าเป็นคำนิยามในปัจจุบันของบุคคลที่ผิดธรรมดาของ Simpson แต่เห็นได้ชัดว่าตัวแปรการปรับอากาศไม่ได้ถูกซ่อนไว้มันจะต้องมีการสังเกตมิฉะนั้นคุณจะไม่เห็นความขัดแย้งที่เกิดขึ้น ส่วนที่น่าสงสัยที่สุดของความขัดแย้งเกิดขึ้นจากการพิจารณาเชิงสาเหตุและตัวแปร "ซ่อน" นี้ไม่จำเป็นต้องเป็นผู้สับสน

ตารางที่เกี่ยวข้องและการถดถอย

ตามที่กล่าวไว้ในความคิดเห็นตัวตนเกี่ยวกับพีชคณิตของการดำเนินการถดถอยด้วยข้อมูลไบนารีและการคำนวณความแตกต่างของสัดส่วนจากตารางฉุกเฉินอาจช่วยให้เข้าใจว่าทำไมความขัดแย้งปรากฏขึ้นในการถดถอยมีลักษณะคล้ายกัน ลองนึกภาพผลลัพธ์ของคุณคือ , การรักษาของคุณและกลุ่มของคุณ , ตัวแปรไบนารีทั้งหมดyxz

แล้วความแตกต่างโดยรวมในสัดส่วนที่เป็นเพียงค่าสัมประสิทธิ์การถดถอยของบนxใช้สัญลักษณ์ของคุณ:yx

a+bc+de+fg+h=cov(y,x)var(x)

และสิ่งเดียวกันมีไว้สำหรับแต่ละกลุ่มย่อยของหากคุณเรียกใช้การถดถอยแยกหนึ่งรายการสำหรับ :zz=1

aceg=cov(y,x|z=1)var(x|z=1)

และอีกอันสำหรับ :z=0

bdfh=cov(y,x|z=0)var(x|z=0)

ดังนั้นในแง่ของการถดถอยความขัดแย้งที่สอดคล้องกับการประเมินสัมประสิทธิ์แรกในทิศทางเดียวและสองสัมประสิทธิ์ของกลุ่มย่อย ในทิศทางที่แตกต่างจากค่าสัมประสิทธิ์สำหรับประชากรทั้งหมดขวา)(cov(y,x|z)(cov(y,x)var(x))(cov(y,x)(cov(y,x|z)var(x|z))(cov(y,x)var(x))


1
ในมุมมองของคุณความขัดแย้งของซิมป์สันไม่เพียงหมายถึงความเป็นไปได้ที่จะมีความแตกต่างในความสัมพันธ์แบบมีส่วนร่วมและแบบมีเงื่อนไข แต่ยังมีความสับสนเกี่ยวกับความถูกต้องแบบใด และมุกแสดงให้เห็นว่าโครงสร้างเชิงสาเหตุคือสิ่งที่เราควรใช้ในการตัดสินใจเรื่องนี้?
Paul

2
"ความขัดแย้งของซิมป์สันนั้นเกี่ยวกับสัญชาติญาณที่ขัดแย้งกันเมื่อเปรียบเทียบความสัมพันธ์ระหว่างชายขอบกับชาย" ฉันไม่เห็นด้วยที่นี่บุคคลที่ผิดธรรมดาของซิมป์สันอ้างถึงสัญญาณพลิกเมื่อเปรียบเทียบกับผลการแบ่งชั้น
AdamO

2
@AdamO ในขณะที่คนส่วนใหญ่ใช้กรณีที่รุนแรงที่สุดของการกลับเครื่องหมายเป็นคำจำกัดความ "เข้มงวด" ของความขัดแย้งของซิมป์สันตัวอย่างดั้งเดิมของซิมป์สันจริง ๆ แล้วไม่มีสัญญาณพลิกกลับ
Carlos Cinelli

1
@ พอลถูกต้อง
Carlos Cinelli

2
@ อดัมฉันคิดว่าคำอธิบายของเพิร์ลว่าทำไมเรื่องนี้จึงถือว่าเป็น "ความขัดแย้ง" และทำไมมันยังคงไขปริศนาผู้คนได้อย่างน่าเชื่อถือ ตัวอย่างเช่นในกรณีของ (a) ผลกระทบเชิงสาเหตุไม่สามารถย้อนกลับได้เช่นนั้น ดังนั้นหากเราคิดอย่างมีเหตุมีผลสำหรับทั้งสองกรณีเราจะประหลาดใจเมื่อเห็นสิ่งที่เกิดขึ้น --- และดูเหมือนว่ามนุษย์จะถูกเชื่อมโยงเพื่อดูสาเหตุในความสัมพันธ์ส่วนใหญ่
Carlos Cinelli

2

ฉันขาดการแปลงอย่างละเอียดจากตัวอย่าง Simpson / Yule ดั้งเดิมของตารางฉุกเฉินเป็นค่าจริงที่แสดงให้เห็นถึงการแสดงภาพเส้นถดถอย

ใช่. การเป็นตัวแทนที่คล้ายกันของการวิเคราะห์หมวดหมู่เป็นไปได้โดยการแสดงภาพบันทึกอัตราการตอบสนองบนแกน Y เส้นขนานของซิมป์สันปรากฏขึ้นในลักษณะเดียวกันกับเส้น "หยาบ" วิ่งแข่งกับเทรนด์เฉพาะสตราตัมที่มีน้ำหนักในระยะไกลตามอัตราอ้างอิงของสแตรทอ้างอิง

นี่คือตัวอย่างของข้อมูลการรับเข้าเรียนของเบิร์กลีย์

ป้อนคำอธิบายรูปภาพที่นี่

เพศนี่คือรหัสชาย / หญิงบนแกน X คืออัตราต่อรองการรับสมัครอย่างหยาบสำหรับเพศชายและเพศหญิงเส้นสีดำที่มีเส้นประหนักแสดงให้เห็นถึงความพึงพอใจทางเพศ: ความลาดเอียงเชิงบวกแสดงให้เห็นถึงอคติ สีเหล่านี้แสดงถึงการเข้าศึกษาในแผนกที่เฉพาะเจาะจง ในทุกกรณียกเว้นทั้งสองกรณีความลาดชันของบรรทัดการกำหนดเพศสถานะเฉพาะเป็นลบ หากผลลัพธ์เหล่านี้มีค่าเฉลี่ยร่วมกันในรูปแบบโลจิสติกไม่ใช่การโต้ตอบสำหรับผลกระทบโดยรวมคือการรับสมัครหญิงกลับรายการที่นิยม พวกเขาใช้กับแผนกที่ยากขึ้นบ่อยกว่าผู้ชาย

แน่นอนซิมป์สันเป็นตัวอย่างหนึ่งของข้อผิดพลาดที่รบกวน คำว่า 'Simpson's Paradox' ตอนนี้มีข้อผิดพลาดที่ทำให้สับสนหรือไม่ดังนั้นอะไรก็ตามที่คณิตศาสตร์การเปลี่ยนแปลงทิศทางใด ๆ ผ่านตัวแปรที่ซ่อนอยู่สามารถเรียกได้ว่า Simpson's Paradox?

สั้น ๆ ไม่มี ความขัดแย้งของซิมป์สันเป็นเพียง "อะไร" ในขณะที่ความสับสนคือ "ทำไม" การอภิปรายที่โดดเด่นได้มุ่งเน้นไปที่พวกเขาเห็นด้วย การทำให้สับสนอาจมีผลกระทบเพียงเล็กน้อยหรือน้อยมากต่อการประมาณและผลัดกันของซิมป์สันในขณะที่ละครอาจเกิดจากคนที่ไม่ใช่คนสับสน ในฐานะที่เป็นบันทึกย่อคำว่า "ซ่อน" หรือตัวแปร "ที่ซุ่มซ่อน" ไม่ชัดเจน จากมุมมองของนักระบาดวิทยาการควบคุมอย่างระมัดระวังและการออกแบบของการศึกษาควรเปิดใช้งานการวัดหรือการควบคุมของผู้มีส่วนร่วมที่เป็นไปได้เพื่ออคติที่สับสน พวกเขาไม่จำเป็นต้อง "ซ่อน" เพื่อเป็นปัญหา

มีหลายครั้งที่การประเมินจุดอาจแตกต่างกันอย่างมากจนถึงจุดกลับรายการซึ่งไม่ได้เกิดจากการรบกวน Colliders และผู้ไกล่เกลี่ยก็เปลี่ยนเอฟเฟกต์ การใช้เหตุผลเชิงสาเหตุเตือนว่าสำหรับการศึกษาผลกระทบนั้นควรมีการศึกษาถึงผลกระทบหลัก ๆ อย่างโดดเดี่ยวแทนที่จะปรับให้เหมาะสมเนื่องจากการประเมินแบบแบ่งชั้นไม่ถูกต้อง (คล้ายกับการอนุมานไม่ถูกต้องการพบแพทย์ทำให้คุณป่วยหรือปืนฆ่าคนดังนั้นคนไม่ฆ่าคน)


ดังนั้นคุณจะบอกว่าตัวอย่างดั้งเดิมของซิมป์สันไม่ใช่กรณีของ "ความขัดแย้งของซิมป์สัน"?
Carlos Cinelli

@CarlosCinelli คุณจะพูดถึงตัวอย่างอะไร ฉันไม่สามารถเข้าถึงกระดาษของปี 1951 ของซิมป์สันได้ แต่เนื่องจากมันถูกตีพิมพ์ใน JRSS และไม่มีการอ้างอิงถึงตัวอย่างที่นำมาใช้ในนามธรรมดูเหมือนว่าเป็นงานทางทฤษฎีล้วนๆ
AdamO

มันเป็นตัวอย่างเชิงตัวเลขในย่อหน้าที่ 9 และ 10 ซึ่งเขาให้ตารางฉุกเฉินเดียวกันกับเรื่องราวที่แตกต่างกันสองเรื่องซึ่งจะนำไปสู่การตีความเชิงสาเหตุที่แตกต่างกันสองประการ ในตัวอย่างนั้นไม่มีสัญญาณพลิกกลับเพียงเป็นอิสระเพียงเล็กน้อย
Carlos Cinelli

2
เพื่อดูว่าทำไมการพลิกผันสัญญาณจึงไม่สำคัญที่นี่เพียงแค่จินตนาการถึงสถานการณ์ที่การรักษาแสดงให้เห็นถึงความสัมพันธ์ที่แข็งแกร่งอย่างยิ่งสำหรับทั้งชายและหญิง แต่แสดงให้เห็นเพียงความสัมพันธ์เล็ก ๆ ในประชากรโดยรวม สิ่งนี้จะยังคงเป็นความขัดแย้งของคนส่วนใหญ่เกินไปหากตีความอย่างมีเหตุมีผล
Carlos Cinelli

@CarlosCinelli ฉันจะบอกว่านั่นเป็นตัวอย่างของความสับสน แต่ไม่ใช่ความขัดแย้งของ Simpson ต่อ seแต่ฉันจะไม่เชื่อประเด็นฉันคิดว่าคุณได้ทำข้อโต้แย้งที่ดีและบางทีฉันอาจถือสมมติฐานที่ไม่ถูกต้องเกี่ยวกับสิ่งที่เป็นและไม่ใช่ ปรากฏการณ์ที่เข้าใจยากของ Paradox ของซิมป์สัน
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.