ตัวอย่างสำหรับการสอน: ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ


74

มีการพูดกันว่า: "ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ" เมื่อฉันสอนฉันมักจะใช้ตัวอย่างมาตรฐานต่อไปนี้เพื่ออธิบายประเด็นนี้:

  1. จำนวนนกกระสาและอัตราการเกิดในเดนมาร์ก
  2. จำนวนนักบวชในอเมริกาและโรคพิษสุราเรื้อรัง;
  3. ในการเริ่มต้นของศตวรรษที่ 20 มันก็สังเกตเห็นว่ามีความสัมพันธ์ที่แข็งแกร่งระหว่าง 'จำนวนของวิทยุ' และ 'จำนวนของคนที่อยู่ในโรงพยาบาลบ้า'
  4. และสิ่งที่ฉันชอบ: โจรสลัดทำให้โลกร้อนขึ้น

อย่างไรก็ตามฉันไม่ได้มีการอ้างอิงใด ๆ สำหรับตัวอย่างเหล่านี้และในขณะที่สนุกพวกเขาเป็นเท็จอย่างเห็นได้ชัด

ใครบ้างมีตัวอย่างที่ดีอื่น ๆ ?


2
พลิกผ่าน Freakonomics สำหรับตัวอย่างที่ดีบางอย่าง บรรณานุกรมของพวกเขาคือหนุนเต็มของการอ้างอิง
Stephen Turner


5
แผนภูมิของโจรสลัด / ภาวะโลกร้อนนั้นถูกปรุงขึ้นอย่างชัดเจนโดยนักทฤษฎีสมคบคิด - ทุกคนสามารถเห็นได้ว่าพวกเขาได้วางแผนอย่างรอบคอบแม้จะเว้นระยะเวลาไม่เท่ากันเพื่อหลีกเลี่ยงการแสดงอุณหภูมิที่เพิ่มขึ้นอย่างรวดเร็วเมื่อโจรสลัดเกือบหมดสิ้น เราทุกคนรู้ว่าเมื่ออุณหภูมิสูงขึ้นมันจะทำให้เหล้ารัมระเหยและโจรสลัดไม่สามารถอยู่รอดได้ในสภาวะเหล่านั้น ;-)
AdamV

4
WTF ขึ้นกับแกน x ของกราฟโจรสลัดนั่นเหรอ?
naught101

1
หรืออะไรที่สวยมากคุณใส่ลงในGoogle Correlateมาว่า
conjugateprior

คำตอบ:


39

มันอาจจะมีประโยชน์ที่จะอธิบายว่า "สาเหตุ" เป็นความสัมพันธ์แบบไม่สมมาตร (X สาเหตุ Y แตกต่างจาก Y สาเหตุ X) ในขณะที่ "สัมพันธ์กับ" เป็นความสัมพันธ์แบบสมมาตร

ตัวอย่างเช่นประชากรที่ไม่มีที่อยู่อาศัยและอัตราการเกิดอาชญากรรมอาจมีความสัมพันธ์กันซึ่งทั้งคู่มีแนวโน้มที่จะสูงหรือต่ำในสถานที่เดียวกัน มันถูกต้องพอ ๆ กันที่จะบอกว่าประชากรไร้ที่อยู่อาศัยมีความสัมพันธ์กับอัตราอาชญากรรมหรืออัตราอาชญากรรมมีความสัมพันธ์กับประชากรไร้ที่อยู่อาศัย ที่จะบอกว่าอาชญากรรมทำให้เกิดคนเร่ร่อนหรือประชากรไร้บ้านทำให้เกิดอาชญากรรมเป็นข้อความที่แตกต่างกัน และความสัมพันธ์ไม่ได้หมายความว่าเป็นจริง ตัวอย่างเช่นสาเหตุพื้นฐานอาจเป็นตัวแปรตัวที่ 3 เช่นการใช้ยาเสพติดหรือการว่างงาน

คณิตศาสตร์ของสถิติไม่ดีในการระบุสาเหตุที่สำคัญซึ่งต้องใช้รูปแบบอื่นของการตัดสิน


3
คำพิพากษาเป็นคำที่ดีเนื่องจากทุกสิ่งที่เราสามารถสังเกตได้คือความสัมพันธ์ การทดลองและ / หรือสถิติที่ชาญฉลาดทั้งหมดสามารถทำได้เพื่อให้เราสามารถยกเว้นคำอธิบายทางเลือกบางอย่างสำหรับสิ่งที่อาจทำให้เกิดผลกระทบ
Jonas

ความคิดเห็นที่ดีมากเกี่ยวกับความสัมพันธ์แบบสมมาตร / ไม่สมมาตร หนึ่งอาจอ้างว่าภาวะโลกร้อนทำให้การละเมิดลิขสิทธิ์เพิ่มขึ้น
Andre Holzner

27

สิ่งที่ฉันชอบ:

1) ยิ่งพนักงานดับเพลิงถูกส่งไปยังกองเพลิงมากเท่าไรก็ยิ่งสร้างความเสียหายได้มากขึ้นเท่านั้น

2) เด็กที่เรียนพิเศษจะได้เกรดแย่กว่าเด็กที่ไม่ได้เรียนหนังสือ

และ (นี่คืออันดับหนึ่งของฉัน)

3) ในช่วงต้นปีที่โรงเรียนประถมศึกษาสัญญาณโหราศาสตร์มีความสัมพันธ์กับ IQ แต่ความสัมพันธ์นี้อ่อนตัวลงตามอายุและหายไปจากวัย


2
(@xmjx ให้ตัวอย่างแรกเมื่อปีที่แล้ว) ฉันชอบตัวอย่างโหราศาสตร์
whuber

คุณช่วยอธิบายตัวอย่างด้วยเครื่องหมายโหราศาสตร์ได้ไหม
Eugene D. Gubenkov

2
ไม่เป็นไรฉันเข้าใจแล้ว ที่เกี่ยวข้องกับความแตกต่างของอายุระหว่างคนที่เกิดในช่วงต้นปีกับคนที่เกิดในตอนท้าย ดี
Eugene D. Gubenkov

24

ฉันชอบอันนี้เสมอ:

มะนาวกับความตาย

แหล่งที่มา: http://pubs.acs.org/doi/abs/10.1021/ci700332k


1
ดีมาก แต่ฉันไม่สามารถเห็นใครก็ตามที่พยายามจะสรุปว่ามีเหตุอะไร หรือคนขับรถบรรทุกมะนาวชาวเม็กซิกันมีชื่อเสียงอย่างอันตรายเมื่อข้ามชายแดน?
AdamV

2
เห็นได้ชัดว่าผลข้างเคียงที่ไม่เลวร้ายของการรวมกฎหมายมะนาวในสหรัฐอเมริกา ตัวอย่างเช่นดู: en.wikipedia.org/wiki/Lemon_law
Thylacoleo

11
เพื่อนร่วมงานของฉันตรวจสอบข้อมูลสำหรับสิ่งนี้ในช่วงหลังปี 2000 และพบว่าความสัมพันธ์นั้นค่อนข้าง 'นอกตัวอย่าง' ซึ่งค่อนข้างรบกวนมากกว่า ...
shabbychef


หาเหตุผลเข้าข้างตนเองอย่างง่ายจะเป็นได้ว่าทั้งสองจะลดลงตามเวลา ข้อมูล post-2000 รองรับหรือไม่ PS, Box Hunter และ Hunter (ดูด้านล่าง) อธิบายตัวอย่างนกกระสาด้วยวิธีเดียวกัน: เพิ่มขึ้นตามระยะเวลาในคำถาม
Emil Friedman

23
  1. บางครั้งความสัมพันธ์ก็เพียงพอ ตัวอย่างเช่นในการประกันภัยรถยนต์ผู้ขับขี่ชายมีความสัมพันธ์กับการเกิดอุบัติเหตุมากขึ้นดังนั้น บริษัท ประกันภัยจึงเรียกเก็บเงินเพิ่มเติม ไม่มีทางที่คุณจะสามารถทดสอบสิ่งนี้เพื่อหาสาเหตุได้ คุณไม่สามารถเปลี่ยนเพศของไดรเวอร์ได้โดยการทดลอง Google ทำเงินหลายร้อยพันล้านดอลลาร์โดยไม่สนใจสาเหตุ

  2. ในการค้นหาสาเหตุโดยทั่วไปคุณต้องการข้อมูลทดลองไม่ใช่ข้อมูลเชิงสังเกตการณ์ แม้ว่าในด้านเศรษฐศาสตร์พวกเขามักใช้ "การกระแทก" ในระบบเพื่อทดสอบหาสาเหตุเช่นถ้า CEO ตายอย่างกะทันหันและราคาหุ้นสูงขึ้นคุณก็สามารถสมมติได้

  3. ความสัมพันธ์เป็นเงื่อนไขที่จำเป็น แต่ไม่เพียงพอสำหรับสาเหตุ ในการแสดงสาเหตุต้องมีการตอบโต้


1
ฉันชอบตัวอย่างแรกที่คุณให้ แน่นอนว่าจะทำให้นักเรียนพูดถึง)
csgillespie

1
มีการอภิปรายที่น่าสนใจโดย Steve Steinberg ในบล็อกของเขาที่นี่: blog.steinberg.org/?p=11เกี่ยวกับความหมายของ 1 และที่อาจนำในแง่ของ AI อ่อนแอ
Amos

ใครช่วยขยายประโยคสุดท้ายหน่อยได้ไหม?
naught101

4
เพียงแค่การชี้แจงอย่างรวดเร็ว: ความสัมพันธ์ไม่จำเป็นสำหรับสาเหตุ (ขึ้นอยู่กับสิ่งที่มีความหมายโดยความสัมพันธ์): ถ้าความสัมพันธ์คือความสัมพันธ์เชิงเส้น (ซึ่งไม่กี่คนที่มีสถิติน้อยจะถือว่าเป็นค่าเริ่มต้นเมื่อคำที่ใช้) แต่สาเหตุ ไม่เชิงเส้น ตัวอย่างเช่นถ้าในเป็นสาเหตุโดยตรง (ซึ่งจะมีค่าใน ) แต่2} หากถูกกระจายแบบสมมาตรและจะไม่ถูกแยกส่วนแม้ว่าจะขึ้นอยู่กับความสมบูรณ์ ( - 1 , 1 ) Y ( 0 , 1 ) Y = X(1,1)Y(0,1) XsXYY=1X2XsXY
Glen_b

18

ฉันมีตัวอย่างเล็ก ๆ น้อย ๆ ที่ฉันชอบใช้

  1. เมื่อตรวจสอบสาเหตุของอาชญากรรมในนิวยอร์กในยุค 80 เมื่อพวกเขาพยายามที่จะทำความสะอาดเมืองนักวิชาการพบว่าความสัมพันธ์ระหว่างจำนวนอาชญากรรมร้ายแรงที่เกิดขึ้นกับปริมาณไอศกรีมขายโดยผู้ขายบนถนน! (สาเหตุใดและผลกระทบใด) เห็นได้ชัดว่ามีตัวแปรที่ไม่ได้รับการตรวจสอบซึ่งทำให้เกิดทั้งสองอย่าง ฤดูร้อนเป็นช่วงที่อาชญากรรมเป็นสิ่งที่ยิ่งใหญ่ที่สุดและเมื่อมีการขายไอศกรีมมากที่สุด

  2. ขนาดของฝ่ามือมีความสัมพันธ์เชิงลบกับระยะเวลาที่คุณจะอยู่ (จริง ๆ !) ในความเป็นจริงผู้หญิงมักจะมีฝ่ามือเล็กและมีอายุยืน

  3. [รายการโปรดของฉัน] ฉันได้ยินการศึกษาเมื่อไม่กี่ปีที่ผ่านมาพบว่าปริมาณโซดาที่คนดื่มมีความสัมพันธ์เชิงบวกกับความเป็นไปได้ของโรคอ้วน(ฉันบอกกับตัวเองว่ามันสมเหตุสมผลเพราะคนที่ดื่มโซดาหวานและได้รับแคลอรี่ที่ว่างเปล่าทั้งหมด) อีกไม่กี่วันต่อมาก็มีรายละเอียดเพิ่มเติมออกมา ความสัมพันธ์เกือบทั้งหมดเป็นเพราะการบริโภคเครื่องดื่มน้ำอัดลมที่เพิ่มขึ้น (นั่นเป่าทฤษฎีของฉัน!) ดังนั้นสิ่งที่เป็นสาเหตุ? เครื่องดื่มประเภทลดน้ำหนักทำให้น้ำหนักตัวเพิ่มขึ้นหรือน้ำหนักเพิ่มขึ้นเป็นสาเหตุให้การบริโภคเครื่องดื่มประเภทลดน้ำหนักเพิ่มขึ้นหรือไม่? (ก่อนที่จะสรุปว่ามันเป็นหลังดูการศึกษาที่ทดลองควบคุมด้วยหนูแสดงให้เห็นว่ากลุ่มที่กินโยเกิร์ตที่มีสารให้ความหวานเทียมได้รับน้ำหนักมากขึ้นกว่ากลุ่มที่กินโยเกิร์ตปกติ.) สองอ้างอิง: เครื่องดื่มอื่น ๆ โซดาอาหาร รับน้ำหนักมากขึ้นหรือไม่ ; โซดาอาหารที่เชื่อมโยงกับโรคอ้วน. ฉันคิดว่าพวกเขายังคงพยายามเรียงลำดับออก


4
อันสุดท้ายมีความซับซ้อนมากกว่าที่คุณนำเสนอเล็กน้อย แต่ฉันเห็นด้วยมากเกี่ยวกับความสัมพันธ์เชิงสังเกตที่พบระหว่างโซดา / ไดเอทโซดากับโรคอ้วนควรมองด้วยตาที่สำคัญ ในทางทฤษฎีบางคนคิดว่าสารทดแทนน้ำตาล / ไขมันปลอมมีผลทางสรีรวิทยาอื่น ๆ นอกเหนือจากการบริโภคแคลอรี่อย่างง่าย ดูตัวอย่างการทดลองนี้กับหนูและไขมันสังเคราะห์ (นำมาจากบล็อกของ Freakonomics)
Andy W

18

จำนวนรางวัลโนเบลที่ประเทศชนะ (ปรับตามประชากร) มีความสัมพันธ์ที่ดีกับการบริโภคช็อกโกแลตต่อหัว ( วารสารการแพทย์นิวอิงแลนด์ )

ป้อนคำอธิบายรูปภาพที่นี่


2
+1 ฉันผิดหวังมากกับ NEJM เมื่อพวกเขาเผยแพร่สิ่งนี้
MattBagg

5
ดูเหมือนว่าจะมีความสัมพันธ์ค่อนข้างดีกับความใกล้ชิดกับสวีเดน ..
naught101

2
การบริโภคช็อคโกแลต (ต่อคน) ยังมีความสัมพันธ์อย่างมีนัยสำคัญกับจำนวนต่อหัวของฆาตกรต่อเนื่อง replicatedtypo.com/…
Harvey Motulsky

2
ฉันถามผู้ชนะรางวัลโนเบลสามคนที่ฉันรู้ (ราง) และทั้งสามคนบอกว่าพวกเขากินช็อกโกแลตมากกว่าเพื่อนร่วมงานส่วนใหญ่ แน่นอนคำตอบเหล่านี้เกิดขึ้นหลังจากที่พวกเขาอ่านกระดาษ NEJM!
Harvey Motulsky

4
@MattBagg สิ่งนี้ได้รับการเผยแพร่เป็น"หมายเหตุเป็นครั้งคราว"และเห็นได้ชัดว่าไม่ควรทำอย่างจริงจัง
ปาสกาล

12

ถึงแม้ว่ามันจะเป็นตัวอย่างของปัญหาการเปรียบเทียบหลายอย่าง แต่ก็เป็นตัวอย่างที่ดีของสาเหตุที่ไม่ถูกต้อง:

Rugby (ศาสนาแห่งเวลส์) และอิทธิพลที่มีต่อโบสถ์คาทอลิก: Pope Benedict XVI ควรกังวลไหม?

"ทุกครั้งที่เวลส์ชนะการแข่งขันรักบี้แกรนด์สแลมสมเด็จพระสันตะปาปาสิ้นพระชนม์ยกเว้นปี 2521 เมื่อเวลส์ดีจริง ๆ และพระสันตะปาปาสององค์สิ้นชีวิต"


9

มีสองด้านสำหรับโพสต์นี้ปัญหาที่เกิดขึ้นเฉพาะที่ฉันชอบที่จะครอบคลุม: (i) สาเหตุเชิงย้อนกลับและ (ii) endogeneity

ตัวอย่างของการ "เป็นไปได้" เวรกรรมย้อนกลับ: ดื่มสังคมและรายได้ - ดื่มรับเงินมากขึ้นตาม Bethany ลิตรปีเตอร์สและเอ็ดเวิร์ด Stringham (ปี 2006 "หรือไม่ไม่มีการดื่มเหล้าคุณอาจสูญเสีย: ทำไมดื่มรายได้เพิ่มเติมเงินกว่าดื่มเครื่องดื่มแอลกอฮอล์"วารสารแรงงาน การวิจัยผู้เผยแพร่ธุรกรรมฉบับที่ 27 (3) หน้า 411-421 มิถุนายน) หรือคนที่ดื่มเงินเพิ่มมากขึ้นเพราะพวกเขามีรายได้มากกว่าหรือจากความเครียด นี่เป็นบทความที่ยอดเยี่ยมที่จะพูดถึงเหตุผลทุกประเภทรวมถึงข้อผิดพลาดในการวัดการเบี่ยงเบนการตอบสนองความเป็นเหตุเป็นผล ฯลฯ

ตัวอย่างของ endogeneity "เป็นไปได้": Mincer Equation อธิบายรายได้จากบันทึกโดยการศึกษาประสบการณ์และประสบการณ์ยกกำลังสอง มีวรรณกรรมที่มีความยาวในหัวข้อนี้ นักเศรษฐศาสตร์แรงงานต้องการประเมินความสัมพันธ์เชิงสาเหตุของการศึกษาต่อผลประกอบการ แต่บางทีการศึกษานั้นเป็นสิ่งภายนอกเพราะ "ความสามารถ" สามารถเพิ่มจำนวนการศึกษาที่แต่ละคนมี (โดยลดต้นทุนในการได้รับ) และอาจนำไปสู่การเพิ่มรายได้ ระดับการศึกษา ทางออกที่เป็นไปได้สำหรับสิ่งนี้อาจเป็นตัวแปรเครื่องมือ หนังสือ Angrist และ Pischke Econometrics ที่ไม่เป็นอันตรายส่วนใหญ่ครอบคลุมสิ่งนี้และเกี่ยวข้องกับหัวข้อในรายละเอียดและความชัดเจนที่ยอดเยี่ยม

ตัวอย่างโง่ ๆ อื่น ๆ ที่ฉันไม่สนับสนุน ได้แก่ : - จำนวนโทรทัศน์ต่อหัวและจำนวนอัตราการตาย ลองส่งทีวีไปยังประเทศกำลังพัฒนา เห็นได้ชัดว่าทั้งสองมีภายนอกที่คล้ายกับ GDP - จำนวนการโจมตีของปลาฉลามและการขายไอศกรีม ทั้งคู่มีอุณหภูมิภายนอกหรือไม่

ฉันชอบเล่าเรื่องตลกเกี่ยวกับคนบ้าและแมงมุม คนบ้ากำลังพเนจรทางเดินของโรงพยาบาลด้วยแมงมุมที่เขาอุ้มอยู่ในอุ้งมือของเขา เขาไปพบแพทย์และพูดว่า "ดูหมอฉันสามารถคุยกับแมงมุมดูนี่ได้" แมงมุมไปทางซ้าย! "แมงมุมไปทางซ้ายแล้วเขาก็พูดต่อ" แมงมุมไปทางขวา "แมงมุมไปทางขวา หมอตอบว่า "น่าสนใจบางทีเราควรพูดถึงเรื่องนี้ในเซสชั่นกลุ่มต่อไป" การโต้กลับของคนบ้า "นั่นไม่ใช่เอกสารอะไรเลย ดูสิ่งนี้ "เขาดึงขาของแมงมุมแต่ละตัวทีละตัวแล้วตะโกนว่า" แมงมุมไปทางซ้าย! "แมงมุมนั้นนิ่งอยู่บนฝ่ามือของเขาและคนบ้าจะหันไปหาหมอและสรุปว่า" ถ้าคุณดึงแมงมุมออกไป เขาจะเป็นคนหูหนวก "


8

หนึ่งที่ดีที่สุดที่ฉันได้รับการสอนคือจำนวนของการจมน้ำและการขายไอศครีมอาจมีความสัมพันธ์กันอย่างมาก แต่นั่นก็ไม่ได้หมายความว่าหนึ่งสาเหตุอื่น ๆ การจมน้ำและการขายไอศกรีมนั้นสูงขึ้นอย่างเห็นได้ชัดในช่วงฤดูร้อนเมื่ออากาศดี ตัวแปรที่สามหรือที่รู้จักกันว่าอากาศดีทำให้พวกเขา


6

ในฐานะที่เป็นลักษณะทั่วไปของ 'โจรสลัดทำให้เกิดภาวะโลกร้อน': เลือกสองปริมาณที่เพิ่มขึ้นหรือลดลงตามเวลาและคุณควรเห็นความสัมพันธ์


6

คุณสามารถใช้เวลาสองสามนาทีในGoogle Correlateและสร้างความสัมพันธ์ปลอม ๆ


1
แม้ว่าลิงก์นี้อาจตอบคำถามได้ดีกว่าหากรวมส่วนสำคัญของคำตอบไว้ที่นี่และให้ลิงก์สำหรับการอ้างอิง คำตอบสำหรับลิงค์เท่านั้นอาจไม่ถูกต้องหากหน้าเว็บที่เชื่อมโยงนั้นเปลี่ยนแปลง
gung

1
@ gung คุณจริงจังไหม ลิงก์คือแอปพลิเคชันไม่ใช่ไปยังหน้าเว็บธรรมดาที่อธิบายคำตอบ คำตอบจะไม่ถูกต้องหากหน้าที่เชื่อมโยงมีการเปลี่ยนแปลงเนื่องจากเครื่องมือจะไม่สามารถใช้งานได้ (ในรูปแบบปัจจุบัน)
Jerome Baum

6

ฉันทำงานกับนักเรียนในการสอนความสัมพันธ์กับสาเหตุในชั้นเรียนพีชคณิต เราตรวจสอบตัวอย่างที่เป็นไปได้มากมาย ฉันพบบทความที่รวมเด็กทารกและไอศกรีมที่เป็นอันตราย: Puzzlers สัมพันธ์จากครูคณิตศาสตร์คณิตศาสตร์กุมภาพันธ์ 2013 ที่จะเป็นประโยชน์ ฉันชอบความคิดในการพูดถึง "ตัวแปรที่ซุ่มซ่อน" การ์ตูนนี้ยังเป็นตัวเริ่มต้นการสนทนาที่น่ารัก

ป้อนคำอธิบายรูปภาพที่นี่

เราระบุตัวแปรอิสระและตัวแปรตามในการ์ตูนและพูดคุยเกี่ยวกับว่านี่เป็นตัวอย่างของสาเหตุหรือไม่ถ้าไม่ใช่เพราะเหตุใด


4

ฉันอ่าน (นานมาแล้ว) เกี่ยวกับตัวอย่างที่น่าสนใจเกี่ยวกับการลดลงของอัตราการเกิด (หรืออัตราการเจริญพันธุ์หากคุณต้องการใช้มาตรการนั้น) โดยเฉพาะอย่างยิ่งในสหรัฐอเมริกาเริ่มต้นในต้นปี 1960 เนื่องจากการทดสอบอาวุธนิวเคลียร์สูง (ในปีพ. ศ. 2504 ระเบิดนิวเคลียร์ที่ใหญ่ที่สุดที่เคยจุดชนวนถูกทดสอบในสหภาพโซเวียต) ราคายังคงดำเนินต่อไปจนถึงปลายศตวรรษที่ยี่สิบเมื่อผู้คนในเมืองส่วนใหญ่หยุดทำเช่นนี้

ฉันไม่สามารถหาข้อมูลอ้างอิงที่รวมตัวเลขเหล่านี้ได้ในตอนนี้ แต่บทความ Wikipedia นี้มีตัวเลขตัวเลขทดสอบอาวุธนิวเคลียร์ตามประเทศ

แน่นอนว่ามันอาจทำให้รู้สึกที่ดีกว่าที่จะดูความสัมพันธ์ของอัตราการเกิดด้วยการแนะนำและการทำให้ถูกต้องตามกฎหมายของยาเม็ดคุมกำเนิด 'บังเอิญ' เริ่มต้นขึ้นในต้นปี 1960 (ในบางรัฐเท่านั้นก่อนจากนั้นรัฐทั้งหมดสำหรับผู้หญิงที่แต่งงานแล้วเท่านั้นบางคนสำหรับไม่ได้แต่งงานแล้วทั่วกระดาน) แต่แม้ที่อาจเป็นเพียงส่วนหนึ่งของสาเหตุ; แง่มุมอื่น ๆ ของความเสมอภาคการเปลี่ยนแปลงทางเศรษฐกิจและปัจจัยอื่น ๆ มีบทบาทสำคัญ


ตัวอย่างที่น่าสนใจเพราะมันมองอย่างรวดเร็วในครั้งแรกเช่นความสัมพันธ์ที่เป็นสาเหตุและผลกระทบที่น่าจะเป็นซึ่งแตกต่างจากตัวอย่างที่โง่เง่ามากมาย
Bossykena

1
สิ่งที่ฉันชอบคือคุณสามารถกระตุ้นให้เกิดการถกเถียงกันมากมายเกี่ยวกับว่า "ผลกระทบ" นั้นส่งผลกระทบต่อภาวะเจริญพันธุ์หรือไม่ (ในแง่ของความสามารถในการตั้งครรภ์) หรือว่าเป็นสังคม ("ฉันไม่ต้องการพาเด็ก ๆ โลก"). จากนั้นวางกระสุนเกี่ยวกับ Pill หากไม่มีผู้ใดนำมันขึ้นมา จากนั้นชี้ให้เห็นว่าแม้สิ่งนี้จะเป็นเพียงปัจจัยเดียวที่เป็นไปได้และพูดถึงเรื่องอื่น ๆ
AdamV

4

ความสัมพันธ์ในตัวมันเองไม่สามารถสร้างการเชื่อมโยงเชิงสาเหตุ David Hume (1771-1776) ได้ถกเถียงอย่างมีประสิทธิภาพว่าเราไม่สามารถได้รับความรู้บางอย่างเกี่ยวกับความอหังการโดยวิธีเชิงประจักษ์อย่างหมดจด Kant พยายามพูดถึงสิ่งนี้หน้า Wikipedia สำหรับKantดูเหมือนจะสรุปได้ค่อนข้างดี:

คานท์เชื่อว่าตัวเองกำลังสร้างการประนีประนอมระหว่างผู้นิยมลัทธินิยมและผู้ใช้เหตุผล นักประสบการณ์นิยมเชื่อว่าความรู้นั้นได้มาจากประสบการณ์เพียงอย่างเดียว แต่ผู้ใช้เหตุผลยืนยันว่าความรู้ดังกล่าวเปิดให้มีข้อสงสัยคาร์ทีเซียนและเหตุผลเพียงอย่างเดียวทำให้เรามีความรู้ อย่างไรก็ตามคานท์แย้งว่าการใช้เหตุผลโดยไม่ใช้มันกับประสบการณ์จะนำไปสู่ภาพลวงตาเท่านั้นในขณะที่ประสบการณ์จะต้องเป็นเรื่องส่วนตัวโดยไม่ต้องถูกรวมเข้าด้วยเหตุผลบริสุทธิ์

ในคำอื่น ๆ ฮูมบอกเราว่าเราไม่สามารถรู้ว่าความสัมพันธ์เชิงสาเหตุนั้นเกิดขึ้นได้เพียงแค่การสังเกตความสัมพันธ์ แต่คานท์แนะนำว่าเราอาจจะสามารถใช้เหตุผลของเราในการแยกแยะความสัมพันธ์ระหว่างความสัมพันธ์ที่บ่งบอกถึงความเชื่อมโยงเชิงสาเหตุ ฉันไม่คิดว่าฮูมจะไม่เห็นด้วยตราบใดที่คานท์กำลังเขียนในแง่ของความน่าเชื่อถือมากกว่าความรู้บางอย่าง

กล่าวโดยย่อความสัมพันธ์แสดงหลักฐานตามสถานการณ์ซึ่งแสดงถึงการเชื่อมโยงเชิงสาเหตุ แต่น้ำหนักของหลักฐานขึ้นอยู่กับสถานการณ์เฉพาะที่เกี่ยวข้องอย่างมากและเราไม่สามารถแน่ใจได้อย่างแน่นอน ความสามารถในการทำนายผลกระทบของการแทรกแซงเป็นวิธีหนึ่งที่จะสร้างความมั่นใจ (เราไม่สามารถพิสูจน์อะไรได้ แต่เราสามารถพิสูจน์ด้วยหลักฐานเชิงสังเกตการณ์ดังนั้นอย่างน้อยเราจึงพยายามปลอมทฤษฎีของการเชื่อมโยงเชิงสาเหตุ) การมีแบบจำลองอย่างง่ายที่อธิบายว่าทำไมเราควรสังเกตความสัมพันธ์ที่อธิบายถึงรูปแบบอื่น ๆ ของหลักฐานเป็นอีกวิธีที่เราสามารถใช้เหตุผลของเราได้ตามที่ Kant แนะนำ

Caveat emptor: มันเป็นไปได้ทั้งหมดที่ฉันเข้าใจผิดเกี่ยวกับปรัชญา แต่มันก็ยังคงเป็นกรณีที่ความสัมพันธ์ไม่สามารถแสดงหลักฐานของการเชื่อมโยงเชิงสาเหตุ


2
สำหรับสิ่งที่คุ้มค่าในคำศัพท์ปัจจุบันผมคิดว่าใครควรอ่านคานท์เป็นซาร์นิโคลัเช่นในการเปรียบเทียบสองว่าสิ่งที่คุณสังเกตความสัมพันธ์มีบางกราฟสาเหตุการสร้างพวกเขา เท่าที่ฉันทราบเขาไม่มีวิธีการเฉพาะในการระบุโครงสร้าง แต่คิดว่ามันจะต้องเชื่อมต่ออย่างสมบูรณ์ (เพราะ 'ทุกเหตุการณ์มีสาเหตุ') ในแง่นี้เขาร่วมสมัยการอนุมานเชิงสาเหตุต้องใช้การผสมผสานของสมมติฐานเชิงสาเหตุเช่นแสดงผ่านกราฟและสังเกตความสม่ำเสมอของข้อมูล และโดยทั่วไปคุณไม่สามารถหลีกเลี่ยงส่วนแรกและไม่ชักจูงจากข้อมูลได้
conjugateprior

+1 อธิบายอย่างดี! บางทีฉันอาจจะเป็นชาว Bayesian แต่ฉันก็ไม่ได้ใส่ใจกับความคิดที่ว่าเราไม่มีความรู้ที่แน่นอนเกี่ยวกับความสัมพันธ์เชิงสาเหตุ
Dikran Marsupial


4

การอ้างอิงมาตรฐานชี้ให้เห็นความสัมพันธ์ระหว่างจำนวนทารกแรกเกิดและคู่นกกระสาที่เพาะพันธุ์ในเยอรมนีตะวันตกเป็นพารามิเตอร์ใหม่สำหรับเพศศึกษาธรรมชาติ 332, 495 (07 เมษายน 2531); ดอย: 10.1038 / 332495a0


3

สเปิร์มนับในผู้ชายในหมู่บ้านสโลวีเนียและจำนวนของหมี (เช่นในสโลวีเนีย) แสดงความสัมพันธ์เชิงลบ บางคนพบว่าสิ่งนี้น่ากังวลมาก ฉันจะพยายามศึกษาให้ดี


3

ฉันเพิ่งไปประชุมและหนึ่งในผู้บรรยายได้ยกตัวอย่างที่น่าสนใจนี้ (แม้ว่าประเด็นจะแสดงให้เห็นอย่างอื่น):

  • คนอเมริกันและอังกฤษกินอาหารไขมันมาก มีอัตราสูงของโรคหัวใจและหลอดเลือดในสหรัฐอเมริกาและสหราชอาณาจักร

  • คนฝรั่งเศสกินอาหารที่มีไขมันมาก แต่ก็มีอัตราการเป็นโรคหัวใจและหลอดเลือดต่ำ

  • ชาวอเมริกันและชาวอังกฤษดื่มแอลกอฮอล์เป็นจำนวนมาก มีอัตราสูงของโรคหัวใจและหลอดเลือดในสหรัฐอเมริกาและสหราชอาณาจักร

  • ชาวอิตาเลียนดื่มเครื่องดื่มแอลกอฮอล์เป็นจำนวนมาก แต่กลับมีอัตราการเป็นโรคหัวใจและหลอดเลือดต่ำ

สรุปหรือไม่ กินและดื่มในสิ่งที่คุณต้องการ และคุณมีโอกาสสูงขึ้นที่จะเป็นโรคหัวใจหากคุณพูดภาษาอังกฤษ!


3
นอกจากนี้ยังเป็นตัวอย่างที่ดีของการเข้าใจผิดทางนิเวศวิทยา (เช่นการอ้างถึงระดับบุคคลจากข้อมูลระดับกลุ่ม)
Jeromy Anglim


3

อีกตัวอย่างหนึ่งของความสัมพันธ์ที่ฉันใช้คือการเพิ่มขึ้นอย่างมากของจำนวนคนที่กินอาหารออร์แกนิกและการเพิ่มขึ้นของจำนวนเด็กที่วินิจฉัยว่าเป็นออทิสติกในสหรัฐอเมริกามีกราฟล้อเลียนบนเว็บ - กราฟล้อเลียนอาหารออทิสติกออร์แกนิก


3

http://tylervigen.com/

สิ่งนี้แสดงให้เห็นถึงความสัมพันธ์จำนวนมากที่เห็นได้ชัดว่าไม่มีส่วนเกี่ยวข้องกับสาเหตุ - หรือคุณมีความคิดที่ดีว่าอะไรคือสาเหตุของความสัมพันธ์ของ Age of Miss America มีความสัมพันธ์กับการฆาตกรรมโดยไอน้ำไอร้อนและวัตถุร้อน

??


2

การสอน "ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ" ไม่ได้ช่วยใครเพราะจริงๆแล้วในตอนท้ายของวันข้อโต้แย้งแบบนิรนัยทั้งหมดนั้นมีพื้นฐานมาจากความสัมพันธ์

มนุษย์เรียนรู้ได้แย่มากที่จะไม่ทำอะไร

เป้าหมายควรเป็นสิ่งที่สร้างสรรค์: คิดถึงทางเลือกต่างๆสำหรับสมมติฐานเริ่มต้นของคุณที่อาจสร้างข้อมูลเดียวกัน


1
สิ่งนี้ไม่ตอบสนองต่อคำถาม: บางทีควรเข้าใจว่าเป็นความคิดเห็น
whuber

2

ดีศาสตราจารย์ของฉันใช้สิ่งเหล่านี้ในระดับความน่าจะเป็นเบื้องต้น:

1) ขนาดของรองเท้ามีความสัมพันธ์กับความสามารถในการอ่าน

2) การโจมตีของปลาฉลามมีความสัมพันธ์กับการขายไอศกรีม


2

ยิ่งเครื่องยนต์ดับเพลิงถูกส่งไปกองไฟก็จะสร้างความเสียหายได้มากขึ้น


1
ปัญหาเดียวที่เกิดขึ้นกับสิ่งนี้เป็นตัวอย่างคือมีสาเหตุที่ชัดเจนย้อนกลับ
naught101

1

ฉันคิดว่ากระบวนทัศน์ที่ดีกว่าอาจเป็นสาเหตุต้องอาศัยสหสัมพันธ์ที่เกี่ยวข้องกับกลไกที่น่าเชื่อถือและพิสูจน์แล้วว่าดีกว่า ฉันคิดว่าควรใช้คำว่านัยมากในบริบทนี้เนื่องจากมีความหมายหลายประการรวมถึงคำแนะนำ


1

ตัวอย่างนกกระสาอยู่ในหน้า 8 ของรุ่นแรก (1978) ของกล่องหนังสือของนักล่า & เธ่อชื่อ "สถิติสำหรับการทดลอง ... " (ไวลีย์) ฉันไม่รู้ว่าเป็นรุ่นที่ 2 หรือไม่ พวกเขาระบุว่าเมืองเป็น Oldenburg และช่วงเวลาเป็น 1930-1936

พวกเขาอ้างอิงOrnithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin และ48 , No 1, Jahrgang, 1940, Berlin และStatistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena


0

ฉันเห็นเรื่องตลกในบทความ

การผลิตเนยในบังคลาเทศมีความสัมพันธ์สูงสุดกับ S&P 500 ในระยะเวลาสิบปี

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-themselves-the-economic-indicator-in-your-pants/


2
ฮะ? กราฟแสดง S&P เมื่อเวลาผ่านไป ชื่อพูดเกี่ยวกับการผลิตเนยและชีสซึ่งไม่สามารถมองเห็นได้บนกราฟ ???
Harvey Motulsky


3
ตกลงตอนนี้ฉันเห็นแล้ว กราฟแสดงการทำนายของตัวแบบการถดถอยหลายแบบซึ่งแสดงว่าการรวมตัวแปรโง่สามตัวนั้นทำได้ดีมากในการทำให้ตัวแบบทำนายการเปลี่ยนแปลงใน SP500 เมื่อเวลาผ่านไป นี่เป็นตัวอย่างที่ดีของการ overfitting ในการถดถอยหลายครั้งและทางอ้อมแสดงให้เห็นว่าความสัมพันธ์ (หรือการปรับปรุงความดีงามของแบบจำลองที่เหมาะสม) ไม่ได้บ่งบอกถึงสาเหตุ
Harvey Motulsky

0

นี่คือหนึ่งที่สมบูรณ์แบบ และน่าเสียดายที่มันสามารถใช้เป็นจุดสอนที่ยอดเยี่ยมได้เนื่องจากเจ้าหน้าที่ของวอชิงตันโพสต์และศูนย์ควบคุมและป้องกันโรคไม่ได้แสดงความรู้ใด ๆ ว่าบทความควรเป็นเรื่องเสียดสีใน The Onion

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837


3
โปรดสรุปสิ่งที่กล่าวไว้ข้างหลังลิงก์ไม่เพียง แต่คุณจะตัดสินว่าผิด
cbeleites

ขอโทษ แต่ฉันคิดว่าอันนี้อธิบายตนเองได้
มาร์กซี.

2
ลิงค์นี้ใช้ได้สำหรับการอ้างอิงไปยังแหล่งข้อมูล แต่คุณไม่ควรคิดว่าทุกคนสามารถอ่านได้จริง (หรือไม่ยุ่งยากมาก) โปรดทราบ: การเชื่อมโยงดังกล่าวอาจมีการเชื่อมโยงเน่ามากและไม่ใช่หนังสือพิมพ์ทุกฉบับที่ให้บริการในทุกภูมิภาค ที่อยู่)
cbeleites

-2

มีคนกล่าวว่าความสัมพันธ์อาจไม่ได้หมายถึงสาเหตุ แต่มันอาจเป็นคำใบ้ที่ดี :)

ตกลงทิ้งส่วนที่สนุกสนานสิ่งที่เป็นสาเหตุคืออะไร? เราแน่ใจจริง ๆ ว่าโจรสลัดไม่ก่อให้เกิดภาวะโลกร้อน?

ตอบโต้ง่าย แต่สิ่งที่เป็นสาเหตุและสิ่งที่เป็นผล (ในการศึกษาความสัมพันธ์ไม่ชัดเจน) แน่นอนว่าหลายครั้งทั้งคู่อาจเป็นสาเหตุของสาเหตุทั่วไป (และสัมพันธ์กัน)

ทุกอย่างเดือดลงไปที่วิธีการกำหนดสาเหตุ

นี่คือสาเหตุ (ปุนตั้งใจ) ของคำพูด:

มีการโกหกเล็ก ๆ น้อย ๆ มีคำโกหกใหญ่และมีสถิติ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.