ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ แต่สิ่งที่เกี่ยวกับเมื่อหนึ่งในตัวแปรเป็นเวลาหรือไม่


41

ฉันรู้ว่าคำถามนี้ถูกถามเป็นพันล้านครั้งดังนั้นหลังจากดูออนไลน์ฉันเชื่อมั่นอย่างเต็มที่ว่าความสัมพันธ์ระหว่าง 2 ตัวแปรไม่ได้บ่งบอกถึงสาเหตุ ในหนึ่งในการบรรยายสถิติของฉันในวันนี้เรามีการบรรยายแบบแขกรับเชิญจากนักฟิสิกส์เกี่ยวกับความสำคัญของวิธีการทางสถิติในฟิสิกส์ เขากล่าวว่าคำสั่งที่น่าประหลาดใจ:

สหสัมพันธ์ไม่ได้บอกถึงสาเหตุ แต่อย่างใดอย่างหนึ่งของตัวแปรคือเวลา ดังนั้นหากมีความสัมพันธ์ที่ดีระหว่างตัวแปรอิสระและเวลาบางอย่างนี่ก็แสดงถึงสาเหตุเช่นกัน

ฉันไม่เคยได้ยินคำแถลงนี้มาก่อน นักฟิสิกส์ / นักสัมพัทธภาพเห็น "สาเหตุ" ต่างจากสถิติของคนหรือไม่?


12
นี่เป็นข้อความที่คลุมเครือและอาจไม่จริง เวลาไม่ก่อให้เกิดอะไรมากมายยกเว้นการสลายกัมมันตรังสี คำศัพท์มีแนวโน้มที่จะปรับปรุงตามอายุ แต่มันก็เป็นสื่อกลางทั้งหมดโดยการขัดเกลาทางสังคมและการศึกษา คุณสามารถอธิบายบริบทและปัญหาที่ข้อความนี้ยืนยันได้หรือไม่?
AdamO

@AdamO เงื่อนไขสำหรับเวรกรรมนั้นง่ายกว่าเมื่อคุณรู้ว่ามีความสำคัญทางโลก แต่มันไม่ง่ายอย่างที่เป็นในคำถามนี้
Neil G

2
มันเกือบจะเสียงเหมือนพวกเขาจะอธิบายเกรนเจอร์เวรกรรม
บาร์เกอร์

1
แค่สังเกตว่าถ้าคุณอยากรู้ว่านักฟิสิกส์มองเห็นเวรกรรมอย่างไรคุณมีแนวโน้มที่จะได้คำตอบเกี่ยวกับฟิสิกส์มากกว่า คำถามนี้มีการแก้ไขในหัวข้อนั้น
David Z

2
ฉันได้ยินมาว่าการเพิ่มเวลาให้กับโมเดลเป็นตัวแปรอิสระหมายความว่าคุณไม่ได้ใช้เวลามากในการพยายามสร้างแบบจำลองกระบวนการสร้างข้อมูลที่สร้างตัวแปรตาม
Alexis

คำตอบ:


37

ฉันจะให้คำตอบอีกครั้งเนื่องจากฉันคิดว่าคำที่ให้ไว้ในตอนนี้พลาดจุดสำคัญของข้อความที่นักฟิสิกส์ทำ คำสั่งที่ยกมาคือ:

"ความสัมพันธ์ไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผลเว้นแต่เป็นหนึ่งในตัวแปรคือเวลาดังนั้นหากมีความสัมพันธ์ที่แข็งแกร่งระหว่างตัวแปรอิสระและเวลาบางอย่างแล้วสิ่งนี้ก็หมายถึงสาเหตุเช่นกัน"

นักฟิสิกส์ไม่ได้พูดว่า:

"ถ้า X และ Y มีความสัมพันธ์กันและ X มาก่อน Y ความสัมพันธ์นั้นมีความหมายถึงสาเหตุ"

นั่นจะไม่ถูกต้อง สิ่งที่นักฟิสิกส์กำลังพูดคือ:

"ถ้า X และเวลาสัมพันธ์กันสหสัมพันธ์นั้นก็หมายความว่าเวลาที่เพิ่มขึ้นทำให้เกิดการเพิ่มขึ้น (หรือลดลง) ใน X"

ตัวอย่างอาจเป็นเอนโทรปี หากเรามีความสัมพันธ์ที่แข็งแกร่งระหว่างเวลาที่ผ่านไปและการเพิ่มขึ้นของเอนโทรปีเราอาจพูดได้ว่าเวลาที่เพิ่มขึ้นทำให้การเพิ่มขึ้นของเอนโทรปี โปรดทราบว่าสิ่งนี้ไม่สนใจว่าสาเหตุทางกายภาพของการเพิ่มของเอนโทรปีอาจเป็นอย่างไร (การสลายตัวของอนุภาคการขยายตัวของเอกภพ ฯลฯ )

หนึ่งในข้อกำหนดดั้งเดิมสำหรับสาเหตุคือความก้าวหน้าของเวลานั่นคือ X จะทำให้เกิด Y ถ้า X มาก่อน Y แต่ถ้าหนึ่งในตัวแปรของคุณคือเวลาแล้วความก้าวหน้าของเวลาจะถูกสร้างขึ้นในความสัมพันธ์ (ถ้ามีความสัมพันธ์อยู่)

แก้ไข: ขึ้นอยู่กับความคิดเห็นที่หลากหลายฉันจะเพิ่มต่อไปนี้ ฉันคิดว่านักฟิสิกส์อาจใช้ความคิดที่แตกต่างกันของคำว่า "สาเหตุ" ที่นี่ ดูเหมือนว่าเขาจะบอกว่าหากมีความสัมพันธ์ระหว่างตัวแปรอิสระกับเวลาคุณสามารถสรุปได้ว่าตัวแปรอิสระเปลี่ยนแปลงตามเวลาที่คาดการณ์ไว้ บางคนอาจบอกว่าการเปลี่ยนแปลงนั้น "เกิดขึ้น" เมื่อเวลาผ่านไปนี่ไม่ใช่วิธีที่นักสถิติใช้คำว่า "สาเหตุ" หรือ "สาเหตุ" เพื่อที่จะทำให้เกิดความสับสน


3
1 แน่นอนว่าเป็นวิธีที่ผมตีความคำสั่งเช่นกัน (ดูความคิดเห็นก่อนหน้านี้ของฉันและคำตอบ)
รูเบนฟานเบอร์เกน

5
หากคุณกำลังจะทำให้เวลาตัวแปรในแบบกราฟิกของคุณแล้วเวลาไม่มีสาเหตุและเป็นสาเหตุของทุกอย่าง ดังนั้นจึงเป็นข้ออ้างที่อ้างว่าว่างเปล่าเพื่อแนะนำเวลาที่ทำให้เกิดสิ่งใดโดยเฉพาะตั้งแต่เวลาทำให้ทุกอย่าง
Neil G

2
ไม่มีความหมายหรือเปล่านี่เป็นการตีความที่ดูเหมือนสอดคล้องกับสิ่งที่นักฟิสิกส์กล่าวไว้ อย่ายิงผู้ส่งสาร;) นอกจากนี้ฉันคิดว่ามันเป็นจุดที่ควรทำหากวัตถุประสงค์คือเพื่อให้ความรู้แก่ผู้คนเกี่ยวกับความสัมพันธ์ระหว่างสหสัมพันธ์และสาเหตุแม้ว่าคุณจะคิดว่ามันสำคัญมากที่จะต้องพิจารณาเวลาที่ก่อให้เกิดสิ่งต่าง ๆ ในทางปฏิบัติ
Ruben van Bergen

6
@ GeoMatt22 - ฉันไม่เห็นด้วยกับความคิด "เวลาทำให้ทุกอย่าง" พิจารณาการพลิกเหรียญหลายครั้ง - แม้ว่าฉันจะพลิกเป็นชั่วโมงฉันก็ควรจะได้อัตราส่วน 1/2 ต่อหัวดังนั้นเวลาจะไม่ "ทำให้" ความน่าจะเป็นของหัวขึ้นหรือลง นำก้อนน้ำแข็งออกมาในห้องและอุณหภูมิจะเพิ่มขึ้นและมันจะละลายเมื่อเวลาผ่านไป "ทำให้" ความสมดุลของอุณหภูมิในกรณีนี้ นี่อาจเป็นความรู้สึกที่แตกต่างของคำว่า "สาเหตุ" ที่นักสถิติใช้ แต่ฉันคิดว่ามันเป็นการตีความเชิงหน้าที่จากมุมมองของฟิสิกส์
Duncan

6
ประเด็นก็คือคุณจะไม่พิจารณาโครงสร้างกราฟิกโดยที่ตัวแปรใดเป็นสาเหตุของเวลา ดังนั้นโครงสร้างกราฟิกเพียงอย่างเดียวคือเวลานั้นเป็นสาเหตุของตัวแปรอื่น ๆ ทั้งหมด มันอาจจะมีอย่างไม่มีอิทธิพลต่อพวกเขา (ในขณะที่ตัวอย่างของคุณ) แต่ลูกศรสาเหตุที่มีการเรียกร้องเกี่ยวกับโครงสร้างกราฟิกสาเหตุซึ่งแสดงถึงความสัมพันธ์ที่เป็นอิสระตามเงื่อนไขที่ได้รับการสังเกตและการแทรกแซง ความเข้มแข็งของอิทธิพลเป็นคำถามแยกต่างหาก
Neil G

15

เราไม่รู้ว่านักฟิสิกส์หมายถึงอะไร สองการตีความที่แตกต่างกันตามมา


Y Y X Y X Y X Y X Y W X W Y X V Z W YXYYXYXYXYXYWXWYXVZWYZXY ขึ้นอยู่กับสาเหตุและไม่มีสาเหตุ แต่ไม่มีสาเหตุอื่น

อย่างไรก็ตามความสำคัญทางโลกได้ทำให้เงื่อนไขในการยืนยันความสัมพันธ์เชิงสาเหตุลดลงอย่างมากซึ่งคุณสามารถหาได้จากหนังสือสาเหตุของไข่มุกบทที่ 2.7 "เกณฑ์ท้องถิ่นสำหรับความสัมพันธ์เชิงสาเหตุ"

XYZSX

  1. (Z⊥̸YS)
  2. (ZYSX)

เป็นหลัก (1) หมายความว่าเป็นสาเหตุที่มีศักยภาพของให้ความสำคัญชั่วคราวและ (2) หมายความว่าคือสามารถที่จะทำลายความสัมพันธ์ที่ซึ่งสามารถเกิดขึ้นได้เฉพาะในกรณีที่ที่ทำให้เกิดYZYXXY

เงื่อนไขนี้ง่ายกว่าคำจำกัดความของ Pearl สำหรับสาเหตุแท้จริงโดยไม่มีข้อมูลชั่วคราว


เป็นไปได้ก็ระบุไว้ในบางส่วนของคำตอบอื่น ๆ คือการที่นักฟิสิกส์นั่นหมายความว่าถ้าเป็นเนื้อเรื่องของเวลาและก็มีความสัมพันธ์กับแล้วทำให้เกิดYคำสั่งนี้ถูกต้อง แต่ไม่มีความหมายตั้งแต่กาลเวลาเป็นสาเหตุของตัวแปรอื่น ๆ ทั้งหมดโดยที่ฉันหมายความว่าโครงสร้างกราฟิกเชิงสาเหตุเป็นวิธีนี้ โครงสร้างกราฟิกเชิงสาเหตุเป็นชุดของการอ้างสิทธิ์เกี่ยวกับความสัมพันธ์อิสระที่ได้รับจากการสังเกตและการแทรกแซงXYXY


2
ดังที่ฉันได้กล่าวถึงในความคิดเห็นต่อคำตอบของ GeoMatt22 ฉันไม่คิดว่าคำพูดของนักฟิสิกส์มีความสำคัญอะไร
Ruben van Bergen

2
@RubenvanBergen ตามที่ฉันอธิบายไว้ในคำตอบอื่นการตีความนั้นไม่มีความหมาย เวลาทำให้ทุกอย่าง
Neil G

ในตัวอย่างของคุณ ,และจะขึ้นอยู่กับ แต่ไม่ใช่สหสัมพันธ์ (ยกเว้นและที่สัมพันธ์กันผ่านการเชื่อมต่อที่คุณไม่ได้ระบุ) XVZWYXYVW
Ruben van Bergen

@RubenvanBergen พวกเขาอาจมีความสัมพันธ์กัน มันขึ้นอยู่กับลักษณะของการพึ่งพา โดยวิธีการที่ฉันกล่าวว่าและขึ้นอยู่กับให้สังเกต XYZ
Neil G

1
@ RubenvanBergen ฉันคิดว่าคุณเข้าใจผิดกับลูกศร เหล่านี้เป็นสาเหตุที่ลูกศรและข้อมูลที่สามารถไหลจากเพื่อเนื่องจากการอธิบายออกไปที่Zพิจารณาคือ "Rain",คือ "Sprinkler is off",เป็นพื้นเปียกคือเสียงของฝนและเป็นตัวบ่งชี้สำหรับสปริงเกอร์ที่ถูกปิด ตอนนี้พื้นดินเปียกมีความสัมพันธ์กับเนื่องจากอธิบายออกไป VWZVWZXYXY
Neil G

10

ฉันคาดการณ์ว่าอาจารย์ผู้สอนแขกของคุณหมายความว่าในวิชาฟิสิกส์ความสัมพันธ์เดียวที่อยู่รอดจากการจำลองแบบคือสิ่งที่มีความสัมพันธ์เชิงสาเหตุ ตัวแปรเวลาเป็นข้อยกเว้นเนื่องจากเป็นตัวแปรเดียวที่ไม่ได้ควบคุมโดยนักฟิสิกส์ นี่คือเหตุผล

ในวิชาฟิสิกส์เรามักจะจัดการกับปรากฏการณ์และการทดลองที่ทำซ้ำได้ ตามความจริงแล้วเกือบจะเป็นเรื่องที่กำหนดว่าการทดลองใด ๆ สามารถทำซ้ำได้และคุณสามารถทำซ้ำได้ในภายหลังหรือโดยนักวิจัยคนอื่น ๆ ดังนั้นขอบอกว่าคุณสังเกตตัวอย่างที่มีข้อสังเกตของตัวแปรที่น่าสนใจและตัวแปรอิสระx_kดังที่ได้กล่าวมาแล้วเราควบคุมตัวแปรได้อย่างเต็มที่และสามารถตั้งค่าให้เป็นค่าใด ๆ ที่เราต้องการyi,xkixkxk

นักฟิสิกส์ของคุณกำลังบอกว่าในการตั้งค่านี้คุณจะไม่เห็นความสัมพันธ์ใด ๆเว้นแต่จะมีการเชื่อมโยงเชิงสาเหตุ ทำไม? เพราะคนอื่นหรือตัวคุณเองจะทำการทดสอบซ้ำด้วยชุดค่าผสมและลำดับของๆ และมีเพียงความสัมพันธ์ที่มีความสัมพันธ์เชิงสาเหตุเท่านั้นที่จะอยู่รอดการจำลองแบบของการทดสอบ ความสัมพันธ์ (ปลอม) อื่น ๆ ทั้งหมดจะหายไปเมื่อคุณรวบรวมข้อมูลเพียงพอในชุดค่าผสมที่เป็นไปได้ทั้งหมดของการทดสอบx k jCorr[y,xk]xkj

สถานการณ์นี้ตรงกันข้ามกับสังคมศาสตร์และแอปพลิเคชันธุรกิจที่คุณไม่สามารถทำการทดลองได้ คุณสังเกตเพียงหนึ่งลำดับของ GDP ของประเทศและไม่สามารถเปลี่ยนการว่างงานที่ถือครองเท่าเทียมกันและสังเกตความสัมพันธ์

ตอนนี้เวลาเป็นตัวแปรเดียวที่นักฟิสิกส์ไม่สามารถควบคุมได้ มีเพียงวันเดียว 1 มกราคม 2017 เขาไม่สามารถทำซ้ำในวันนี้ เขาสามารถทำซ้ำตัวแปรอื่น ๆ ได้ แต่ไม่ใช่เวลา นั่นเป็นเหตุผลที่เมื่อถึงเวลา ( ไม่ใช่เวลาหรืออายุที่หมดอายุ) นักฟิสิกส์อยู่ในเรือลำเดียวกันกับคนอื่น ๆ ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุของเขา


5

ฉันไม่เคยได้ยินเรื่องนี้มาก่อนและมันจะไม่เป็นจริงตามแนวคิดของความเป็นเหตุเป็นผลที่ฉันคุ้นเคย (แม้ว่าฉันไม่ใช่นักฟิสิกส์)

โดยปกติสำหรับสาเหตุมันเป็นสิ่งจำเป็นที่แจ๋วในเวลา ดังนั้นถ้านำหน้ามันจะไม่สามารถ "ทำให้เกิด" โดยไม่ว่าจะมีความสัมพันธ์ใด ๆ ก็ตาม ยิ่งกว่านั้นก่อนหน้าไม่เพียงพอสำหรับสาเหตุ (เช่นกันโดยไม่คำนึงถึงความสัมพันธ์ใด ๆ )Y X Y Y X X X YXYXYYXXXY


1
ฉันคิดว่าคุณเข้าใจผิดว่านักฟิสิกส์คนนี้หมายถึงอะไร ฉันคิดว่าพวกเขากำลังอ้างถึงสถานการณ์ที่ตัวแปรสองตัวมีความสัมพันธ์ซึ่งกันและกันและหนึ่งในตัวแปรเหล่านี้คือเวลา คุณกำลังสมมติว่าตัวแปรไม่ได้เป็นเวลา แต่สิ่งที่เวลาเข้ามาคือตัวแปรตัวหนึ่งนำหน้าตัวอื่น
Ruben van Bergen

3
ฉันพยายามที่จะแสดงให้เห็นว่าโดยทั่วไปแล้วเวลาที่ต้องการสำหรับการเปลี่ยนแปลงบางอย่างในเป็น "เกิด" โดยบางสิ่ง แต่ความสัมพันธ์ของเทียบกับไม่พูดโดยทั่วไปว่าเป็น "เวรกรรม" (aคือ จำเป็น แต่ไม่เพียงพอ) ฉันหมายถึงการสื่อสารที่ฉันไม่ทราบว่านี่คือสิ่งที่นักฟิสิกส์มีความหมายหรือไม่ ฉันคิดว่านักฟิสิกส์มักจะพูดว่า "การลดลงของคาร์บอน 14 ตลอดเวลาเกิดจากการสลายตัวของกัมมันตภาพรังสี )" มากกว่า "... เกิดจากกาลเวลา" (แม้ว่าอาจจะ " ต้องใช้เวลา")Y t t Δ tYYttΔt
GeoMatt22

@RubenvanBergen บางทีผู้บรรยายพยายามที่จะแสดงสิ่งที่ง่ายกว่าแบบที่ Wikipedia ดูเหมือนจะเรียกว่า " โครงสร้างเชิงสาเหตุ "? ความสัมพันธ์กับเวลา (ในระดับที่ดีพอ) จะบ่งบอกถึงความแตกต่างใน "เวลาเหมือนทิศทาง" ฉันอาจจะอ่านผิด แต่ skimming Wikipedia แนะนำการใช้งานคล้ายกับที่ฉันเขียนไว้ด้านบน: "โครงสร้างเชิงสาเหตุ" กำหนดว่า "นำหน้า" หมายถึงอะไร แต่ก็ดูเหมือนว่า "จำเป็น แต่ไม่เพียงพอ" สำหรับฉัน
GeoMatt22

ฉันเพียงแค่พูดโดยอ้างถึงคำถาม: "ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุไม่มีตัวแปรอย่างใดอย่างหนึ่งคือเวลาดังนั้นหากมีความสัมพันธ์ที่แข็งแกร่งระหว่างตัวแปรอิสระกับเวลาบางอย่าง สำหรับฉันนี่แสดงว่าเรามีตัวแปร X บางตัวที่สัมพันธ์กับเวลา เราสรุปได้ว่ากาลเวลาทำให้เกิด X มากกว่า X ทำให้เกิดเวลาผ่านไปเพราะหลังไม่มีความหมาย
Ruben van Bergen

4

ฉันไม่คิดว่าเวลาจะมีความพิเศษในเรื่องนี้ แต่มันก็เป็นตัวอย่างที่ดี ประเด็นก็คือโดยทั่วไปถ้า A & B มีความสัมพันธ์กันคุณสามารถคาดการณ์ได้ว่ามีสาเหตุบางอย่างร่วมกัน แต่คุณไม่รู้ว่า A เป็นสาเหตุของ B หรือ B ทำให้ A หรืออาจเป็นสาเหตุหนึ่งที่ทำให้ตัวแปร A & B ทั้งสองอย่างไรก็ตาม ในบางกรณีคุณสามารถแยกแยะว่าตัวแปรอื่นใดที่ทำให้เกิด A ดังนั้นต้องเป็น A ที่เกิดจาก B ตัวอย่างหนึ่งตัวอย่างเช่นการทดสอบที่ควบคุมซึ่งคุณผู้ทดลองควบคุม A จากนั้นหากการเปลี่ยนแปลงที่คุณทำ A "สัมพันธ์" กับการเปลี่ยนแปลงใน B คุณรู้ว่ามันต้องเป็น A ที่ทำให้ B เปลี่ยนไปไม่ใช่วิธีอื่น

สถานการณ์อีกประเภทหนึ่งซึ่งเป็นหนึ่งในตัวอย่างที่มีเวลาตกลงกันคือถ้าคุณรู้ว่าไม่มีตัวแปรอื่นใดที่อาจทำให้เกิด A เพราะคุณรู้ว่าไม่มีสิ่งใดที่จะมีอิทธิพลต่อ A. ตั้งแต่เวลาเพียงแค่ไหลทีละวินาที ของตัวแปรอื่น ๆ ในโลกดังนั้นถ้าเวลามีความสัมพันธ์กับการเปลี่ยนแปลงในตัวแปรบางอย่างที่คุณสนใจ (กล่าวคือจำนวนผู้คนบนโลก) คุณรู้แน่ว่าเวลาผ่านไปต้องทำให้ตัวแปรนั้นเปลี่ยนไป กว่าตัวแปรของคุณทำให้เวลาที่จะผ่านหรือเปลี่ยนแปลง (เช่นเวลาไม่ได้ไปข้างหน้าเพราะมีคนเกิดมามากขึ้นมันต้องเป็นอย่างอื่น)

แน่นอนว่าสิ่งที่คุณยังไม่รู้ก็คือว่าสิ่งที่เป็นสาเหตุโดยตรง สันนิษฐานว่ากาลเวลาไม่ได้ทำให้มนุษย์มีจำนวนมากขึ้นโดยอัตโนมัติ แต่ประวัติศาสตร์การตีแผ่ทำให้เกิดความก้าวหน้าในด้านต่าง ๆ ของสังคมและทำให้ประชากรเพิ่มขนาด (และนั่นก็คือการทำให้ความสัมพันธ์เชิงสาเหตุมีน้อยมาก) แต่โดยไม่คำนึงถึงปัจจัยที่แม่นยำในการเล่นคุณรู้แน่นอนว่า A (ท้ายที่สุด) นำไปสู่ ​​B และไม่ใช่วิธีอื่น ๆ


ในวรรคแรกกรณีทั้งสามของคุณไม่ครบถ้วนสมบูรณ์ มีโครงสร้างกราฟิกอื่น ๆ ที่เข้ากันได้กับความสัมพันธ์
Neil G

การพิจารณาจากตัวแปรอื่น ๆ ทั้งหมดที่ก่อให้เกิดนั้นเป็นไปไม่ได้สำหรับปัญหาที่เกิดขึ้นจริง มีวิธีการโดยคุณออกกฎการไหลของข้อมูลผ่านทางสาเหตุของการเป็นที่นำไปสู่ซึ่งเรียกว่าวิธีการที่ประตูหลัง สิ่งนี้สามารถสร้างเวรกรรม A BAAB
Neil G

1
ดังที่ฉันได้กล่าวไว้ในคำตอบอื่นความคิดในการตีความ "เวลา" เป็นตัวแปรและอ้างว่ามันจะต้องเป็นสาเหตุของตัวแปรอื่น ๆ ที่ไม่มีความหมาย ตัวแปรเวลานี้เป็นสาเหตุของทุกสิ่ง
Neil G

ในวงกว้างฉันค่อนข้างมั่นใจว่าตัวเลือกที่ฉันระบุไว้นั้นเป็นไปได้ทั้งหมด เราสามารถมี A ก่อให้เกิด B หรือ B ก่อให้เกิด A (โดยตรงหรือโดยอ้อม) หรือเรามีอย่างอื่นที่ก่อให้เกิดทั้ง A & B แน่นอนว่าการรวมกันของสิ่งเหล่านี้เป็นไปได้เช่นกันที่เช่น A มีผลเชิงสาเหตุต่อ B ในขณะเดียวกันปัจจัยที่สาม C ก็มีผลกระทบต่อทั้ง A & B จากนั้นฉันก็เดาว่ามีความบังเอิญเหมือนตัวเลือกอื่น แต่นั่นน่าเบื่อ แต่ฉันอยากรู้อยากเห็นความเป็นไปได้อื่น ๆ
Ruben van Bergen

1
ลองดูคำตอบของฉัน ฉันแสดงกรณีที่สี่แม้ว่าจะมีอีกหลายกรณี
Neil G

4

ที่จริงแล้วความสัมพันธ์นั้นแสดงถึงความสัมพันธ์เชิงสาเหตุ

อาจเกิดจาก B หรือ C เกิดจาก A และ B

อย่างไรก็ตามความสัมพันธ์ไม่ได้พิสูจน์สาเหตุ

นี่คือตัวเองชัดเจน


5
เมื่อมองไปรอบ ๆ คำตอบและความคิดเห็นแสดงให้เห็นว่าการสนทนาที่นี่ผ่านพ้นไปจากเรื่องไร้สาระเช่นนั้น ฉันขอแนะนำให้ตรวจสอบบางโพสต์เพื่อช่วยในการชื่นชมปัญหา
whuber

3

ฉันจะตีความว่านี่เป็นความหมายมากกว่าการโต้แย้งทางคณิตศาสตร์ / สถิติ ฉันจะใช้มันเป็นลักษณะทั่วไปที่ค่อนข้างรุนแรง

เกณฑ์แบรดฟอลฮิลล์ ,มักใช้ในการระบาดวิทยาให้กรอบที่ดีสำหรับการคิดเกี่ยวกับสาเหตุ ไม่มีอะไรสามารถพิสูจน์สาเหตุที่แน่ชัดได้ไม่ว่าเวลาจะเป็นปัจจัยหรือไม่และฉันสงสัยว่าอาจารย์ไม่ได้พยายามยืนยันเช่นนั้น อย่างไรก็ตามปัจจัยต่าง ๆ มากมายสามารถใช้เป็นข้อโต้แย้งที่สมเหตุสมผลสำหรับสาเหตุ

ตัวอย่างเช่นเกณฑ์แบรดฟอร์ดฮิลล์ชี้ให้เห็นว่าความแข็งแกร่งของการเชื่อมโยงระหว่างตัวแปรสามารถแสดงหลักฐานสำหรับสาเหตุได้ แต่ยังไม่เพียงพอ ในทำนองเดียวกันการเชื่อมโยงที่สอดคล้องกับข้อเท็จจริงที่รู้จัก / เชื่ออื่น ๆ อาจแนะนำการทำให้เกิดแรงยิ่งกว่าการเชื่อมโยงที่ไม่สอดคล้องกับความรู้ที่แพร่หลาย ชั่วคราวก็เป็นหนึ่งในเกณฑ์ - สาเหตุควรนำหน้าผลกระทบของมัน สมาคมและการอนุมานที่เราทำเกี่ยวกับสาเหตุต้องทำให้เกิดความรู้สึกทางโลก ฉันขอแนะนำให้ตรวจสอบเกณฑ์อื่น ๆ บางคนมีความเฉพาะเจาะจงกับระบาดวิทยาและไม่สามารถใช้ได้กับฟิสิกส์ แต่ก็ยังเป็นวิธีคิดที่มีประโยชน์

ประเด็นหลักคือในขณะที่ไม่มีหลักฐานชิ้นใดที่จะพิสูจน์สาเหตุที่แน่นอนคุณสามารถสร้างกรณีที่ดีขึ้นอยู่กับการตรวจสอบตรรกะที่แตกต่างกัน ฉันจะยืนยันว่าการให้ความสำคัญกับเกณฑ์หนึ่งอย่างใดอย่างหนึ่งอย่างเช่นเวลาไม่เหมาะสม แต่การมีลักษณะชั่วคราวอาจเป็นปัจจัยสำคัญในการสร้างกรณีที่มีสาเหตุที่เป็นไปได้

สิ่งนี้นำไปสู่จุดที่กว้างขึ้นเกี่ยวกับสถิติ: โดยทั่วไปเราใช้สถิติเพื่อสร้างการโต้แย้ง เราใช้ข้อมูลและเครื่องมือทางสถิติเพื่อสร้างจุดที่แน่นอน บ่อยครั้งที่ข้อมูลเดียวกัน (และแม้แต่เครื่องมือเดียวกัน) สามารถใช้เพื่อสร้างจุดที่ขัดแย้งกัน เราไม่สามารถหาหลักฐานยืนยันที่ชัดเจนเกี่ยวกับสาเหตุในคณิตศาสตร์ได้ แต่เราสามารถปรับใช้เครื่องมือทางสถิติของเราเป็นส่วนหนึ่งของการโต้แย้งที่กว้างขึ้น สำหรับข้อมูลเพิ่มเติมฉันขอแนะนำสถิติของ Abelson เพื่อเป็นหลักการในการโต้แย้ง

ในการวนกลับไปสู่สถานการณ์เดิมสมมติว่าคุณได้ทำการทดลองเกี่ยวกับผลกระทบของความเข้มข้นของสารเคมีบางอย่างในสารละลายที่มีต่ออุณหภูมิของสารละลายนั้น คุณสงสัยว่าการเพิ่มสารเคมีนี้จะส่งผลให้เกิดปฏิกิริยาที่เพิ่มอุณหภูมิ คุณเพิ่มมากขึ้นเรื่อย ๆ เมื่อเวลาผ่านไป คุณสามารถดูอุณหภูมิเทียบกับเวลาและดูการเพิ่มขึ้น ทั้งหมดนี้แสดงให้เห็นว่าอุณหภูมิเพิ่มขึ้นตามเวลา มันไม่ได้พิสูจน์เวลาที่ตัวเอง (หรือสิ่งอื่นใดสำหรับเรื่องนั้น) มีผลกระทบเชิงสาเหตุบางอย่าง อย่างไรก็ตามมันมีหลักฐานบางอย่างในการโต้แย้งที่กว้างขึ้นที่เพิ่มความเข้มข้นของสารเคมีนี้ส่งผลให้เกิดปฏิกิริยาที่เพิ่มอุณหภูมิ


มันเป็นความคิดที่แปลกประหลาดที่จะนำเกณฑ์ฮิลล์ของ "ความสำคัญทางโลก" มาใช้กับการเปิดเผยเวลา เวลานำหน้าแน่นอนเวลา แนวโน้มที่เรารู้ว่าไม่ค่อยจะมีสาเหตุ แต่สะท้อนให้เห็นถึงปรากฏการณ์อื่น ๆ พร้อมกัน ในตัวอย่างนี้ฉันไม่คิดว่าเวลาก่อให้เกิดอะไร แต่สรุปการเปลี่ยนแปลงระดับโลกในการตั้งค่าที่เกิดขึ้นกับการเปิดรับและผลลัพธ์
AdamO

ฉันไม่ได้โต้แย้งว่าเราใช้การโต้เถียงกับเวลามากพอ ๆ กับการบอกว่าถ้าเรามีเวลาเป็นส่วนหนึ่งของข้อมูลของเราเราสามารถใช้มันเพื่อทำให้ส่วนหนึ่งของการโต้แย้งที่กว้างขึ้นสำหรับสาเหตุ โดยการแสดงให้เห็นว่าการสังเกตของเราทำให้เกิดความรู้สึกทางโลกเราก็ใกล้จะมีเหตุผลที่สมเหตุสมผล หวังว่าเราจะมีมากกว่านั้นในการทำงานเพื่อสร้างข้อโต้แย้งที่แข็งแกร่ง
djlid

3

ประโยคค่อนข้างง่ายและไม่คุ้มค่ากับการคิดมาก (และไม่เกี่ยวข้องกับลำดับความสำคัญ)

หากมีความสัมพันธ์ที่จัดตั้งขึ้นระหว่างตัวแปรและเวลา (เช่นเรารู้ว่าการเพิ่มขึ้นของเวลานั้นมาพร้อมกับการเพิ่มขึ้นของตัวแปรและนี่คือที่ได้รับ ) จากนั้นเราก็รู้ทิศทาง "สาเหตุ": เวลาเพิ่มขึ้นสาเหตุ ตัวแปรที่จะเพิ่มขึ้น

เนื่องจากสมมติฐานทางเลือกของ "nah-uh อาจเป็นเวลาที่เพิ่มขึ้นเพียงเพราะตัวแปรที่เพิ่มขึ้นครั้งแรก " ก็ไม่สามารถทนต่อการทำงานของเวลา


สิ่งนี้อาจฟังดูไร้สาระ แต่มันมีนัยยะสำคัญสำหรับการออกแบบการศึกษาที่พยายามพิสูจน์ทิศทางเชิงสาเหตุ ตัวอย่างที่สำคัญในทางการแพทย์คือความแตกต่างระหว่างการทำแบบตัดขวางและการศึกษาหมู่

ยกตัวอย่างเช่นการศึกษาแบบภาคตัดขวางที่พยายามค้นหาความเชื่อมโยงระหว่างการสูบบุหรี่กับโรคมะเร็งอาจทำให้คนกลุ่มหนึ่งแบ่งมันออกเป็นผู้สูบบุหรี่กับผู้ไม่สูบบุหรี่และดูว่าแต่ละคนมีมะเร็งจำนวนเท่าใดและไม่มีมะเร็ง อย่างไรก็ตามนี่เป็นหลักฐานที่อ่อนแอเนื่องจากความสัมพันธ์ระหว่างการสูบบุหรี่กับโรคมะเร็งสามารถตีความได้ว่าเป็น "คนที่เป็นมะเร็งมีแนวโน้มที่จะเพลิดเพลินกับการสูบบุหรี่"

อย่างไรก็ตามหากคุณทำการศึกษาแบบกลุ่มคือกลุ่มผู้สูบบุหรี่และกลุ่มที่ไม่สูบบุหรี่และติดตามพวกเขาตลอดเวลาและวัดตัวแปร "มะเร็งในผู้สูบบุหรี่ลบมะเร็งในผู้ไม่สูบบุหรี่" และสร้างผลบวก ความสัมพันธ์ของตัวแปรนี้กับเวลา (ภายใต้สมมติฐานที่สมเหตุสมผลเช่นปริมาณการสูบบุหรี่ที่เริ่มต้นครั้งนั้นคงที่และไม่ขึ้นกับเวลา ฯลฯ ) จากนั้นคุณรู้ว่า "เวลา" เป็นสาเหตุของความแตกต่างของมะเร็งเนื่องจากคุณไม่สามารถเรียกร้องได้ว่า ทำให้เวลาผ่านไปมากขึ้นในกลุ่มที่สูบบุหรี่ ดังนั้นคุณสามารถอ้างถึงสาเหตุระหว่างเวลาที่ผ่านไปและความแตกต่างในเชิงบวกของโรคมะเร็งที่เกี่ยวข้องกับอัตราที่สูงขึ้นในกลุ่มผู้สูบบุหรี่ (หรือมากกว่าที่กล่าวไว้อย่างง่าย ๆ เวลาที่อยู่ในกลุ่มสูบบุหรี่ทำให้เกิดความเสี่ยงต่อโรคมะเร็งเพิ่มขึ้นตามสัดส่วน)

ยิ่งไปกว่านั้นความอ่อนแอของการศึกษาแบบภาคตัดขวางคือความเป็นไปได้ที่ว่า "คนที่เป็นมะเร็งมีแนวโน้มที่จะสูบบุหรี่มากขึ้น" ออกไปนอกหน้าต่างเนื่องจากการสูบบุหรี่ในฐานะตัวแปรถูกนำออกจาก "เวลาเทียบกับมะเร็ง" สมการ (นี่ถือว่าเป็นค่าคงที่และไม่ได้รับผลกระทบจากเวลา) ในคำอื่น ๆ โดยการสร้างการศึกษาในลักษณะนี้ที่เราได้ตรวจสอบที่เฉพาะเจาะจงมากทิศทางเชิงสาเหตุ หากเราต้องการตรวจสอบขอบเขตที่ทิศทางเชิงสาเหตุย้อนกลับไปใช้ (เช่นมีความเป็นไปได้มากแค่ไหนที่คนที่เป็นมะเร็งในที่สุดจะสูบบุหรี่เมื่อเวลาผ่านไป) ดังนั้นเราต้องออกแบบการศึกษาแบบแบ่งกลุ่ม "มะเร็งในอนาคตกับมะเร็งในอนาคต" และวัดปริมาณการสูบบุหรี่เมื่อเวลาผ่านไป

อัปเดตการตอบสนองต่อความคิดเห็น:

โปรดทราบว่านี่เป็นการสนทนาเกี่ยวกับทิศทางเชิงสาเหตุมากกว่าการค้นหาลิงก์สาเหตุโดยตรง คำถามของการรบกวนคือสิ่งที่แยกจากกัน (นั่นคือไม่มีอะไรที่จะแนะนำว่าไม่มีตัวแปรที่สามที่เป็นอิสระซึ่งทั้งคู่ทำให้คุณมีแนวโน้มที่จะเป็นผู้สูบบุหรี่และเพิ่มโอกาสในการเป็นมะเร็งด้วยเวลา) กล่าวคือในแง่ของสาเหตุเชิงต่อต้านเราไม่ได้แสดงให้เห็นอย่างชัดเจนว่า "ถ้าไม่สูบบุหรี่คนเหล่านี้จะไม่ได้รับมะเร็ง" แต่เรามีแสดงให้เห็นว่า "ความสัมพันธ์ระหว่างกลุ่มการสูบบุหรี่และโรคมะเร็งจะไม่เพิ่มขึ้นถ้าเวลาผ่านไป" (เช่นสมาคมไม่ได้ลงไปที่ภาพรวมของผู้ป่วยโรคมะเร็งเพียงการตั้งค่าสำหรับการอยู่ในกลุ่มที่สูบบุหรี่หรือไม่ แต่ stengthened เมื่อเวลาผ่านไป)


4
"ดังนั้นคุณสามารถอ้างถึงสาเหตุระหว่างเวลาที่ผ่านไปและการพัฒนาของมะเร็งมากขึ้นโดยการเป็นนักสูบบุหรี่ (หรือมากกว่านั้นการสูบบุหรี่ที่ใช้เวลาทำให้เกิดความเสี่ยงต่อมะเร็งมากขึ้นตามสัดส่วน) - ไม่คุณไม่สามารถทำได้ บริษัท บุหรี่ที่ได้รับการสนับสนุนจาก Sir Ronald Fisher (!) แย้งกันมาหลายปีแล้วว่าความบกพร่องทางพันธุกรรมเป็นสาเหตุของการสูบบุหรี่และมะเร็ง ตัวอย่างนี้อยู่ในด้านหลังของหนังสือของ Pearl (หน้า 353)
Neil G

@ NeilG ไม่ฉันยืนตามตัวอย่างของฉันตามที่กำหนดไว้ สิ่งที่คุณกำลังทำไม่ใช่สิ่งที่เป็นเหตุเป็นผล แต่กลับทำให้เกิดความสับสน ตัวอย่างของฉันตามที่แสดงให้เห็นว่าเวลาที่ใช้ในกลุ่มการสูบบุหรี่สัมพันธ์กับการเพิ่มขึ้นของอัตราการเป็นมะเร็ง บุนี้ในตัวเองไม่ได้พิสูจน์ว่า "ความบกพร่องทางพันธุกรรม" ไม่ได้เป็นแรงผลักดันที่อยู่เบื้องหลังอัตราการเพิ่มขึ้นในกลุ่มการสูบบุหรี่ สองสิ่งที่แตกต่าง ประเด็นที่นี่คือการแนะนำทิศทางเชิงสาเหตุเป็นตัวแปรเวลากำจัดอาร์กิวเมนต์ "reverse causality" (เช่นมะเร็งทำให้คุณสูบบุหรี่) แต่ไม่ใช่ "confounding"
Tasos Papastylianou

1
ความคิดเห็นของคุณถูกต้อง แต่ดูเหมือนจะไม่สอดคล้องกับสิ่งที่คุณเขียน คุณเขียนว่า "เวลาที่ใช้ในการสูบบุหรี่เป็นสาเหตุของความเสี่ยงมะเร็งที่เพิ่มขึ้นตามสัดส่วน" นั่นไม่ยุติธรรม
Neil G

1
@ NeilG ยุติธรรมพอคุณพูดถูก ฉันไม่ได้คาดหวังการตรวจสอบอย่างนี้ฮ่าฮ่า ฉันจะใช้ถ้อยคำใหม่อีกครั้งอย่างแม่นยำยิ่งขึ้น
Tasos Papastylianou

ทำไมจึงเป็นเช่นนั้นในกรณีที่ไม่ได้มีการเนรเทศความก้าวหน้าของเวลา? เราจะตัดทอนความเป็นไปได้อย่างแน่นอนว่ามีบางสิ่งที่ทำให้เวลาก้าวหน้าได้อย่างไร ที่ดูเหมือนว่าฉันจะเรียกร้องพิเศษที่สุดที่จะต้องมีหลักฐานที่แข็งแกร่งเป็นพิเศษ
David Schwartz

3

นี่เป็นคำถามที่ว่าจะสร้างเวรกรรมได้อย่างไรเพราะเหตุการณ์ที่เกี่ยวข้อง แต่ไม่เกี่ยวกับสาเหตุจะมีความสัมพันธ์ในเวลาหรือสถานที่ ดังนั้นเมื่อดูข้อมูลที่มีความสัมพันธ์กันเราจะทราบได้อย่างไรว่าความสัมพันธ์นั้นขึ้นอยู่กับ? ผู้ให้คำปรึกษาด้านการวิจัยที่ชาญฉลาดเคยบอกฉันว่า "ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ แต่เพียงบอกให้คุณดูว่าอยู่ที่ไหน"

ลองพิจารณาสถานการณ์ที่เหตุการณ์ A และ B ถูกพบว่ามีความสัมพันธ์ทางโลกหรืออวกาศ หากเราต้องการตรวจสอบคำบุพบทที่A ทำให้ Bแนวความคิดดั้งเดิมคือการแนะนำการทดสอบความจำเป็นและความพอเพียงซึ่งเป็นความหมายเชิงเวรกรรมจริง ๆ

  • หากกรณีที่ไม่มีเหตุการณ์นำไปสู่การขาดของเหตุการณ์ Bก็สามารถเรียกความจำเป็น
  • ถ้าเพียง แต่ เหตุการณ์ที่นำไปสู่คนเดียวที่จะจัดกิจกรรม Bก็สามารถเรียกว่าเพียงพอ

หากไม่มีนมทำให้ฉันไปที่ร้านสิ่งที่เราพูดไม่ใช่ว่าฉันไปนมเปล่าแล้วขับ สาเหตุที่แท้จริงจะหมายถึงว่าเมื่อใดก็ตามที่ฉันยังมีนมฉันไม่สามารถไปที่ร้านได้ และในทางกลับกันเมื่อใดก็ตามที่ฉันอยู่ที่ร้านก็เป็นเพราะฉันไม่มีนมเลย ตอนนี้มันง่ายที่จะเห็นปัญหาด้วยการสร้างความสัมพันธ์เชิงบวกในแง่ที่เข้มงวด: สิ่งต่าง ๆ ส่วนใหญ่ไม่ใช่สาเหตุอย่างแน่นอน มีเหตุผลอื่นอีกมากมายที่ฉันอาจไปที่ร้านซึ่งไม่เกี่ยวข้องกับนม

นี่เป็นวิธีที่ง่ายในการบอกกระดาษที่ดีจากกระดาษไม่เป็นไร ในการวิจัยอย่างระมัดระวังคุณจะเห็นการทดสอบความพอเพียงและความจำเป็นทุกที่ การอ้างว่ายาโมเลกุลขนาดเล็ก A อาจนำไปสู่การแยกโปรตีนคอมเพล็กซ์ B? คุณจะเห็นการทดสอบทันที:

ความจำเป็น ----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)

ความพอเพียง A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)

นี่เป็นวิธีการดั้งเดิมที่คุณจะสร้างการโต้แย้งแบบอุปนัยเพื่อการทดลองโดยใช้สหสัมพันธ์ซึ่งเป็นสิ่งที่ฉันมั่นใจว่าอาจารย์ของคุณกำลังหลบหนี!


1
เพียงเพื่อเน้นจุดนั้นการพึ่งพาเวลาไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผลเช่นกัน เราอาจมีเหตุการณ์นั้นนำไปสู่เหตุการณ์ B บ่อยครั้งและเป็น B ที่ทำให้ C ไม่ใช่ A แต่ A จะสัมพันธ์กับ C แต่ไม่ทำให้เกิด
Michael Chernick
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.