ภายใต้เงื่อนไขใดที่ความสัมพันธ์บ่งบอกถึงสาเหตุ?


85

เราทุกคนรู้ว่ามนต์ "ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ" ซึ่งตีกลองในนักเรียนสถิติปีแรกทั้งหมด มีตัวอย่างที่ดีที่นี่เพื่อแสดงความคิด

แต่บางครั้งความสัมพันธ์ก็บอกเป็นนัยถึงสาเหตุ ตัวอย่างต่อไปนี้มาจากหน้า Wikipedia นี้

ตัวอย่างเช่นเราสามารถทำการทดสอบในฝาแฝดที่เหมือนกันซึ่งเป็นที่ทราบกันว่าได้คะแนนที่เท่ากันในการทดสอบ คู่หนึ่งถูกส่งไปเรียนหกชั่วโมงขณะที่อีกคู่ถูกส่งไปที่สวนสนุก หากคะแนนการทดสอบของพวกเขาแตกต่างกันไปในระดับใหญ่สิ่งนี้จะเป็นหลักฐานที่ชัดเจนว่าการศึกษา (หรือไปที่สวนสนุก) มีผลต่อคะแนนการทดสอบ ในกรณีนี้ความสัมพันธ์ระหว่างการเรียนและคะแนนการทดสอบจะบอกเป็นนัยถึงสาเหตุ

มีสถานการณ์อื่นที่ความสัมพันธ์หมายถึงสาเหตุหรือไม่


16
ความสัมพันธ์และเหตุผลที่สำคัญสำหรับการเชื่อมโยงจะแนะนำสาเหตุจนกว่าจะได้รับการพิสูจน์เป็นอย่างอื่นอาจเป็นสิ่งที่ดีที่สุดที่คุณจะได้รับ
James

8
ไม่ใช่หรือที่ Karl Popper บอกว่ามนุษย์ไม่สามารถสร้างเวรกรรมได้: ทฤษฎีทางวิทยาศาสตร์มีความเป็นนามธรรมในธรรมชาติ พวกเขาสามารถเท็จและความจริงที่ว่าเราใส่ความยากลำบากในการปลอมแปลงสิ่งที่ทำให้เราคิดเกี่ยวกับเวรกรรม ...
robin girard

3
ตัวอย่างเคาน์เตอร์ที่น่าสนใจจาก Jaynes: เรามีความสัมพันธ์แบบนิรนัย "no clouds" หมายถึง "no rain"; แต่ใครจะเชื่อว่า "ไม่มีเมฆ" เป็นสาเหตุทางกายภาพของ "ไม่มีฝน"?
ความน่าจะเป็นทางการ

4
ลองใช้คำอื่นที่ไม่ใช่ 'นัย' เนื่องจากในพจนานุกรมความหมายของทั้งสองประกอบด้วย 1. แนะนำและ 2. จำเป็น (!)
rolando2

แฝดนั้นเป็นตัวอย่างที่สมเหตุสมผลหรือไม่? ฉันหมายถึงความเป็นเหตุเป็นผลคือความแตกต่างระหว่างวิธีการศึกษา / ระบบการปกครองทำให้เกิดความแตกต่างในคะแนนการทดสอบของฝาแฝด แต่มันก็เป็นตัวอย่างของหนึ่งชิ้นและถึงแม้จะมีตัวอย่างขนาดใหญ่สิ่งที่ต้องทำก็คือฝาแฝดชุดเดียวที่มีปฏิกิริยาตรงกันข้ามเพื่อทำลายสมมติฐานสไตล์หงส์ดำ ... @probabilityislogic: แนวคิดที่ว่า "ไม่มีเมฆ" มีร่างกายหรือไม่ ความหมาย? ถ้าใช่ฉันไม่เห็นว่าทำไมส่วนที่สองไม่น่าเชื่อถือ
naught101

คำตอบ:


33

ความสัมพันธ์ไม่เพียงพอสำหรับสาเหตุ ใคร ๆ ก็สามารถเข้าใจตัวอย่างวิกิพีเดียโดยจินตนาการว่าฝาแฝดเหล่านั้นมักถูกโกงในการทดสอบโดยมีอุปกรณ์ที่ให้คำตอบ ฝาแฝดที่ไปที่สวนสนุกสูญเสียอุปกรณ์ทำให้เกรดต่ำ

วิธีที่ดีที่จะได้รับสิ่งที่ตรงนี้คือการคิดโครงสร้างของเครือข่ายแบบเบย์ที่อาจจะก่อให้เกิดปริมาณที่วัดได้ในขณะที่ทำโดยเพิร์ลในหนังสือของเขาเวรกรรม จุดพื้นฐานของเขาคือมองหาตัวแปรที่ซ่อนอยู่ หากมีตัวแปรซ่อนเร้นที่ไม่เกิดขึ้นกับตัวอย่างที่วัดได้ความสัมพันธ์จะไม่บ่งบอกถึงสาเหตุ เปิดเผยตัวแปรที่ซ่อนอยู่ทั้งหมดและคุณมีสาเหตุ


ฉันมีปัญหาในการทำความเข้าใจว่าเพราะเหตุใดทิศทางของลูกศรในเครือข่ายแบบเบย์ที่เกี่ยวข้องมีความสัมพันธ์กับสาเหตุ ตัวอย่างเช่น A-> B และ B-> A เป็นตัวแทนของทิศทางที่แตกต่างกันสำหรับเวรกรรม แต่เครือข่ายแบบเบย์สำหรับทั้งสองโครงสร้างนั้นเทียบเท่ากัน
Yaroslav Bulatov

6
พวกเขาไม่เท่าเทียมกันเมื่อต้องเผชิญกับการแทรกแซง
Neil G

เครือข่าย Bayesian เหล่านั้นมีความเท่าเทียมกันในแง่ที่ว่าได้รับข้อมูลตัวอย่างจากหนึ่งในนั้นคุณไม่สามารถบอกได้ว่ามันคือใคร
Yaroslav Bulatov

4
เอ่อ ... ฉันไม่คุ้นเคยกับสถิติจริง ๆ โดยใช้เวลานาน ... แต่ไม่ใช่ "เปิดเผยตัวแปรที่ซ่อนอยู่ทั้งหมด" โดยนิยามที่เป็นไปไม่ได้ใช่ไหม คุณจะรู้ได้อย่างไรว่าเมื่อไม่มีตัวแปร "ซ่อนอยู่" อีกต่อไป?
Craig Walker

4
@ Craig นั่นคือประเด็น; มันเป็นไปไม่ได้.
Justin L.

35

ฉันเพิ่งจะเพิ่มความคิดเห็นเพิ่มเติมเกี่ยวกับเวรกรรมเมื่อมองจากมุมมองทางระบาดวิทยา ข้อโต้แย้งเหล่านี้ส่วนใหญ่นำมาจากระบาดวิทยาทางจิตเวชในทางปฏิบัติโดย Prince et al. (2003)

การตีความเชิงสาเหตุหรือการตีความเชิงสาเหตุเป็นประเด็นที่ยากที่สุดของการวิจัยทางระบาดวิทยา การศึกษาแบบกลุ่มและแบบตัดขวางอาจนำไปสู่ผลกระทบที่น่าสับสนเช่นกัน Quoting S. Menard (การวิจัยระยะยาว , กระดาษมหาวิทยาลัย Sage 76, 1991), HB Asher ในการสร้างแบบจำลองเชิงสาเหตุ (Sage, 1976) เริ่มเสนอเกณฑ์ชุดดังต่อไปนี้:

  • ปรากฏการณ์หรือตัวแปรที่เป็นปัญหาต้องแปรปรวนตามที่ระบุไว้ตัวอย่างเช่นโดยความแตกต่างระหว่างกลุ่มทดลองและกลุ่มควบคุมหรือโดยสหสัมพันธ์ที่ไม่เป็นศูนย์ระหว่างตัวแปรทั้งสอง
  • ความสัมพันธ์จะต้องไม่เกี่ยวข้องกับตัวแปรอื่น ๆ หรือชุดของตัวแปรนั่นคือจะต้องไม่เป็นของปลอม แต่ต้องคงอยู่แม้ว่าจะมีการควบคุมตัวแปรอื่น ๆ ตามที่ระบุไว้เช่นโดยการสุ่มประสบความสำเร็จในการออกแบบการทดลอง กลุ่มควบคุมก่อนการรักษา) หรือโดยความสัมพันธ์บางส่วนที่ไม่ใช่ศูนย์ระหว่างสองตัวแปรกับตัวแปรอื่น ๆ คงที่
  • สาเหตุที่คาดว่าจะต้องนำหน้าหรือมี simultnaeous กับผลที่คาดการณ์ไว้ในเวลาตามที่ระบุโดยการเปลี่ยนแปลงในสาเหตุที่เกิดขึ้นไม่ช้ากว่าการเปลี่ยนแปลงที่เกี่ยวข้องในผลกระทบ

ในขณะที่สามารถตรวจสอบเกณฑ์สองข้อแรกได้อย่างง่ายดายโดยใช้การศึกษาแบบตัดขวางหรือแบบตัดขวางตามเวลา แต่สามารถประเมินหลังได้ด้วยข้อมูลระยะยาวยกเว้นลักษณะทางชีวภาพหรือทางพันธุกรรมที่ลำดับเวลาชั่วคราวสามารถทำได้โดยไม่มีข้อมูลตามยาว แน่นอนสถานการณ์จะซับซ้อนมากขึ้นในกรณีที่มีความสัมพันธ์เชิงสาเหตุแบบไม่เรียกซ้ำ

ฉันยังชอบภาพประกอบต่อไปนี้ (บทที่ 13 ในเอกสารอ้างอิงข้างต้น) ซึ่งสรุปวิธีการที่ประกาศโดย Hill (1965) ซึ่งมีหลักเกณฑ์ที่แตกต่างกัน 9 ข้อที่เกี่ยวข้องกับเอฟเฟ็กต์สาเหตุตามที่อ้างถึงโดย @James บทความต้นฉบับมีชื่อว่า "สภาพแวดล้อมและโรค: การเชื่อมโยงหรือสาเหตุ?" ( เวอร์ชั่น PDF )

Hill1965

ในที่สุดบทที่ 2 ของหนังสือที่โด่งดังที่สุดของ Rothman คือModern Epidemiology (1998, Lippincott Williams & Wilkins, 2nd Edition) นำเสนอการอภิปรายที่สมบูรณ์มากเกี่ยวกับสาเหตุและการอนุมานสาเหตุทั้งจากมุมมองเชิงสถิติและเชิงปรัชญา

ฉันต้องการที่จะเพิ่มการอ้างอิงต่อไปนี้ (เอามาคร่าวๆจากหลักสูตรออนไลน์ในระบาดวิทยา) ก็น่าสนใจมาก:

  • Swaen, G และ van Amelsvoort, L (2009) น้ำหนักของวิธีหลักฐานที่จะอนุมานสาเหตุ วารสารระบาดวิทยาคลินิก , 62 , 270-277
  • Botti, C, Comba, P, Forastiere, F และ Settimi, L (1996) การอนุมานเชิงสาเหตุในระบาดวิทยาสิ่งแวดล้อม บทบาทของค่านัย วิทยาศาสตร์ของสิ่งแวดล้อมโดยรวม , 184 , 97-101
  • วัชพืช, DL (2002) ระบาดวิทยาสิ่งแวดล้อม ข้อมูลพื้นฐานเกี่ยวกับและหลักฐานของผลกระทบที่ก่อให้เกิด พิษวิทยา , 181-182 , 399-403
  • Franco, EL, Correa, P, Santella, RM, Wu, X, Goodman, SN และ Petersen, GM (2004) บทบาทและข้อ จำกัด ของการระบาดวิทยาในการสร้างความสัมพันธ์เชิงสาเหตุ สัมมนาทางชีววิทยามะเร็ง , 14 , 413–426

ในที่สุดการทบทวนนี้นำเสนอมุมมองที่กว้างขึ้นเกี่ยวกับการสร้างแบบจำลองเชิงสาเหตุการอนุมานเชิงสาเหตุในสถิติ: ภาพรวม (J Pearl, SS 2009 (3))


18

ที่หัวใจของคำถามของคุณคือคำถาม "เมื่อความสัมพันธ์เป็นสาเหตุ?" มันไม่เพียง แต่จะต้องมีความสัมพันธ์ที่บ่งบอกถึงสาเหตุ (หรือไม่)

หนังสือที่ดีในหัวข้อนี้เรียกว่าเศรษฐีที่ไม่เป็นอันตรายส่วนใหญ่โดย Johua Angrist และ Jorn-Steffen Pischke พวกเขาเริ่มต้นจากอุดมคติการทดลองที่เราสามารถสุ่ม "การรักษา" ภายใต้การศึกษาในแฟชั่นบางอย่างแล้วพวกเขาก็ย้ายไปยังวิธีการทางเลือกสำหรับการสร้างการสุ่มนี้เพื่อดึงอิทธิพลเชิงสาเหตุ สิ่งนี้เริ่มต้นด้วยการศึกษาการทดลองทางธรรมชาติที่เรียกว่า

หนึ่งในตัวอย่างแรกของการทดลองตามธรรมชาติที่ใช้ในการระบุความสัมพันธ์เชิงสาเหตุคือกระดาษ 2532 ของ Angrist ใน"รายได้ตลอดชีวิตและสลากกินแบ่งยุคเวียดนาม" บทความนี้พยายามประเมินผลกระทบของการรับราชการทหารต่อรายได้ตลอดชีวิต ปัญหาสำคัญในการประเมินผลกระทบเชิงสาเหตุคือคนบางประเภทอาจมีแนวโน้มที่จะเข้าเป็นทหารมากขึ้นซึ่งอาจมีอคติในการวัดความสัมพันธ์ใด ๆ Angrist ใช้การทดลองตามธรรมชาติที่สร้างขึ้นโดยการจับสลากของเวียดนามเพื่อ "สุ่มมอบหมาย" การรักษา "การรับราชการทหาร" ให้กับกลุ่มคนอย่างมีประสิทธิภาพ

ดังนั้นเมื่อไหร่ที่เรามีเวรกรรม? ภายใต้เงื่อนไขการทดลอง เมื่อไหร่ที่เราจะเข้าใกล้ ภายใต้การทดลองทางธรรมชาติ นอกจากนี้ยังมีเทคนิคอื่น ๆ ที่ช่วยให้เราใกล้เคียงกับ "เวรกรรม" เช่นพวกเขาดีกว่าการใช้การควบคุมเชิงสถิติ พวกเขารวมถึงความไม่ต่อเนื่องการถดถอยความแตกต่างในความแตกต่าง ฯลฯ


15

นอกจากนี้ยังมีปัญหากับกรณีตรงข้ามเมื่อใช้การขาดความสัมพันธ์เป็นหลักฐานในการขาดสาเหตุ ปัญหานี้เกิดขึ้นแบบไม่เชิงเส้น เมื่อดูที่ความสัมพันธ์คนมักจะตรวจสอบเพียร์สันซึ่งเป็นเพียงส่วนหนึ่งของภูเขาน้ำแข็ง


14

ตัวอย่างของคุณเป็นที่ของการควบคุมการทดลอง เพียงบริบทอื่น ๆ ที่ฉันรู้ที่มีความสัมพันธ์สามารถบ่งบอกถึงสาเหตุเป็นที่ของการทดลองธรรมชาติ

โดยทั่วไปแล้วการทดลองตามธรรมชาติใช้ประโยชน์จากการมอบหมายผู้ตอบแบบสอบถามบางคนให้รับการบำบัดที่เกิดขึ้นตามธรรมชาติในโลกแห่งความเป็นจริง เนื่องจากการมอบหมายผู้ตอบแบบสอบถามให้กับกลุ่มการรักษาและกลุ่มควบคุมไม่ได้ถูกควบคุมโดยผู้ทดลองในระดับที่ความสัมพันธ์จะบ่งบอกถึงสาเหตุที่อาจจะอ่อนแอกว่าในระดับหนึ่ง

ดูลิงค์ wiki สำหรับข้อมูลเพิ่มเติมควบคุม / ทดลองธรรมชาติ


12

ในความคิดของฉันกองกำลังทางสถิติของ APA สรุปว่าค่อนข้างดี

'' การอนุมานสาเหตุจากการออกแบบที่ไม่มีการสุ่มตัวอย่างเป็นองค์กรที่มีความเสี่ยง นักวิจัยที่ใช้การออกแบบที่ไม่มีการสุ่มตัวอย่างมีหน้าที่เพิ่มเติมในการอธิบายตรรกะเบื้องหลังการแปรสภาพรวมอยู่ในการออกแบบของพวกเขาและเพื่อเตือนผู้อ่านถึงสมมติฐานของคู่แข่งที่น่าเชื่อถือซึ่งอาจอธิบายผลลัพธ์ของพวกเขาได้ แม้ในการทดลองแบบสุ่มการอ้างถึงผลกระทบเชิงสาเหตุที่เกิดขึ้นกับแง่มุมหนึ่งของเงื่อนไขการรักษาต้องได้รับการสนับสนุนจากการทดลองเพิ่มเติม '' - APA Task Force


11

คำปราศรัยของประธานาธิบดีเซอร์ออสตินแบรดฟอร์ดฮิลล์ต่อสมาคมแพทย์ ( สิ่งแวดล้อมและโรค: สมาคมหรือสาเหตุ ) อธิบายเกณฑ์เก้าข้อที่ช่วยในการตัดสินว่ามีความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสองตัวแปรที่เกี่ยวข้องหรือเกี่ยวข้อง

พวกเขาคือ:

  1. จุดแข็งของสมาคม
  2. ความคงเส้นคงวา: "มันถูกสังเกตเห็นซ้ำแล้วซ้ำอีกโดยบุคคลต่าง ๆ ในสถานที่ต่าง ๆ สถานการณ์และเวลา?"
  3. ความจำเพาะ
  4. ชั่วขณะ: "รถเข็นอะไรและม้าคือใคร" - สาเหตุจะต้องนำหน้าผลกระทบ
  5. การไล่ระดับสีทางชีวภาพ (เส้นโค้งการตอบสนองต่อปริมาณ) - ขนาดของผลกระทบขึ้นอยู่กับขนาดของตัวแปรสาเหตุ (สงสัย) ทำไม?
  6. ความน่าเชื่อถือ - มีคำอธิบายที่เป็นไปได้สำหรับสาเหตุหรือไม่
  7. การเชื่อมโยงกัน - สาเหตุจะขัดแย้งกับข้อเท็จจริงที่มั่นคงอื่น ๆ หรือไม่?
  8. การทดลอง - ทำการเปลี่ยนแปลงการทดลองของตัวแปรสาเหตุ (ต้องสงสัย) ส่งผลกระทบต่อตัวแปรที่ขึ้นกับ (สงสัยว่า)
  9. การเปรียบเทียบ - เราเคยพบความสัมพันธ์เชิงสาเหตุที่คล้ายกันในอดีตหรือไม่?

9

ในตัวอย่างฝาแฝดมันไม่ได้เป็นเพียงความสัมพันธ์ที่บ่งบอกถึงเวรกรรม แต่ยังรวมถึงข้อมูลที่เกี่ยวข้องหรือความรู้เดิม

สมมติว่าฉันเพิ่มข้อมูลอีกหนึ่งชิ้น สมมติว่าคู่ขยันใช้เวลาเรียน 6 ชั่วโมงเพื่อสอบสถิติ แต่เนื่องจากข้อผิดพลาดที่โชคร้ายการสอบครั้งนี้เกิดขึ้นในประวัติศาสตร์ เราจะสรุปได้ไหมว่าการศึกษาเป็นสาเหตุของประสิทธิภาพที่เหนือกว่า?

การกำหนดเวรกรรมเป็นคำถามเชิงปรัชญามากพอ ๆ กับคำถามทางวิทยาศาสตร์ดังนั้นจึงมีแนวโน้มที่จะเรียกนักปรัชญาเช่น David Hume และ Karl Popper เมื่อมีการพูดคุยถึงสาเหตุ

ไม่น่าแปลกใจที่ยามีส่วนช่วยอย่างมากในการสร้างความเป็นเหตุเป็นผลผ่านการวิเคราะห์พฤติกรรมเช่นทฤษฎีของ Koch เพื่อสร้างความสัมพันธ์เชิงสาเหตุระหว่างจุลินทรีย์และโรค สิ่งเหล่านี้ได้ขยายไปถึง "อณูของโมเลกุล Koch" เพื่อแสดงให้เห็นว่ายีนในเชื้อโรคนั้นเข้ารหัสผลิตภัณฑ์ที่ก่อให้เกิดโรคที่เกิดจากเชื้อโรค

น่าเสียดายที่ฉันไม่สามารถโพสต์การเชื่อมโยงหลายมิติได้เนื่องจากฉันเป็นผู้ใช้ใหม่ (ไม่เป็นความจริง) และไม่มี "คะแนนคะแนน" เพียงพอ เหตุผลที่แท้จริงคือการเดาของทุกคน


9

ความสัมพันธ์เพียงอย่างเดียวไม่เคยแสดงถึงสาเหตุ มันง่ายมาก

แต่หายากมากที่จะมีความสัมพันธ์ระหว่างตัวแปรสองตัวเท่านั้น บ่อยครั้งที่คุณรู้บางอย่างเกี่ยวกับตัวแปรเหล่านั้นและทฤษฎีหรือทฤษฎีว่าอะไรคือสาเหตุที่ทำให้เกิดความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร ถ้าไม่เช่นนั้นเราจะตรวจสอบความสัมพันธ์หรือไม่? (อย่างไรก็ตามคนที่ทำเหมืองเมทริกซ์สหสัมพันธ์ขนาดใหญ่สำหรับผลลัพธ์ที่สำคัญมักจะไม่มีทฤษฎีที่ไม่เป็นทางการ - มิฉะนั้นทำไมต้องขุดเหมืองการโต้เถียงที่มักจะต้องมีการสำรวจเพื่อให้ได้แนวคิดสำหรับทฤษฎีทั่วไปและอื่น ๆ ... )

การตอบสนองต่อการวิจารณ์ทั่วไป "ใช่ แต่นั่นเป็นเพียงความสัมพันธ์: มันไม่ได้หมายความถึงสาเหตุ":

  1. สำหรับความสัมพันธ์แบบไม่เป็นทางการจำเป็นต้องมีสหสัมพันธ์ ความล้มเหลวซ้ำ ๆ ในการค้นหาความสัมพันธ์จะเป็นข่าวร้ายแน่นอน
  2. ฉันไม่เพียง แต่ให้ความสัมพันธ์กับคุณ
  3. จากนั้นอธิบายกลไกที่เป็นไปได้ที่อธิบายความสัมพันธ์ ...

2
ตัวอย่างที่ตรงกับประเด็นของคุณ # 1: ในระบบที่วุ่นวายคุณอาจมีสาเหตุโดยไม่มีความสัมพันธ์ที่ชัดเจน
mkt

8

หนึ่งเงื่อนไขที่มีประโยชน์เพียงพอสำหรับคำจำกัดความของการก่อให้เกิด:

สามารถอ้างถึงสาเหตุได้เมื่อหนึ่งในตัวแปรที่สัมพันธ์กันสามารถควบคุมได้ (เราสามารถกำหนดค่าโดยตรง) และยังคงมีความสัมพันธ์กันอยู่


2
อาจใช้คำของ Pearl สำหรับ "การตั้งค่าโดยตรง [ตัวแปรของ]": การแทรกแซง
Neil G

8
  1. เกือบตลอดเวลาในการทดลองแบบสุ่ม
  2. เกือบทุกครั้งในการศึกษาเชิงสังเกตการณ์เมื่อมีคนวัด Confouders ทั้งหมด (แทบจะไม่เคยเลย)
  3. บางครั้งเมื่อมีคนวัดผู้ให้คำปรึกษาบางคน (อัลกอริทึม IC * ของการค้นพบ DAG ใน Causality หนังสือของ Pearl)
  4. ในแบบจำลองเชิงเส้นที่ไม่ใช่เกาส์ซึ่งมีตัวแปรสองตัวหรือมากกว่า แต่ไม่ได้ใช้ความสัมพันธ์เป็นการวัดความสัมพันธ์ ( LiNGAM )

อัลกอริทึมการค้นพบส่วนใหญ่ถูกนำมาใช้ในTetrad IV


6

คำถามที่เกี่ยวข้องอาจอยู่ภายใต้เงื่อนไขใดที่คุณสามารถแยกความสัมพันธ์เชิงสาเหตุจากข้อมูลได้อย่างน่าเชื่อถือ

การประชุมเชิงปฏิบัติการ NIPS ปี 2008 พยายามที่จะตอบคำถามนั้นโดยประจักษ์ หนึ่งในภารกิจคือการอนุมานทิศทางของเวรกรรมจากการสังเกตของคู่ของตัวแปรที่ตัวแปรหนึ่งเป็นที่รู้จักกันเพื่อทำให้เกิดอีกและวิธีที่ดีที่สุดก็สามารถสกัดทิศทางสาเหตุได้อย่างถูกต้อง 80% ของเวลา



3

สมมติว่าเราคิดว่าปัจจัย A เป็นสาเหตุของปรากฏการณ์ B จากนั้นเราพยายามปรับเปลี่ยนเพื่อดูว่า B เปลี่ยนแปลงหรือไม่ หาก B ไม่เปลี่ยนแปลงและหากเราสามารถสันนิษฐานได้ว่าทุกอย่างไม่มีการเปลี่ยนแปลงหลักฐานที่ชัดเจนว่า A ไม่ใช่สาเหตุของ B หาก B เปลี่ยนแปลงเราไม่สามารถสรุปได้ว่า A เป็นสาเหตุเนื่องจากการเปลี่ยนแปลงของ A อาจเกิดขึ้น การเปลี่ยนแปลงในสาเหตุที่แท้จริง C ซึ่งทำให้การเปลี่ยนแปลง B


คุณสามารถสร้างความแตกต่าง A?
RockScience

2

ฉันสังเกตเห็นว่า 'การพิสูจน์' ถูกใช้ที่นี่เมื่อพูดถึงกระบวนทัศน์เชิงประจักษ์ ไม่มีสิ่งนั้น มาก่อนสมมติฐานที่ความคิดเป็นขั้นสูง จากนั้นจึงทำการทดสอบภายใต้ "เงื่อนไขที่ควบคุม" [note a] และหากพบว่ามี " การไม่เพียงพอ" ของการป้องกันความไม่สมบูรณ์ก็จะเข้าสู่ขั้นของสมมติฐาน... ระยะเวลา ไม่มีข้อพิสูจน์เว้นแต่หนึ่งสามารถ 1) จัดการที่จะเกิดขึ้นทุกเหตุการณ์ดังกล่าว [note b] และแน่นอน 2) สร้างสาเหตุ 1) ไม่น่าเป็นไปได้ในจักรวาลที่ไม่มีที่สิ้นสุด หมายเหตุ A; ไม่มีการทดลองใด ๆ ภายใต้เงื่อนไขที่ถูกควบคุมอย่างสมบูรณ์และยิ่งการควบคุมเงื่อนไขนั้นยิ่งมีความคล้ายคลึงกับจักรวาลภายนอกน้อยลง หมายเหตุ b; ในใจคุณคุณต้องอธิบายว่า 'เหตุการณ์' อย่างสมบูรณ์แบบซึ่งน่าจะหมายถึงภาษาที่ถูกต้องอย่างสมบูรณ์ = อาจไม่ใช่ภาษามนุษย์ สำหรับบันทึกสุดท้ายสาเหตุทั้งหมดน่าจะกลับไปที่เหตุการณ์แรก ตอนนี้ไปคุยกับทุกคนด้วยทฤษฎี ใช่ฉันเรียนอย่างเป็นทางการและไม่เป็นทางการ ในตอนท้าย; ไม่ความใกล้ชิดไม่ได้บ่งบอกถึงสาเหตุหรือสิ่งอื่นใดนอกจากความสัมพันธ์ชั่วคราว


1

XY

Y=bX+u

bXYE(b)=BXuE(u|X)=0u YXY

การไม่เอนเอียงเป็นคุณสมบัติที่ต้องการของตัวประมาณค่า แต่คุณต้องการให้ตัวประมาณค่าของคุณมีประสิทธิภาพ (ความแปรปรวนต่ำ) และความสอดคล้อง (มีแนวโน้มว่าจะเป็นค่าจริง) ดูสมมติฐานของเกาส์ - มาร์คอฟ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.