คำจำกัดความทางคณิตศาสตร์ของความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสุ่มสองตัวคืออะไร
ได้รับตัวอย่างจากการจัดจำหน่ายร่วมกันของสองตัวแปรสุ่มและเมื่อเราจะพูดทำให้เกิด ?
คำจำกัดความทางคณิตศาสตร์ของความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสุ่มสองตัวคืออะไร
ได้รับตัวอย่างจากการจัดจำหน่ายร่วมกันของสองตัวแปรสุ่มและเมื่อเราจะพูดทำให้เกิด ?
คำตอบ:
คำจำกัดความทางคณิตศาสตร์ของความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสุ่มสองตัวคืออะไร
ศาสตร์เป็นโมเดลเชิงสาเหตุประกอบด้วยการทำงานความสัมพันธ์ระหว่างตัวแปร ตัวอย่างเช่นพิจารณาระบบของสมการโครงสร้างด้านล่าง:
นี่หมายความว่าจะกำหนดค่าของ (ถ้าคุณเข้าไปแทรกแซงจะเปลี่ยนค่าของ ) แต่ไม่ใช่วิธีอื่น ๆ แบบกราฟิกนี่มักจะแสดงโดยซึ่งหมายความว่าเข้าสู่สมการโครงสร้างของ y ในฐานะที่เป็นภาคผนวกนี้คุณยังสามารถแสดงโมเดลเชิงสาเหตุในแง่ของการกระจายร่วมกันของตัวแปร counterfactual, ซึ่งเป็นทางคณิตศาสตร์เทียบเท่ากับรูปแบบการทำงาน
รับตัวอย่างจากการแจกแจงร่วมของตัวแปรสุ่มสองตัว X และ Y เราจะบอกว่าเมื่อใดที่ X เป็นสาเหตุให้ Y
บางครั้ง (หรือมากที่สุดเท่าที่) คุณไม่ได้มีความรู้เกี่ยวกับรูปร่างของสมการโครงสร้าง , หรือแม้แต่ว่าหรือ x ข้อมูลเดียวที่คุณมีคือการแจกแจงความน่าจะเป็นร่วม (หรือตัวอย่างจากการแจกแจงนี้)
สิ่งนี้นำไปสู่คำถามของคุณ: เมื่อใดที่ฉันสามารถกู้คืนทิศทางของเวรกรรมจากข้อมูลได้? หรืออย่างแม่นยำมากขึ้นเมื่อฉันสามารถกู้คืนได้ว่าเข้าสู่สมการโครงสร้างของหรือในทางกลับกันเพียงแค่จากข้อมูล?
แน่นอนโดยไม่ต้องสมมติฐาน untestable พื้นฐานใด ๆเกี่ยวกับโมเดลเชิงสาเหตุที่เป็นไปไม่ได้ ปัญหาคือแบบจำลองเชิงสาเหตุที่แตกต่างกันหลายแบบสามารถนำมาซึ่งการกระจายความน่าจะเป็นร่วมเดียวกันของตัวแปรที่สังเกตได้ ตัวอย่างที่พบบ่อยที่สุดคือระบบเชิงเส้นเชิงสาเหตุที่มีสัญญาณรบกวนแบบเกาส์เซียน
แต่ภายใต้สมมติฐานเชิงสาเหตุบางประการนี่อาจเป็นไปได้ --- และนี่คือสิ่งที่วรรณกรรมการค้นพบเชิงสาเหตุทำงาน หากคุณไม่เคยสัมผัสหัวข้อนี้มาก่อนคุณอาจต้องการเริ่มต้นจากองค์ประกอบการอนุมานเชิงสาเหตุโดย Peters, Janzing และ Scholkopf รวมถึงบทที่ 2 จาก Causalityโดย Judea Pearl เรามีหัวข้อที่นี่ใน CV สำหรับการอ้างอิงเกี่ยวกับการค้นพบสาเหตุแต่เรายังไม่มีการอ้างอิงจำนวนมากในรายการ
ดังนั้นจึงไม่มีคำตอบสำหรับคำถามของคุณเพียงหนึ่งข้อเนื่องจากขึ้นอยู่กับสมมติฐานที่เราทำ กระดาษที่คุณพูดถึงอ้างอิงบางตัวอย่างเช่นสมมติว่ามีโมเดลเชิงเส้นที่มีเสียงรบกวนแบบไม่เสียน กรณีนี้เป็นที่รู้จักกันในนามLINGAN (ย่อมาจากแบบจำลองเชิงเส้นแบบ non-gaussian) นี่คือตัวอย่างในR
:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
โปรดสังเกตที่นี่เรามีโมเดลเชิงเส้นตรงพร้อมเสียงที่ไม่ใช่เกาส์ที่ทำให้และ lingam กู้คืนทิศทางของสาเหตุได้อย่างถูกต้อง อย่างไรก็ตามโปรดสังเกตว่าสิ่งนี้ขึ้นอยู่กับช่วงวิกฤตของสมมติฐาน LINGAM
สำหรับกรณีของกระดาษที่คุณอ้างถึงพวกเขาทำสมมติฐานเฉพาะนี้ (ดู "สมมุติฐาน"):
ถ้าความยาวรายละเอียดขั้นต่ำของกลไกการทำแผนที่ X ถึง Y ไม่ขึ้นอยู่กับค่าของ X ในขณะที่ความยาวคำอธิบายน้อยที่สุดของการจับคู่กลไก Y ถึง X ขึ้นอยู่กับค่าของ Y
หมายเหตุนี่เป็นข้อสันนิษฐาน นี่คือสิ่งที่เราจะเรียกว่า "เงื่อนไขการระบุ" ของพวกเขา หลักข้อ จำกัด สมมุติเรียกเก็บกับการกระจายร่วม ) นั่นคือสมมุติว่าถ้ามีข้อ จำกัด บางอย่างในข้อมูลและถ้าข้อ จำกัด อื่น ๆ ข้อ จำกัด ประเภทนี้ที่มีผลกระทบที่ทดสอบได้ (กำหนดข้อ จำกัด ใน ) คือสิ่งที่ช่วยให้เราสามารถกู้คืนทิศทางจากข้อมูลเชิงสังเกตการณ์ได้
ในฐานะที่เป็นคำพูดสุดท้ายผลการค้นพบเชิงสาเหตุยังคงมี จำกัด มากและขึ้นอยู่กับสมมติฐานที่แข็งแกร่งโปรดใช้ความระมัดระวังเมื่อใช้สิ่งเหล่านี้ในบริบทของโลกแห่งความเป็นจริง
lm
) เราไม่สามารถทำงานกับชุดข้อมูลเชิงสังเกตการณ์ Tuebingen เพื่อรับแนวคิดการค้นพบสาเหตุ! :)
มีวิธีการที่หลากหลายในการทำให้เป็นรูปเป็นร่างเป็นเวร (ซึ่งสอดคล้องกับปรัชญาที่ไม่เห็นด้วยอย่างมากเกี่ยวกับเวรกรรมที่มีมานานหลายศตวรรษ) หนึ่งที่นิยมคือในแง่ของผลลัพธ์ที่อาจเกิดขึ้น วิธีหาผลลัพธ์ที่เป็นไปได้ที่เรียกว่าแบบจำลองเชิงสาเหตุรูบินสมมติว่าสำหรับแต่ละสถานการณ์เชิงสาเหตุมีตัวแปรสุ่มแตกต่างกัน ดังนั้นอาจเป็นตัวแปรสุ่มของผลลัพธ์ที่เป็นไปได้จากการทดลองทางคลินิกหากผู้ทดลองใช้ยาเสพติดและอาจเป็นตัวแปรสุ่มหากเขาได้รับยาหลอก ผลกระทบเชิงสาเหตุคือความแตกต่างระหว่างและ 2 ถ้าในความเป็นจริง
ความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรยังสามารถนำเสนอด้วยกราฟ acylical ทิศทางซึ่งมีรสชาติที่แตกต่างกันมาก แต่กลับกลายเป็นคณิตศาสตร์เทียบเท่ากับแบบจำลอง Rubin (Wasserman, 2004, หัวข้อ 17.8)
Wasserman, L. (2004) สถิติทั้งหมด: หลักสูตรรัดกุมในการอนุมานทางสถิติ New York, NY: Springer ไอ 978-0-387-40272-7
There are two ways to determine whether is the cause of . The first is standard while the second is my own claim.
An intervention is a surgical change to a variable that does not affect variables it depends on. Interventions have been formalized rigorously in structural equations and causal graphical models, but as far as I know, there is no definition which is independent of a particular model class.
To make this rigorous requires formalizing a model over and , and in particular the semantics which define how it is simulated.
In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.