ดังนั้นหากเป็นเช่นนั้นความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุโดยอัตโนมัติหรือไม่?
ไม่และนี่คือตัวอย่างการนับง่ายๆที่มีค่าหลายตัวแปร
set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)
ด้วยกราฟที่สอดคล้องกัน
ที่นี่เรามีและเป็นอิสระเล็กน้อย (ในกรณีปกติหลายตัวแปรความสัมพันธ์แบบศูนย์หมายถึงความเป็นอิสระ) นี้เกิดขึ้นเพราะเส้นทางลับๆผ่านว่ายกเลิกออกเส้นทางตรงจากไป , ที่อยู่,0 ดังนั้น 0 แต่เป็นสาเหตุโดยตรงและเรามีที่ซึ่งจะแตกต่างจาก 0xyzxycov(x,y)=b−a∗c=0.1−0.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0
สมาคมการแทรกแซงและการต่อต้าน
ฉันคิดว่าเป็นสิ่งสำคัญที่จะต้องชี้แจงเกี่ยวกับความเกี่ยวข้องการแทรกแซงและการต่อต้าน
แบบจำลองเชิงสาเหตุนำมาซึ่งข้อความเกี่ยวกับพฤติกรรมของระบบ: (i) ภายใต้การสังเกตแบบพาสซีฟ (ii) ภายใต้การแทรกแซงเช่นเดียวกับ (iii) การต่อต้าน และความเป็นอิสระในระดับหนึ่งไม่จำเป็นต้องแปลเป็นภาษาอื่น
ดังที่แสดงไว้ด้านบนเราไม่สามารถเชื่อมโยงระหว่างและนั่นคือและยังคงเป็นกรณีที่การเปลี่ยนแปลงบนเปลี่ยนการกระจายของนั่นคือ(Y)XYP(Y|X)=P(Y)XYP(Y|do(x))≠P(Y)
ตอนนี้เราสามารถก้าวไปอีกขั้นหนึ่งได้ เราสามารถมีโมเดลเชิงสาเหตุที่การแทรกแซงจะไม่เปลี่ยนการกระจายตัวของประชากรของแต่นั่นไม่ได้หมายความว่าการขาดการต่อต้านเชิงสาเหตุ! นั่นคือแม้ว่าสำหรับแต่ละผลของพวกเขาทุกจะได้รับที่แตกต่างกันมีคุณเปลี่ยนเขาXนี่เป็นกรณีที่อธิบายโดย user20160 และในคำตอบก่อนหน้าของฉันที่นี่XYP(Y|do(x))=P(Y)YX
สามระดับเหล่านี้สร้างลำดับชั้นของงานการอนุมานสาเหตุในแง่ของข้อมูลที่จำเป็นในการตอบแบบสอบถามในแต่ละระดับ