probabilistic แบบจำลองโครงสร้างเชิงสาเหตุ (SCM) ถูกกำหนดเป็น tuple โดยที่Uคือชุดของตัวแปร exogeneous, Vชุดของตัวแปรภายนอก, Fคือชุดของสมการโครงสร้าง ที่กำหนดค่าของแต่ละตัวแปรภายนอกและP ( U )การกระจายความน่าจะเป็นมากกว่าโดเมนของUM= ⟨คุณ,โวลต์,F, P(ยู) ⟩ยูVFP(ยู)ยู
ใน SCM เราเป็นตัวแทนผลกระทบของการแทรกแซงตัวแปรโดย submodel M x = ⟨ U , V , F x , P ( U ) ⟩โดยที่F xบ่งชี้ว่าสมการเชิงโครงสร้างสำหรับXถูกแทนที่ด้วยสมการ interventional ใหม่ . ตัวอย่างเช่นการแทรกแซงอะตอมมิกของการตั้งค่าตัวแปรXเป็นค่าที่เฉพาะเจาะจงx --- มักจะแสดงโดยd o ( X = x ) --- ประกอบด้วยการแทนที่สมการสำหรับXXMx= ⟨คุณ,โวลต์, Fx, P(ยู) ⟩FxXXxdo ( X= x )Xกับสมการ xX= x
หากต้องการทำให้แนวคิดชัดเจนลองนึกภาพโมเดลสาเหตุเชิงโครงสร้างที่ไม่ใช่พารามิเตอร์กำหนดโดยสมการโครงสร้างต่อไปนี้:M
Z= UZX= f( Z, Ux)Y= g( X, Z, UY)
ที่ไหนระเบิดมีบางส่วนกระจายP ( U ) เจือจางนี้การกระจายความน่าจะเป็นในช่วงตัวแปรภายนอกP M ( Y , Z , X )และโดยเฉพาะอย่างยิ่งในเงื่อนไขการจำหน่ายของYให้X , P M ( Y | X )ยูP(ยู)PM(Y, Z, X)YXPM( Y|X)
แต่แจ้งให้ทราบล่วงหน้าเป็น "เชิง" การกระจายของYให้XในบริบทของรูปแบบM สิ่งที่จะเป็นผลกระทบต่อการกระจายของYถ้าเราแทรกแซงในXการตั้งค่าให้x ? นี่ไม่มีอะไรมากไปกว่าการแจกแจงความน่าจะเป็นของY ที่ เกิดจากแบบจำลองที่ปรับเปลี่ยนM x :PM( Y|X)YXMYXxYMx
Z= UZX= xY= g( X, Z, UY)
นั่นคือความน่าจะเป็นแบบ interventional ของถ้าเราตั้งค่าX = xจะได้รับจากความน่าจะเป็นที่เกิดขึ้นใน submodel M xนั่นคือP M x ( Y | X = x ) และมันมักจะแสดงโดย P ( Y | d o ( x = x ) ) ตัวดำเนินการd o ( X = x )ทำให้เราเห็นได้ชัดเจนว่าเรากำลังคำนวณความน่าจะเป็นของYYX= xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Yในรุ่นย่อยที่มีการแทรกแซงการตั้งค่า เท่ากับxซึ่งสอดคล้องกับการเอาชนะสมการโครงสร้างของX กับสมการX = xXxXX=x
เป้าหมายของการวิเคราะห์หลายอย่างคือการหาวิธีแสดงออกการกระจายตัวแบบในแง่ของความน่าจะเป็นร่วมของการกระจายแบบสังเกตการณ์ (ก่อนการแทรกแซง)P(Y|do(X))
ทำแคลคูลัส
do(⋅)P(Y|do(X))และ do-แคลคูลัสเสร็จสมบูรณ์สำหรับโมเดลเชิงโครงสร้างที่ไม่ใช่พารามิเตอร์แบบเรียกซ้ำ )