ความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุหรือไม่?


40

ตัวแปรสุ่มสองตัวคือ A และ B มีความเป็นอิสระทางสถิติ นั่นหมายความว่าใน DAG ของกระบวนการ:และแน่นอน(A) แต่นั่นก็หมายความว่าไม่มีประตูหน้าจาก B ถึง A?(AB)P(A|B)=P(A)

เพราะเราก็ควรจะได้รับ(A) ดังนั้นหากเป็นเช่นนั้นความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุโดยอัตโนมัติหรือไม่?P(A|do(B))=P(A)

คำตอบ:


37

ดังนั้นหากเป็นเช่นนั้นความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุโดยอัตโนมัติหรือไม่?

ไม่และนี่คือตัวอย่างการนับง่ายๆที่มีค่าหลายตัวแปร

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

ด้วยกราฟที่สอดคล้องกัน

ป้อนคำอธิบายรูปภาพที่นี่

ที่นี่เรามีและเป็นอิสระเล็กน้อย (ในกรณีปกติหลายตัวแปรความสัมพันธ์แบบศูนย์หมายถึงความเป็นอิสระ) นี้เกิดขึ้นเพราะเส้นทางลับๆผ่านว่ายกเลิกออกเส้นทางตรงจากไป , ที่อยู่,0 ดังนั้น 0 แต่เป็นสาเหตุโดยตรงและเรามีที่ซึ่งจะแตกต่างจาก 0xyzxycov(x,y)=bac=0.10.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

สมาคมการแทรกแซงและการต่อต้าน

ฉันคิดว่าเป็นสิ่งสำคัญที่จะต้องชี้แจงเกี่ยวกับความเกี่ยวข้องการแทรกแซงและการต่อต้าน

แบบจำลองเชิงสาเหตุนำมาซึ่งข้อความเกี่ยวกับพฤติกรรมของระบบ: (i) ภายใต้การสังเกตแบบพาสซีฟ (ii) ภายใต้การแทรกแซงเช่นเดียวกับ (iii) การต่อต้าน และความเป็นอิสระในระดับหนึ่งไม่จำเป็นต้องแปลเป็นภาษาอื่น

ดังที่แสดงไว้ด้านบนเราไม่สามารถเชื่อมโยงระหว่างและนั่นคือและยังคงเป็นกรณีที่การเปลี่ยนแปลงบนเปลี่ยนการกระจายของนั่นคือ(Y)XYP(Y|X)=P(Y)XYP(Y|do(x))P(Y)

ตอนนี้เราสามารถก้าวไปอีกขั้นหนึ่งได้ เราสามารถมีโมเดลเชิงสาเหตุที่การแทรกแซงจะไม่เปลี่ยนการกระจายตัวของประชากรของแต่นั่นไม่ได้หมายความว่าการขาดการต่อต้านเชิงสาเหตุ! นั่นคือแม้ว่าสำหรับแต่ละผลของพวกเขาทุกจะได้รับที่แตกต่างกันมีคุณเปลี่ยนเขาXนี่เป็นกรณีที่อธิบายโดย user20160 และในคำตอบก่อนหน้าของฉันที่นี่XYP(Y|do(x))=P(Y)YX

สามระดับเหล่านี้สร้างลำดับชั้นของงานการอนุมานสาเหตุในแง่ของข้อมูลที่จำเป็นในการตอบแบบสอบถามในแต่ละระดับ


1
ขอบคุณนั่นคือสิ่งที่ฉันกำลังมองหา ดังนั้นฉันเดาว่าความสับสนของฉันเกิดขึ้นจากการที่คิดว่าอิสรภาพทางสถิติหมายถึงการแยก D ระหว่างตัวแปรทั้งสอง แต่มันใช้งานได้ในทางที่ถูกต้องใช่ไหม
user1834069

@ user1834069 ถูกต้องการแยก d หมายถึงความเป็นอิสระ แต่ความเป็นอิสระไม่ได้หมายความถึงการแยก d สองตัวอย่างนี้เป็นตัวอย่างที่การแจกแจงไม่ตรงกับกราฟและคุณสามารถดูได้ขึ้นอยู่กับตัวเลือกของการกำหนดพารามิเตอร์ หากเราเปลี่ยนพารามิเตอร์การพึ่งพาจะปรากฏขึ้นอีกครั้ง
Carlos Cinelli

ตัวอย่างที่ดี หากฉันจำได้ถูกต้องนี่เป็นหนึ่งในข้อสมมติฐานที่ไม่สามารถทดสอบได้ของการขุดข้อมูลเชิงสาเหตุการขุดจากข้อมูลเชิงสังเกต สำหรับโมเดลเชิงเส้นใน SEM หนังสือของเพิร์ลยังกล่าวด้วยว่าชุดของค่าสัมประสิทธิ์ที่ส่งผลให้มีการแจกแจงที่ไม่ซื่อสัตย์อยู่ในระดับ 0
Vimal

37

สมมติว่าเรามีหลอดไฟควบคุมโดยสองสวิตช์ ให้และแทนสถานะของสวิตช์ซึ่งอาจเป็น 0 หรือ 1 ให้แทนสถานะของ lighbulb ซึ่งอาจเป็น 0 (ปิด) หรือ 1 (เปิด) เราตั้งค่าวงจรดังกล่าวว่า lighbulb เปิดอยู่เมื่อสวิตช์ทั้งสองอยู่ในสถานะต่างกันและดับเมื่ออยู่ในสถานะเดียวกัน ดังนั้นการดำเนินการวงจรพิเศษหรือฟังก์ชั่น:s_2)S1S2LL=XOR(S1,S2)

จากการก่อสร้างเกี่ยวข้องกับและอย่างหากมีการกำหนดค่าระบบใด ๆ หากเราสลับหนึ่งสวิตช์สถานะของหลอดไฟจะเปลี่ยนไปLS1S2

ทีนี้สมมติว่าสวิตช์ทั้งสองนั้นทำงานอย่างอิสระตามกระบวนการของ Bernoulli ซึ่งความน่าจะเป็นที่จะอยู่ในสถานะที่ 1 คือ 0.5 ดังนั้นและและเป็นอิสระ ในกรณีนี้เรารู้จากการออกแบบของวงจรที่และยิ่ง(L) นั่นคือการรู้สถานะของสวิตช์เดียวไม่ได้บอกอะไรเราเกี่ยวกับว่า lighbulb จะเปิดหรือปิด ดังนั้นและมีความเป็นอิสระเช่นเดียวกับและs_2p(S1=1)=p(S2=1)=0.5S1S2P(L=1)=0.5p(LS1)=p(LS2)=p(L)LS1LS2

แต่ดังกล่าวข้างต้นสัมพันธ์กับและอย่างดังนั้นความเป็นอิสระทางสถิติไม่ได้หมายความว่าขาดสาเหตุLS1S2


2
ผู้ใช้คุณถูกต้องว่าตัวอย่างนี้มีสาเหตุที่ไม่มีการพึ่งพาเนื่องจากฉันอธิบายที่นี่stats.stackexchange.com/questions/26300/…อย่างไรก็ตามในตัวอย่างนี้เรามีดังนั้นจึงไม่ตอบคำถามของ OP โดยตรง P(L|do(S1))=P(L)
Carlos Cinelli

ผู้ใช้คำถามโปรด: สิ่งที่เกี่ยวกับ ? คือมันเท่ากับเช่นกัน? ผมเองคิดว่าสำหรับการใด ๆ , , แต่\} ฉันถูกไหม? (ผมเห็นว่ามันไม่ได้เกี่ยวข้องจริงๆ แต่ฉันต้องการที่จะตรวจสอบความเข้าใจของฉัน)p(L|S1,S2)p(L)(vL,v1,v2){0,1}3p(L=vL|S1=v1)=p(L=vL|S2=v2)=0.5 p(L=vL|S1=v1,S2=v2){0,1}
ถ้ำ

0

ตามคำถามของคุณคุณสามารถคิดดังนี้:

P(AB)=P(A)P(B)เมื่อและเป็นอิสระ คุณสามารถบ่งบอกทำนองเดียวกันAB

P(AB)/P(A)=P(B|A)=P(B)(B) นอกจากนี้

P(AB)/P(B)=P(A|B)=P(A)(A)

ในเรื่องนี้ฉันเชื่อว่าความเป็นอิสระหมายถึงการขาดสาเหตุ อย่างไรก็ตามการพึ่งพาอาศัยกันไม่จำเป็นต้องบอกเป็นนัยถึงสาเหตุ


2
ฉันถามว่าหมายความว่าหรือไม่ (ใช้สัญลักษณ์การคำนวณแคลคูลัสของเพิร์ล)P ( A | d o ( B ) ) = P ( A )P(AB)=P(A)P(B)P(A|do(B))=P(A)
user1834069
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.