ฉันเชื่อว่าคำตอบสำหรับคำถามของคุณอย่างรวดเร็วหนึ่งประโยค
เมื่อใดที่เหมาะสมที่จะควบคุมตัวแปร Y และเมื่อใด
คือ "เกณฑ์ประตูหลัง"
แบบจำลองโครงสร้างเชิงสาเหตุของจูเดียเพิร์ลสามารถบอกคุณได้อย่างชัดเจนว่าตัวแปรใดที่เพียงพอ (และเมื่อจำเป็น) สำหรับการปรับสภาพเพื่ออนุมานถึงผลกระทบเชิงสาเหตุของตัวแปรหนึ่งกับอีกตัวแปรหนึ่ง คือมีการตอบคำถามนี้โดยใช้เกณฑ์ด้านหลังซึ่งอธิบายไว้ในหน้า 19 ของบทความวิจารณ์โดย Pearl
ข้อแม้ที่สำคัญคือคุณต้องทราบความสัมพันธ์เชิงสาเหตุระหว่างตัวแปร (ในรูปแบบของลูกศรทิศทางในกราฟ) ไม่มีทางรอบนั้น นี่คือสิ่งที่ความยากลำบากและความเป็นไปได้ที่จะเกิดขึ้น แบบจำลองเชิงสาเหตุเชิงโครงสร้างของ Pearl อนุญาตให้คุณรู้วิธีตอบคำถามที่ถูกต้องเท่านั้นเนื่องจากแบบจำลองเชิงสาเหตุ (เช่นกราฟกำกับ) ซึ่งชุดแบบจำลองเชิงสาเหตุเป็นไปได้ที่จะได้รับการแจกแจงข้อมูลหรือวิธีค้นหาโครงสร้างเชิงสาเหตุโดยทำการทดลองที่เหมาะสม มันไม่ได้บอกคุณถึงวิธีการค้นหาโครงสร้างเชิงสาเหตุที่ถูกต้องเนื่องจากมีเพียงการกระจายข้อมูล ในความเป็นจริงมันอ้างว่าสิ่งนี้เป็นไปไม่ได้โดยไม่ต้องใช้ความรู้ / สัญชาติญาณภายนอกเกี่ยวกับความหมายของตัวแปร
เกณฑ์ด้านหลังประตูสามารถระบุได้ดังนี้:
เพื่อหาสิ่งที่ส่งผลกระทบต่อความสัมพันธ์เชิงสาเหตุของในY ,ชุดของตัวแปรโหนดSจะเพียงพอที่จะได้รับการปรับอากาศในตราบเท่าที่ทั้งสองฝ่ายของเกณฑ์ต่อไปนี้:XY,S
1) ไม่มีองค์ประกอบใด ๆ ในเป็นสายเลือดของXSX
2) บล็อกทั้งหมด "ประตูหลัง" เส้นทางระหว่างXและYSXY
นี่เป็น "ประตูหลัง" เส้นทางเป็นเพียงเส้นทางของลูกศรที่เริ่มต้นที่และสิ้นสุดที่มีลูกศรชี้ไปที่X (ทิศทางที่ลูกศรชี้ทั้งหมดไม่สำคัญ) และ "การบล็อก" คือเกณฑ์ที่มีความหมายเฉพาะซึ่งให้ไว้ในหน้า 11 ของลิงก์ด้านบน นี่เป็นเกณฑ์เดียวกันกับที่คุณจะอ่านเมื่อเรียนรู้เกี่ยวกับ "การแยก D" ฉันเองพบว่าบทที่ 8 ของการจดจำรูปแบบของอธิการและการเรียนรู้ของเครื่องจักรอธิบายแนวคิดของการบล็อกในการแยก D ดีกว่าแหล่งไข่มุกที่ฉันเชื่อมโยงด้านบน แต่มันจะเป็นเช่นนี้:YX.
ชุดของโหนด, บล็อกเส้นทางระหว่างXและYถ้ามันตอบสนองอย่างน้อยหนึ่งในเกณฑ์ต่อไปนี้:S,XY
1) หนึ่งของโหนดในเส้นทางที่ยังอยู่ในส่งเสียงอย่างน้อยหนึ่งลูกศรบนเส้นทาง (เช่นลูกศรชี้ห่างจากโหนด)S,
2) โหนดที่ไม่ได้อยู่ในหรือบรรพบุรุษของโหนดในSมีลูกศรสองตัวในเส้นทาง "การชนกัน" ที่มีต่อมัน (เช่นการพบกันแบบตัวต่อตัว)SS
นี่คือหรือเป็นเกณฑ์ซึ่งแตกต่างจากเกณฑ์ทั่วไปประตูหลังซึ่งเป็นและเกณฑ์
เพื่อให้ชัดเจนเกี่ยวกับเกณฑ์ประตูหลังสิ่งที่บอกคุณคือสำหรับโมเดลเชิงสาเหตุที่กำหนดเมื่อปรับเงื่อนไขให้เพียงพอคุณสามารถเรียนรู้ผลกระทบเชิงสาเหตุจากการแจกแจงความน่าจะเป็นของข้อมูล (ดังที่เราทราบการกระจายข้อต่อเพียงอย่างเดียวนั้นไม่เพียงพอสำหรับการค้นหาพฤติกรรมเชิงสาเหตุเนื่องจากโครงสร้างเชิงสาเหตุหลายอันสามารถรับผิดชอบการกระจายตัวแบบเดียวกันนี่คือสาเหตุที่ต้องใช้ตัวแบบเชิงสาเหตุเช่นกัน) การแจกแจงสามารถประมาณได้โดยใช้ วิธีการเรียนรู้ของเครื่องเกี่ยวกับข้อมูลเชิงสังเกต ตราบใดที่คุณรู้ ที่โครงสร้างเชิงสาเหตุอนุญาตให้มีการ จำกัด ตัวแปร (หรือชุดของตัวแปร) การประเมินผลกระทบเชิงสาเหตุของตัวแปรหนึ่งในอีกตัวแปรหนึ่งนั้นดีเท่ากับการประเมินการกระจายข้อมูลซึ่งคุณได้รับจากวิธีการทางสถิติ
นี่คือสิ่งที่เราพบเมื่อเราใช้เกณฑ์ด้านหลังกับไดอะแกรมทั้งสองของคุณ:
ในกรณีที่ไม่ไม่มีอยู่เส้นทางประตูหลังจากเพื่อX ดังนั้นจึงเป็นความจริงที่Yบล็อกเส้นทางหลังทั้งหมด "เพราะ" ไม่มี อย่างไรก็ตามในแผนภาพซ้ายYเป็นทายาทสายตรงของX ,ในขณะที่ในแผนภาพที่ถูกต้องมันไม่ได้เป็น ดังนั้นYเป็นไปตามเกณฑ์ของประตูหลังในแผนผังด้านขวา แต่ไม่ใช่ทางด้านซ้าย เหล่านี้เป็นผลลัพธ์ที่น่าแปลกใจZX.YYX,Y
อะไรเป็นที่น่าแปลกใจก็คือว่าในแผนภาพขวาตราบใดที่มันเป็นภาพที่สมบูรณ์คุณไม่จำเป็นต้องอยู่บนเงื่อนไขที่จะได้รับผลกระทบเชิงสาเหตุเต็มรูปแบบของXในZ (กล่าวอีกนัยหนึ่งชุดค่า nullเป็นไปตามเกณฑ์ของประตูหลังและเพียงพอสำหรับการปรับสภาพ) นี่เป็นความจริงเพราะค่าของXไม่เกี่ยวข้องกับค่าของYดังนั้นสำหรับข้อมูลที่เพียงพอคุณสามารถเฉลี่ยมากกว่า ค่าของYจะเหยียดหยามผลกระทบของYบนZ การคัดค้านประเด็นหนึ่งจนถึงจุดนี้อาจเป็นไปได้ว่าข้อมูลมี จำกัด ดังนั้นคุณจึงไม่มีตัวแทนจำหน่ายYXZXYYYZ.ค่า Y แต่จำไว้ว่าเกณฑ์ด้านหลังถือว่าคุณมีการแจกแจงความน่าจะเป็นของข้อมูล ในกรณีนี้คุณสามารถวิเคราะห์ marginalize Y ได้ Marginalization ผ่านชุดข้อมูล จำกัด เป็นเพียงการประมาณ นอกจากนี้โปรดทราบว่าไม่น่าเป็นไปได้อย่างยิ่งที่ภาพนี้จะสมบูรณ์ มีปัจจัยภายนอกที่มีแนวโน้มว่าจะมีผลกระทบ X หากปัจจัยเหล่านั้นเกี่ยวข้องกับ Yในทางใดทางหนึ่งก็ต้องทำงานมากกว่านี้เพื่อดูว่า Yต้องถูก จำกัด หรือไม่หรือเพียงพอ หากคุณวาดลูกศรอื่นที่ชี้จาก Yถึง Xดังนั้น Yจึงจำเป็นต้องมีการควบคุมYY.X.YYYXY
แน่นอนว่าเป็นตัวอย่างง่ายๆที่เข้าใจได้ง่ายเมื่อรู้ว่าสามารถหรือไม่สามารถควบคุมได้ แต่นี่คือตัวอย่างเพิ่มเติมที่ไม่ชัดเจนโดยดูจากแผนภาพและคุณสามารถใช้เกณฑ์ด้านหลังได้ สำหรับแผนภาพต่อไปนี้เราถามว่ามันเพียงพอที่จะควบคุมYเมื่อพิจารณาผลกระทบเชิงสาเหตุของXในZYYXZ.
สิ่งแรกที่ควรทราบก็คือว่าในทั้งสองกรณีไม่ได้เป็นลูกหลานของX ดังนั้นมันจึงผ่านเกณฑ์นั้น สิ่งต่อไปที่จะต้องทราบก็คือว่าในทั้งสองกรณีมีเส้นทางลับๆจากหลายZเพื่อX สองในแผนภาพด้านซ้ายและสามทางด้านขวาYX.ZX.
Z←Y→XZ←W→B←A→X. YY B,B,YZ←Y→X
Z←W→B→Y→X. Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
ดังที่ฉันได้กล่าวไว้ก่อนหน้านี้ว่าการใช้เกณฑ์ด้านหลังประตูนั้นจำเป็นต้องให้คุณทราบถึงรูปแบบเชิงสาเหตุ (เช่นแผนภาพ "ลูกศร" ที่ถูกต้องของลูกศรระหว่างตัวแปร) แต่ในความคิดของฉันแบบจำลองสาเหตุโครงสร้างได้ให้วิธีที่ดีที่สุดและเป็นทางการที่สุดในการค้นหาแบบจำลองดังกล่าวหรือรู้ว่าเมื่อใดที่การค้นหาไร้ประโยชน์ นอกจากนี้ยังมีผลข้างเคียงที่ยอดเยี่ยมของการแสดงคำเช่น "รบกวน", "การไกล่เกลี่ย" และ "ปลอม" (ซึ่งทำให้ฉันสับสน) ล้าสมัย เพียงแค่แสดงภาพให้ฉันแล้วฉันจะบอกคุณว่าควรควบคุมวงไหน