การแทนเอฟเฟ็กต์การโต้ตอบในกราฟ acyclic โดยตรง


17

กราฟไซเคิลกำกับ (DAGs; เช่น, กรีนแลนด์และอัล, 1999) เป็นส่วนหนึ่งของการอนุมานเชิงสาเหตุของการอนุมานเชิงสาเหตุจากการตีความเชิงลบของค่ายเหตุ ในกราฟเหล่านี้การมีลูกศรจากตัวแปรAไปยังตัวแปรอ้างว่าตัวแปรสาเหตุโดยตรง (การเปลี่ยนแปลงความเสี่ยง) ตัวแปรและการไม่มีลูกศรดังกล่าวยืนยันว่าตัวแปรไม่ได้ก่อให้เกิดโดยตรง ของ) ตัวแปรBBABAB

ยกตัวอย่างเช่นคำแถลง "การสัมผัสกับควันบุหรี่โดยตรงทำให้เกิดการเปลี่ยนแปลงความเสี่ยงของ Mesothelioma" โดยลูกศรสีดำจาก "การสัมผัสกับควันบุหรี่" เป็น "Mesothelioma" ในแผนภาพสาเหตุDAG ไม่ใช่ด้านล่าง

ในทำนองเดียวกันคำแถลง "การเปิดรับแร่ใยหินโดยตรงทำให้เกิดการเปลี่ยนแปลงความเสี่ยงของ Mesothelioma" ถูกแสดงโดยลูกศรสีดำจาก "การสัมผัสแร่ใยหิน" เป็น "Mesothelioma" ในกราฟสาเหตุไม่ใช่ DAGด้านล่าง

ฉันใช้คำที่ไม่ใช่ DAGเพื่ออธิบายกราฟสาเหตุด้านล่างเนื่องจากลูกศรสีแดงซึ่งฉันตั้งใจจะยืนยันบางสิ่งเช่น "การสัมผัสกับแร่ใยหินทำให้เกิดการเปลี่ยนแปลงในผลกระทบโดยตรงจากการได้รับควันบุหรี่จากความเสี่ยงของ Mesothelioma" (ใยหินทำกายภาพ ความเสียหายต่อเซลล์ของปอดนั้นนอกจากจะทำให้เกิดความเสี่ยงต่อการเปลี่ยนแปลงของ Mesothelioma โดยตรงยังทำให้เซลล์มีความเสี่ยงต่อการเกิดมะเร็งจากการสัมผัสควันบุหรี่มากขึ้นและทำให้การสัมผัสกับแร่ใยหินและยาสูบเพิ่มขึ้น ความเสี่ยงที่มากกว่าผลรวมของความเสี่ยงแยกกันทั้งสอง) และสิ่งนี้ค่อนข้างไม่สอดคล้องกับความหมายที่เป็นทางการของลูกศรสาเหตุใน DAG ที่ฉันอธิบายเมื่อเริ่มต้นคำถามของฉัน (เช่นเพราะลูกศรสีแดงไม่ยุติในตัวแปร)

ไม่ใช่กราฟ Acyclic Directed: การได้รับควันบุหรี่ทำให้เกิดความเสี่ยงต่อโรคเนื้องอกในสมองเพิ่มขึ้น  การเปิดรับแร่ใยหินเป็นสาเหตุของความเสี่ยงต่อโรคมะเร็งลำไส้  การเปิดรับแร่ใยหินทำให้การเพิ่มขึ้นของผลกระทบเชิงสาเหตุของยาสูบต่อความเสี่ยงต่อโรคมะเร็งปอด

หนึ่งจะแสดงผลกระทบปฏิสัมพันธ์อย่างถูกต้องภายในพิธีการทางสายตาของ DAG อย่างไร

อ้างอิง

กรีนแลนด์, เอส., เพิร์ล, เจและโรบินส์, JM (1999) สาเหตุแผนภาพสำหรับการวิจัยทางระบาดวิทยา ระบาดวิทยา , 10 (1): 37–48


เป็นไปได้หรือไม่ที่จะเปลี่ยน DAG โดยเพิ่มโหนดสำหรับความเสียหายของเซลล์ปอดด้วยลูกศรจากยาสูบและแร่ใยหินที่ชี้เข้าและลูกศรไปเป็น Mesothelioma นั่นทำให้ DAG และให้ความยืดหยุ่นในการสร้างแบบจำลองเอฟเฟกต์ของแต่ละบุคคล
John Woolf

ใช่ฉันเคยนึกถึงบางอย่างเช่นนั้น แต่ฉันสงสัยว่านั่นก็หมายความว่าผลกระทบหลักของยาสูบก็ไม่ได้เป็น 'ความเสียหายของเซลล์ปอด' เมื่อมันเป็นเช่นนั้น ฉันคิดว่าจะเพิ่มตัวแปร 'ยาสูบและแร่ใยหิน' เข้าด้วยกันอีกอันหนึ่งที่เกิดจากยาสูบและแร่ใยหินได้ แต่นี่ดูเหมือนจะเป็นเรื่องไร้สาระ ... แต่บางทีมันอาจเป็นสิ่งที่เราต้องไปด้วย
Alexis

คุณใช้ซอฟต์แวร์ใดในการสร้างกราฟ
zipzapboing

@zipzapboing ดึงมันด้วยมือใน MS Word หรือ PageStream หรือ Scribus หรือบางอย่างจากนั้นแก้ไขสีและความโปร่งใสโดยใช้ GIMP (จริงๆแล้วมันเป็นข้อความที่ตัดตอนมาจากสไลด์บรรยายบางส่วนของฉัน)
Alexis

คำตอบ:


9

ทฤษฎีเพิร์ลของเวรกรรมที่สมบูรณ์ไม่ใช่ตัวแปร การโต้ตอบไม่ได้ทำให้ชัดเจนเนื่องจากสิ่งนั้นไม่ได้อยู่ในกราฟหรือในสมการโครงสร้างที่แสดง อย่างไรก็ตามผลกระทบเชิงสาเหตุอาจแตกต่างกันไปตามสมมติฐาน

หากมีการระบุเอฟเฟกต์และคุณประเมินจากข้อมูลที่ไม่ใช่พารามิเตอร์คุณจะได้รับการแจกแจงที่สมบูรณ์ของเอฟเฟกต์เชิงสาเหตุ (แทนที่จะพูดเป็นพารามิเตอร์เดียว) ดังนั้นคุณสามารถประเมินผลกระทบเชิงสาเหตุของการได้รับยาสูบตามเงื่อนไขต่อการสัมผัสแร่ใยหินที่ไม่ใช่พารามิเตอร์เพื่อดูว่ามีการเปลี่ยนแปลงหรือไม่โดยไม่ต้องทำอะไรเลย

ลองดูที่สมการโครงสร้างในกรณีของคุณซึ่งตรงกับ "DAG" ของคุณที่ถูกปล้นด้วยลูกศรสีแดง:

1εม.

2εเสื้อ

3εa

ε

เราได้ออกจากฟังก์ชั่นที่เกี่ยวข้อง f () และการแจกแจงของข้อผิดพลาดที่ไม่ได้ระบุยกเว้นการบอกว่าหลังมีความเป็นอิสระ อย่างไรก็ตามเราสามารถประยุกต์ใช้ทฤษฎีของเพิร์ลและระบุได้ทันทีว่าผลกระทบเชิงสาเหตุของยาสูบและแร่ใยหินที่มีต่อ Mesothelioma ถูกระบุแล้ว ซึ่งหมายความว่าหากเรามีข้อสังเกตมากมายจากกระบวนการนี้เราสามารถวัดผลกระทบของการตั้งค่าการรับสัมผัสในระดับที่แตกต่างกันได้อย่างง่ายดายเพียงแค่เห็นเหตุการณ์ของ Mesothelioma ในบุคคลที่มีระดับการสัมผัสที่แตกต่างกัน ดังนั้นเราสามารถอนุมานสาเหตุได้โดยไม่ต้องทำการทดลองจริง เนื่องจากไม่มีเส้นทางหลังประตูจากตัวแปรการรับแสงไปยังตัวแปรผลลัพธ์

ดังนั้นคุณจะได้รับ

P (mesothelioma | do (ยาสูบ = t)) = P (mesothelioma | ยาสูบ = t)

ตรรกะเดียวกันนี้มีผลต่อสาเหตุของแร่ใยหินซึ่งช่วยให้คุณประเมินได้อย่างง่ายดาย:

P (Mesothelioma | Tobacco = t, Asbestos = a) - P (mesothelioma | Tobacco = t ', Asbestos = a)

เมื่อเปรียบเทียบกับ

P (mesothelioma | Tobacco = t, Asbestos = a ') - P (mesothelioma | Tobacco = t', Asbestos = a ')

สำหรับค่าที่เกี่ยวข้องทั้งหมดของ t และ a เพื่อประเมินผลกระทบจากการโต้ตอบ

ในตัวอย่างที่เป็นรูปธรรมของคุณสมมติว่าตัวแปรผลลัพธ์เป็นตัวแปร Bernoulli - คุณสามารถมี Mesothelioma หรือไม่ - และบุคคลนั้นมีระดับใยหินสูงมาก a จากนั้นมีโอกาสมากที่เขาจะต้องทนทุกข์ทรมานจากโรค ดังนั้นผลของการเพิ่มการสัมผัสยาสูบจะต่ำมาก ในทางกลับกันหากระดับแร่ใยหิน a 'ต่ำมากการเพิ่มการรับยาสูบจะมีผลมากขึ้น สิ่งนี้จะเป็นการมีปฏิสัมพันธ์ระหว่างผลกระทบของยาสูบและแร่ใยหิน

แน่นอนการประมาณค่าแบบไม่อิงพารามิเตอร์สามารถเรียกร้องได้อย่างมากและมีเสียงดังด้วยข้อมูล จำกัด และค่า t และค่าต่าง ๆ มากมายดังนั้นคุณอาจคิดว่าสมมติโครงสร้างบางอย่างใน f () แต่โดยทั่วไปคุณสามารถทำได้โดยปราศจากสิ่งนั้น


Julian ขอขอบคุณสำหรับข้อมูลเชิงลึกเกี่ยวกับตรรกะเชิงสาเหตุของการคุมกำเนิดของ Pearl คำตอบของคุณจะได้รับการปรับปรุงโดยการพูดถึงการแสดงภาพของผลกระทบที่มีปฏิสัมพันธ์ที่เป็นศูนย์กลางในคำถามของฉัน (บางทีโดยกล่าวว่า "DABs ความไม่ให้ผลการทำงานร่วมกันอย่างชัดเจน" หรือสิ่งที่มีคุณ.)
อเล็กซิส

1
ใช่คุณถูก; ฉันพยายามทำให้ชัดเจนขึ้นตั้งแต่แรก
Julian Schuessler

จูเลียนนั่นเยี่ยมมาก คุณบอกว่าหน่วยการสร้างของ DAG ไม่ใช่การเชื่อมโยงแต่ละรายการ C = f (D) แต่โดยทั่วไปแล้วการเชื่อมโยงชุด C = f (D, E, ... ) ปัญหาของฉันคือไข่มุกบางครั้งคลุมเครือในเรื่องนี้เช่นใน "Causality" Def 2.2.1 ของเขา: "โครงสร้างเชิงสาเหตุของชุดของตัวแปร V คือ DAG ที่แต่ละโหนดสอดคล้องกับองค์ประกอบที่แตกต่างกันของ V และแต่ละ ลิงก์แสดงถึงความสัมพันธ์การทำงานโดยตรงระหว่างตัวแปรที่เกี่ยวข้อง " แน่นอนว่าแต่ละลิงก์จากพ่อแม่ของ C ถึง C นั้นไม่มีความหมายอะไรเลยพวกเขาแสดงการมีส่วนร่วมในอิทธิพลของ C เท่านั้นคุณเห็นด้วยไหม?
Steve Powell

ใช่. C = f (D, E) จะถูกแสดงโดยสองลิงก์ในกราฟจาก D / E ถึง C การตีความของลิงค์คือ D และ E เป็นตัวกำหนด C ดังนั้นแน่นอนว่าลิงก์นั้นสัมพันธ์กัน
Julian

10

คำตอบง่ายๆคือคุณได้ทำไปแล้ว Conventional DAGs ไม่เพียงแสดงถึงเอฟเฟ็กต์หลัก แต่เป็นการรวมกันของเอฟเฟกต์หลักและการโต้ตอบ เมื่อคุณวาด DAG ของคุณแล้วคุณคิดว่าตัวแปรใด ๆ ที่ชี้ไปยังผลลัพธ์เดียวกันสามารถแก้ไขผลกระทบของตัวแปรอื่นที่ชี้ไปยังผลลัพธ์เดียวกันได้ มันเป็นสมมติฐานการสร้างแบบจำลองแยกต่างหากจาก DAG ซึ่งทึกทักขาดการมีปฏิสัมพันธ์

นอกจากนี้การโต้ตอบสามารถเกิดขึ้นได้โดยไม่รวมคำที่มีความชัดเจนในแบบจำลองของคุณ หากคุณรวมถึงผลกระทบหลักเฉพาะในแบบจำลองสำหรับอัตราส่วนความเสี่ยงของ Y ที่เกี่ยวข้องกับการรักษา T และ covariate Q การประเมินความแตกต่างของความเสี่ยงจะแตกต่างกันไปขึ้นอยู่กับระดับของคิวเพื่อรองรับความเป็นไปได้ทั้งหมดเหล่านี้ เฉพาะข้อสมมติฐานที่อ่อนแอที่สุดในรูปแบบการทำงานของความสัมพันธ์ระหว่างตัวแปรและการสมมติว่าไม่มีปฏิสัมพันธ์ใด ๆ เป็นข้อสันนิษฐานที่แข็งแกร่งกว่าที่อนุญาตให้มีการโต้ตอบ สิ่งนี้คือการบอกว่า DAG อนุญาตให้มีการโต้ตอบอยู่แล้วโดยไม่มีการปรับเปลี่ยนใด ๆ ดู Vanderweele (2009) สำหรับการสนทนาของการโต้ตอบที่ใช้ DAG ทั่วไป แต่อนุญาตให้มีการโต้ตอบ

Bollen & Paxton (1998) และMuthén & Asparouhov (2015) ทั้งสองแสดงให้เห็นถึงการมีปฏิสัมพันธ์ในรูปแบบเส้นทางที่มีตัวแปรแฝง แต่การโต้ตอบเหล่านี้อย่างชัดเจนอ้างถึงข้อกำหนดของผลิตภัณฑ์ในรูปแบบพารามิเตอร์มากกว่าการโต้ตอบอย่างกว้างขวาง ฉันได้เห็นไดอะแกรมคล้ายกับของคุณที่ลูกศรชี้ไปยังเส้นทาง แต่การพูดอย่างเคร่งครัดไม่ใช่จำนวนเฉพาะที่ตัวแปรสามารถมีผลกระทบเชิงสาเหตุได้ (แม้ว่านั่นอาจเป็นวิธีที่เราต้องการตีความแบบจำลองของเรา) ; มันแสดงให้เห็นถึงการปรากฏตัวของผลกระทบเชิงสาเหตุไม่ใช่ขนาดของมัน


Bollen, KA, & Paxton, P. (1998) ปฏิสัมพันธ์ของตัวแปรแฝงในตัวแบบสมการโครงสร้าง แบบจำลองสมการโครงสร้าง: วารสารสหสาขาวิชาชีพ, 5 (3), 267-293

Muthén, B. , & Asparouhov, T. (2015) การโต้ตอบตัวแปรแฝง

VanderWeele, TJ (2009) เกี่ยวกับความแตกต่างระหว่างปฏิสัมพันธ์และการปรับเปลี่ยนเอฟเฟกต์ ระบาดวิทยา, 20 (6), 863-871


3
นอกจากนี้: "เมื่อคุณวาด DAG ของคุณแล้วคุณคิดว่าตัวแปรใด ๆ ที่ชี้ไปที่ผลลัพธ์เดียวกันสามารถแก้ไขผลกระทบของคนอื่น ๆ ที่ชี้ไปที่ผลลัพธ์เดียวกันมันคือสมมติฐานการสร้างแบบจำลองแยกจาก DAG ซึ่งสันนิษฐานว่าไม่มี การมีปฏิสัมพันธ์ " มันยอดเยี่ยม ... มันช่วยให้ความคิดเหล่านี้มาถึงฉัน
Alexis
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.