The Book of Why โดย Judea Pearl: ทำไมเขาถึงทุบสถิติ


79

ฉันอ่านหนังสือทำไมจากแคว้นยูเดียเพิร์ลและมันจะได้รับภายใต้ผิวของฉัน1 โดยเฉพาะสำหรับฉันมันดูเหมือนว่าเขาจะทุบสถิติ "คลาสสิก" อย่างไร้เงื่อนไขโดยการใส่อาร์กิวเมนต์ของมนุษย์ฟางที่สถิติไม่เคยสามารถตรวจสอบความสัมพันธ์เชิงสาเหตุที่ไม่เคยสนใจความสัมพันธ์เชิงสาเหตุและสถิตินั้น "กลายเป็นแบบจำลอง - ลดข้อมูลองค์กร " สถิติกลายเป็นคำน่าเกลียดในหนังสือของเขา

ตัวอย่างเช่น:

นักสถิติสับสนอย่างมากเกี่ยวกับตัวแปรที่ควรและไม่ควรควบคุมดังนั้นการฝึกหัดเริ่มต้นคือการควบคุมทุกสิ่งที่เราสามารถวัดได้ [... ] มันเป็นวิธีที่สะดวกและง่ายในการติดตาม แต่มันทั้งสิ้นเปลืองและขี่ไปด้วยความผิดพลาด ความสำเร็จที่สำคัญของการปฏิวัติเชิงสาเหตุได้ทำให้ความสับสนนี้สิ้นสุดลง

ในขณะเดียวกันนักสถิติก็ประเมินการควบคุมในแง่ที่ว่าพวกเขาไม่เต็มใจที่จะพูดคุยเกี่ยวกับความเป็นเหตุเป็นผล [... ]

อย่างไรก็ตามแบบจำลองเชิงสาเหตุมีสถิติเช่นนี้ตลอดไป ฉันหมายถึงแบบจำลองการถดถอยสามารถนำมาใช้เป็นแบบจำลองเชิงสาเหตุได้เนื่องจากเราสมมติว่าตัวแปรหนึ่งเป็นสาเหตุและอีกอย่างคือผลกระทบ .

อ้างอีก:

ไม่น่าแปลกใจที่นักสถิติพบว่าปริศนานี้ [ปัญหา Monty Hall] ยากที่จะเข้าใจ พวกเขาเคยชินกับการที่ RA Fisher (1922) กล่าวว่า "การลดลงของข้อมูล" และไม่สนใจกระบวนการสร้างข้อมูล

สิ่งนี้ทำให้ฉันนึกถึงคำตอบที่แอนดรูว์เจลแมนเขียนถึงการ์ตูน xkcd ที่มีชื่อเสียงใน Bayesians และผู้ที่พบบ่อย: "ถึงกระนั้นฉันคิดว่าการ์ตูนโดยรวมนั้นไม่ยุติธรรมในการเปรียบเทียบ Bayesian ที่สมเหตุสมผลกับสถิติ ."

จำนวนการบิดเบือนความจริงของคำที่ฉันเห็นมันมีอยู่ในหนังสือจูเดียเพิร์ลทำให้ฉันสงสัยว่าการอนุมานเชิงสาเหตุ (ซึ่งฉันเห็นว่าเป็นวิธีที่มีประโยชน์และน่าสนใจในการจัดระเบียบและการทดสอบสมมติฐานทางวิทยาศาสตร์2 )

คำถาม:คุณคิดว่าจูเดียเพิร์ลเป็นสถิติที่บิดเบือนความจริงและถ้าใช่ทำไม? เพียงเพื่อให้การอนุมานเชิงสาเหตุมีขนาดใหญ่กว่าที่เป็นอยู่? คุณคิดว่าการอนุมานเชิงสาเหตุเป็นการปฏิวัติที่มี R ขนาดใหญ่ซึ่งเปลี่ยนแปลงความคิดของเราจริง ๆ หรือไม่?

แก้ไข:

คำถามข้างต้นเป็นปัญหาหลักของฉัน แต่เนื่องจากเป็นที่ยอมรับยอมรับให้ความเห็นโปรดตอบคำถามที่เป็นรูปธรรมเหล่านี้ (1) ความหมายของ "การปฏิวัติเป็นสาเหตุ" คืออะไร? (2) มันแตกต่างจากสถิติ "ดั้งเดิม" อย่างไร

1. นอกจากนี้เพราะเขาเป็นเช่นเป็นคนเจียมเนื้อเจียมตัว
2. ฉันหมายถึงในแง่วิทยาศาสตร์ไม่ใช่เชิงสถิติ

แก้ไข : Andrew Gelman เขียนโพสต์บล็อกนี้ในหนังสือ Judea Pearls และฉันคิดว่าเขาทำงานได้ดีกว่ามากในการอธิบายปัญหาของฉันกับหนังสือเล่มนี้มากกว่าที่ฉันทำ นี่คือคำพูดสองคำ:

ในหน้า 66 ของหนังสือ Pearl และ Mackenzie เขียนว่าสถิติ“ กลายเป็นองค์กรการลดข้อมูลแบบคนตาบอด” เฮ้! คุณกำลังพูดถึงเรื่องอะไร? ฉันเป็นนักสถิติฉันทำสถิติมา 30 ปีทำงานในด้านต่าง ๆ ตั้งแต่การเมืองจนถึงพิษวิทยา “ การลดข้อมูลแบบคนตาบอด”? นั่นเป็นเพียงแค่เรื่องเหลวไหล เราใช้โมเดลตลอดเวลา

และอีกหนึ่ง:

ดู. ฉันรู้เกี่ยวกับภาวะที่กลืนไม่เข้าคายไม่ออกของพหุนิยม ในอีกด้านหนึ่งเพิร์ลเชื่อว่าวิธีการของเขาดีกว่าทุกอย่างที่เกิดขึ้นก่อนหน้านี้ ละเอียด. สำหรับเขาและสำหรับคนอื่น ๆ พวกเขาเป็นเครื่องมือที่ดีที่สุดสำหรับการศึกษาการอนุมานสาเหตุ ในขณะเดียวกันในฐานะนักพหุนิยมหรือนักเรียนที่มีประวัติทางวิทยาศาสตร์เราตระหนักว่ามีหลายวิธีในการอบเค้ก มันยากที่จะแสดงความเคารพต่อวิธีการที่คุณไม่ได้ผลสำหรับคุณและในบางจุดวิธีเดียวที่จะทำได้คือการถอยกลับและตระหนักว่าคนจริงใช้วิธีการเหล่านี้เพื่อแก้ปัญหาที่แท้จริง ตัวอย่างเช่นฉันคิดว่าการตัดสินใจโดยใช้ p-values ​​เป็นแนวคิดที่แย่และมีเหตุผลที่ไม่สอดคล้องกันซึ่งนำไปสู่ภัยพิบัติทางวิทยาศาสตร์มากมาย ในเวลาเดียวกันนักวิทยาศาสตร์หลายคนจัดการเพื่อใช้ค่า p เป็นเครื่องมือสำหรับการเรียนรู้ ฉันยอมรับว่า ในทำนองเดียวกัน ฉันขอแนะนำให้ Pearl รับรู้ว่าเครื่องมือของสถิติการสร้างแบบจำลองการถดถอยเชิงลำดับขั้นการโต้ตอบการสร้างโพสต์การเรียนรู้ของเครื่อง ฯลฯ แก้ปัญหาจริงในการอนุมานเชิงสาเหตุ วิธีการของเราเช่นเดียวกับไข่มุกก็สามารถทำให้ยุ่งเหยิงได้ - GIGO! - และบางทีสิทธิของ Pearl ที่เราทุกคนควรจะเปลี่ยนไปใช้แนวทางของเขา แต่ฉันไม่คิดว่ามันจะช่วยได้เมื่อเขาออกแถลงการณ์ที่ไม่ถูกต้องเกี่ยวกับสิ่งที่เราทำ


41
การถดถอยเชิงเส้นไม่ใช่แบบจำลองเชิงสาเหตุ ง่ายการถดถอยเชิงเส้นเป็นเหมือนกันเป็นคู่ความสัมพันธ์ที่แตกต่างเพียง standarization ดังนั้นถ้าคุณบอกว่าการถดถอยนั้นเป็นต้นเหตุแล้วสิ่งเดียวกันก็ควรเป็นจริงเช่นกันสำหรับสหสัมพันธ์ สาเหตุที่สัมพันธ์กันคืออะไร? คุณสามารถใช้การถดถอยเพื่อทำนายความสัมพันธ์ไร้สาระระหว่างตัวแปรใด ๆ (พร้อมผลลัพธ์ "สำคัญ" โดยบังเอิญ)
ทิม

8
ความไม่ลงรอยกันที่วิธีการให้เหตุผลเกี่ยวกับความเป็นเหตุเป็นผลในทางสถิติมีข้อดีที่สุดระหว่าง Pearl, Rubin, Heckman และคนอื่น ๆ ดูเหมือนจะมีปัญหามากขึ้นและฉันคิดว่า อย่าปล่อยให้สิ่งนั้นมารบกวนคุณจากข้อมูลเชิงลึกที่แท้จริงที่เขามีให้ อ่านหนังสือก่อนหน้าเวรกรรมของเขามันจะได้รับภายใต้ผิวของคุณน้อยลง
CloseToC

7
@CloseToC ฉันจะเพิ่มว่า Pearl, Rubin และ Heckman ทำงานในกรอบการทำงานเดียวกัน (กล่าวคือเฟรมเวิร์กที่เทียบเท่าเชิงตรรกะดูที่นี่stats.stackexchange.com/questions/249767/ … ) ดังนั้นข้อพิพาทของพวกเขาจึงแตกต่างกัน ระดับจากการโต้แย้งสิ่งต่าง ๆ เช่น "การถดถอยเชิงเส้นเป็นแบบจำลองเชิงสาเหตุ"
Carlos Cinelli

9
ฉันหงุดหงิดกับหนังสือเล่มนี้ มีการกล่าวอ้างทางสถิติที่ผิด ๆ (ไม่สามารถอ้างอิงตอนนี้หนังสือที่มีบันทึกของฉันอยู่ที่ชายขอบ) ซึ่งทำให้ฉันสงสัยว่ามีนักข่าวเพียงคนเดียวที่ช่วยให้เพิร์ลเขียนหนังสือหรือเพิร์ลเองก็เป็นนักสถิติที่ยากจน (ไม่จำเป็นต้องพูดว่าฉันรู้สึกประหลาดใจมากที่ค้นพบความผิดพลาดดังกล่าวในงานของนักวิทยาศาสตร์ที่เคารพนับถือ) เอกสารของเขาดีขึ้นมากถึงแม้ว่าจะไม่มีใครกล่าวหาเพิร์ลสำหรับความสงบเสงี่ยม ...
Richard Hardy

15
ฉันมีความกังวลบางอย่างที่หัวข้อนี้ได้รวมตัวกัน (a) หนังสือเฉพาะจากบุคคลที่ฉลาดมาก (b) ที่บุคลิกของบุคคลที่ฉลาดและรูปแบบของการอภิปราย (c) ไม่ว่าจะเป็นมุมมองที่ถูกต้องเกินจริงหรืออะไรก็ตาม
Nick Cox

คำตอบ:


59

ฉันเห็นด้วยอย่างเต็มที่ว่าน้ำเสียงของ Pearl นั้นหยิ่งผยองและลักษณะของ "นักสถิติ" ของเขานั้นเรียบง่ายและมีขนาดใหญ่มาก นอกจากนี้ฉันไม่พบว่างานเขียนของเขาชัดเจนเป็นพิเศษ

อย่างไรก็ตามฉันคิดว่าเขามีประเด็น

การใช้เหตุผลเชิงสาเหตุไม่ใช่ส่วนหนึ่งของการฝึกอบรมอย่างเป็นทางการของฉัน (MSc): สิ่งที่ฉันได้รับในหัวข้อที่ใกล้เคียงที่สุดคือวิชาเลือกในการออกแบบการทดลองเช่นการอ้างเหตุผลใด ๆ ที่ทำให้ฉันต้องควบคุมสภาพแวดล้อมทางกายภาพ Causalityหนังสือของ Pearl เป็นครั้งแรกที่ฉันได้รับการพิสูจน์ความคิดนี้ เห็นได้ชัดว่าฉันไม่สามารถพูดกับนักสถิติและหลักสูตรทั้งหมดได้ แต่จากมุมมองของฉันเองฉันสมัครรับข้อมูลจากการสังเกตของ Pearl ว่าการใช้เหตุผลเชิงเหตุผลนั้นไม่ได้มีความสำคัญในด้านสถิติ

มันเป็นความจริงที่บางครั้งนักสถิติควบคุมตัวแปรมากกว่าที่จำเป็นอย่างเคร่งครัด แต่สิ่งนี้ไม่ค่อยนำไปสู่ข้อผิดพลาด (อย่างน้อยก็ในประสบการณ์ของฉัน)

นี่เป็นความเชื่อที่ฉันจัดขึ้นหลังจากเรียนจบปริญญาโทด้านสถิติในปี 2010

อย่างไรก็ตามมันไม่ถูกต้องอย่างลึกซึ้ง เมื่อคุณควบคุมเอฟเฟ็กต์ทั่วไป (เรียกว่า "Collider" ในหนังสือ) คุณสามารถแนะนำอคติการเลือก การรับรู้นี้ค่อนข้างน่าประหลาดใจสำหรับฉันและทำให้ฉันเชื่อมั่นในประโยชน์ของการเป็นตัวแทนสมมุติฐานเชิงสาเหตุของฉันเป็นกราฟ

แก้ไข: ฉันถูกขอให้อธิบายรายละเอียดเกี่ยวกับการเลือกอคติ หัวข้อนี้ค่อนข้างบอบบางฉันขอแนะนำให้อ่าน edX MOOC ในCausal Diagramsเป็นการแนะนำที่ดีมากสำหรับกราฟที่มีบทที่เน้นการเลือกแบบลำเอียง

สำหรับตัวอย่างของเล่นเพื่อถอดความบทความนี้อ้างถึงในหนังสือ: พิจารณาตัวแปร A = ความน่าดึงดูดใจ, B = ความงาม, C = ความสามารถ สมมติว่า B และ C ไม่เกี่ยวข้องกันอย่างมีเหตุมีผลในประชากรทั่วไป (เช่นความงามไม่ทำให้เกิดความสามารถความสามารถไม่ก่อให้เกิดความงามและความงามและความสามารถไม่ได้มีสาเหตุร่วมกัน) สมมติว่าหนึ่งใน B หรือ C ใด ๆ ที่เพียงพอสำหรับการดึงดูดเช่น A คือ collider การปรับสภาพบน A สร้างความสัมพันธ์ระหว่างปลอมกับ B และ C

ตัวอย่างที่ร้ายแรงกว่าคือ "น้ำหนักแรกเกิดที่ผิดธรรมดา" ตามที่การสูบบุหรี่ของแม่ในระหว่างตั้งครรภ์ดูเหมือนว่าจะลดอัตราการตาย (M) ของทารกถ้าทารกมีน้ำหนักน้อย (U) คำอธิบายที่เสนอคือข้อบกพร่องการเกิด (D) ยังทำให้น้ำหนักแรกเกิดต่ำและยังนำไปสู่การเสียชีวิต แผนภาพสาเหตุที่สอดคล้องกันคือ {S -> U, D -> U, U -> M, S -> M, D -> M} ซึ่ง U เป็น collider; ปรับอากาศบนมันแนะนำสมาคมปลอม ปรีชาหลังนี้คือถ้าแม่เป็นนักสูบบุหรี่น้ำหนักแรกเกิดต่ำมีโอกาสน้อยที่จะเป็นเพราะข้อบกพร่อง


8
+1 คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับวิธีนำเสนออคติการเลือกได้ไหม? บางทีตัวอย่างที่เป็นรูปธรรมอาจทำให้ชัดเจนสำหรับผู้อ่านส่วนใหญ่
อะมีบา

2
ขอบคุณสำหรับการแก้ไข นี่เป็นตัวอย่างที่ชัดเจนมาก
อะมีบา

ดังนั้นปรีชาสำหรับทารกแรกเกิดน้ำหนักน้อย 'Smokers' ถูกต้องใช่มั้ย
Malady

@Malandy: รุ่นนี้สอดคล้องกับข้อมูลและใช้งานง่าย ฉันไม่รู้ว่าถูกต้องหรือไม่
mitchus


71

คำถามของคุณสะท้อนถึงสิ่งที่ไข่มุกพูด!

การถดถอยเชิงเส้นอย่างง่ายเป็นหลักแบบจำลองเชิงสาเหตุ

ไม่การถดถอยเชิงเส้นเป็นตัวแบบเชิงสถิติไม่ใช่ตัวแบบเชิงสาเหตุ สมมุติว่าเป็นตัวแปรสุ่มที่มีการแจกแจงปกติหลายตัวแปร จากนั้นคุณสามารถประมาณความคาดหวังเชิงเส้นได้อย่างถูกต้อง , , ,อื่น ๆ โดยใช้การถดถอยเชิงเส้น แต่มี ไม่มีอะไรที่นี่ที่บอกว่าปริมาณใด ๆ นั้นเป็นสาเหตุหรือไม่Y,X,ZE[YX]E[XY]E[YX,Z]E[ZY,X]

ในขณะที่สมการโครงสร้างเชิงเส้นเป็นแบบจำลองเชิงสาเหตุ แต่ขั้นตอนแรกคือการเข้าใจความแตกต่างระหว่างสมมติฐานทางสถิติ (ข้อ จำกัด ในการแจกแจงความน่าจะเป็นร่วมที่สังเกต) และข้อสมมติฐานเชิงสาเหตุ (ข้อ จำกัด เกี่ยวกับตัวแบบเชิงสาเหตุ)

คุณคิดว่าจูเดียเพิร์ลบิดเบือนสถิติและถ้าใช่ทำไม?

ไม่ฉันไม่คิดอย่างนั้นเพราะเราเห็นความเข้าใจผิดเหล่านี้ทุกวัน แน่นอนว่า Pearl กำลังสร้างภาพรวมเนื่องจากนักสถิติบางคนทำงานกับการอนุมานสาเหตุ (ดอนรูบินเป็นผู้บุกเบิกในการส่งเสริมผลลัพธ์ที่เป็นไปได้ ... เช่นกันฉันก็เป็นนักสถิติ!) แต่เขาก็ถูกต้องในการบอกว่าการศึกษาสถิติแบบเดิม ๆ ทำให้เกิดเวรกรรมแม้จะกำหนดอย่างเป็นทางการว่าผลกระทบเชิงสาเหตุคืออะไร

เพื่อให้ชัดเจนถ้าเราถามนักสถิติ / นักเศรษฐศาสตร์ด้วยการฝึกอบรมตามปกติเพื่อกำหนดทางคณิตศาสตร์ว่าค่าคาดหวังของคืออะไรถ้าเราเข้าไปแทรกแซงเขาอาจจะเขียน (ดูตัวอย่างที่นี่) ! แต่นั่นเป็นปริมาณการสังเกตนั่นไม่ใช่วิธีที่คุณกำหนดเอฟเฟกต์เชิงสาเหตุ! ในอีกแง่หนึ่งในปัจจุบันนักเรียนที่มีเพียงสถิติดั้งเดิมยังขาดความสามารถในการกำหนดปริมาณทางคณิตศาสตร์ได้อย่างเหมาะสม (หรือหากคุณไม่คุ้นเคยกับ ทฤษฎีโครงสร้าง / การต่อต้านของการก่อให้เกิด !YXE[Y|X] E[Yx]E[Y|do(x)]

คำพูดที่คุณนำมาจากหนังสือเป็นตัวอย่างที่ดี คุณจะไม่พบคำจำกัดความที่ถูกต้องของหนังสือสถิติแบบดั้งเดิมในหนังสือที่บ่งบอกถึงสิ่งที่ผู้สับสนไว้วางใจหรือคำแนะนำเกี่ยวกับเวลาที่คุณควร (หรือไม่ควร) ปรับตัวให้กับเพื่อนร่วมงาน โดยทั่วไปแล้วคุณจะเห็น "เกณฑ์ที่สัมพันธ์กัน" เช่น "หากค่าความแปรปรวนร่วมมีความสัมพันธ์กับการรักษาและผลลัพธ์คุณควรปรับให้เข้ากับเงื่อนไข" หนึ่งในตัวอย่างที่น่าทึ่งที่สุดของความสับสนนี้ปรากฏขึ้นในParadox ของซิมป์สัน - เมื่อต้องเผชิญกับการประมาณสองสัญญาณที่ต่างกันซึ่งคุณควรเลือกใช้การปรับหรือไม่ต้องปรับ แน่นอนว่าคำตอบนั้นขึ้นอยู่กับโมเดลเชิงสาเหตุ

เพิร์ลหมายความว่าอย่างไรเมื่อเขาพูดว่าคำถามนี้จบลงแล้ว? ในกรณีที่มีการปรับตัวโดยง่ายผ่านทางถดถอยเขาจะหมายถึงเกณฑ์ลับๆ (ดูเพิ่มเติมที่นี่) และสำหรับการระบุโดยทั่วไป --- การปรับเปลี่ยนง่าย ๆ - เขาหมายความว่าตอนนี้เรามีอัลกอริธึมที่สมบูรณ์สำหรับการระบุเอฟเฟกต์เชิงสาเหตุสำหรับ DAG กึ่งเครื่องหมายที่กำหนด

อีกข้อสังเกตที่นี่คุ้มค่าที่จะทำ แม้จะอยู่ในการศึกษาทดลอง - ที่สถิติแบบดั้งเดิมได้ทำแน่นอนมากในการทำงานที่สำคัญที่มีการออกแบบการทดลอง - ในตอนท้ายของวันที่คุณยังคงต้องรุ่นสาเหตุ การทดสอบอาจประสบกับการขาดการปฏิบัติตาม, การสูญเสียการติดตาม, จากอคติการเลือก ... นอกจากนี้ส่วนใหญ่คุณไม่ต้องการ จำกัด ผลลัพธ์ของการทดสอบของคุณไปยังประชากรเฉพาะที่คุณวิเคราะห์คุณต้องการสรุป ผลการทดลองไปยังประชากรในวงกว้าง / แตกต่างกัน. ที่นี่อีกครั้งหนึ่งอาจถาม: สิ่งที่คุณควรปรับตัว ข้อมูลและความรู้ที่สำคัญที่คุณมีเพียงพอที่จะคาดการณ์ได้หรือไม่? ทั้งหมดนี้เป็นแนวคิดเกี่ยวกับสาเหตุดังนั้นคุณต้องใช้ภาษาเพื่อแสดงสมมติฐานอย่างเป็นทางการและตรวจสอบว่ามันเพียงพอที่จะให้คุณทำสิ่งที่คุณต้องการหรือไม่!

โดยรวมแล้วความเข้าใจผิดเหล่านี้แพร่หลายในด้านสถิติและเศรษฐมิติซึ่งมีหลายตัวอย่างใน Cross Validated เช่น:

และอื่น ๆ อีกมากมาย.

คุณคิดว่าการอนุมานสาเหตุเป็นการปฏิวัติที่มี R ขนาดใหญ่ซึ่งเปลี่ยนแปลงความคิดของเราจริง ๆ หรือไม่?

เมื่อพิจารณาถึงสถานะของกิจการในปัจจุบันในหลาย ๆ วิทยาศาสตร์เรามีความก้าวหน้าและความรวดเร็วเพียงใดและสิ่งที่เปลี่ยนแปลงอย่างรวดเร็วและเท่าไหร่ที่เราสามารถทำได้ฉันจะบอกว่านี่เป็นการปฏิวัติ

PS : เพิร์ลแนะนำสองโพสต์ของเขาในบล็อกของเวรกรรมยูซีแอลที่จะเป็นที่สนใจของการสนทนานี้แล้วคุณจะพบการโพสต์ที่นี่และที่นี่

PS 2 : ตามที่มกราคมได้กล่าวถึงในการแก้ไขใหม่ของเขา Andrew Gelman มีโพสต์ใหม่ในบล็อกของเขา นอกจากการถกเถียงกันในบล็อกของ Gelman แล้ว Pearl ยังได้ตอบทวิตเตอร์ (ด้านล่าง):

รีวิว Gelman ของ #Bookofwhy น่าสนใจเพราะมันแสดงถึงทัศนคติที่ทำให้เป็นอัมพาตวงกว้างของนักวิจัยทางสถิติ ปฏิกิริยาเริ่มต้นของฉันตอนนี้โพสต์บนhttps://t.co/mRyDcgQtEcโพสต์ที่เกี่ยวข้อง:https://t.co/xUwR6eCGrZ และhttps://t.co/qwqV3oyGUy

- Judea Pearl (@yudapearl) 9 มกราคม 2019


4
ขอขอบคุณ. แต่ - การเขียนแบบง่ายฉันสามารถคำนวณ E [X | Y] เช่นเดียวกับ E [Y | X] แต่ฉันสามารถเขียน X ← Y และ X → Y ใน DAG ได้ ไม่ทางใดก็ทางหนึ่งฉันต้องเริ่มต้นด้วยสมมติฐานทางวิทยาศาสตร์หรือแบบจำลอง สมมติฐานของฉันแบบจำลองของฉัน - ตัวเลือกของฉัน ความจริงที่ว่าฉันสามารถทำอะไรไม่ได้หมายความว่าฉันควรทำ
มกราคม

3
@ มกราคมมันไม่ได้หมายความว่าคุณควรจุดที่นี่เป็นเพียงเกี่ยวกับความสามารถในการพูดอย่างถูกต้องสิ่งที่คุณต้องการที่จะประเมิน (ประมาณสาเหตุ), ปล้องสมมติฐานสมมติฐานสาเหตุของคุณอย่างถูกต้อง (ทำให้ชัดเจนความแตกต่างของสมมติฐานเชิงสาเหตุและสถิติ) ความหมายเชิงตรรกะของสมมติฐานเชิงสาเหตุเหล่านั้นและสามารถเข้าใจได้ว่าสมมติฐานเชิงสาเหตุ + ข้อมูลของคุณเพียงพอสำหรับการตอบแบบสอบถามหรือไม่
Carlos Cinelli

3
@January ว่าคุณมีการศึกษาเชิงสังเกตและต้องการที่จะประเมินผลกระทบเชิงสาเหตุของในYคุณจะตัดสินใจว่าเพื่อนร่วมรัฐใดที่จะรวมในการถดถอยของคุณ? XY
Carlos Cinelli

4
ฉันคิดว่าอย่างนั้น: มันไม่ยุติธรรมเลยที่จะแนะนำว่านักสถิติโดยเฉลี่ยของคุณในขณะที่มีความเชี่ยวชาญในการอนุมานเชิงสาเหตุจากการทดลองที่ควบคุมแล้วและแน่นอนว่าไม่มีอันตรายจากความสัมพันธ์ที่สัมพันธ์กับสาเหตุอาจจะสั่นคลอนเล็กน้อย ข้อมูล. ฉันใช้ล่าสุดเป็นบริบทของใบเสนอราคา (ฉันไม่ได้อ่านหนังสือ) และเป็นสิ่งที่ผู้อ่านบางคนของโพสต์นี้อาจไม่มารับ
Scortchi

5
@January กล่าวสั้น ๆ ว่า "การปรับเพื่อความแปรปรวนร่วม" ไม่ได้แปลว่าคุณได้กำจัดอคติในการประมาณค่าผลกระทบเชิงสาเหตุจากตัวแปรเหล่านั้น
อเล็กซิส

31

ฉันเป็นแฟนตัวยงของงานเขียนของจูเดียและฉันอ่าน Causality (ความรัก) และ Book of Why (ชอบ)

ฉันไม่รู้สึกว่าจูเดียกำลังทุบสถิติ เป็นการยากที่จะได้ยินคำวิจารณ์ แต่เราจะพูดอะไรเกี่ยวกับบุคคลหรือสาขาที่ไม่วิจารณ์ พวกเขามีแนวโน้มจากความยิ่งใหญ่ที่จะพึงพอใจ คุณต้องถามว่า: คำวิจารณ์นั้นถูกต้องจำเป็นมีประโยชน์และมีการเสนอทางเลือกอื่นหรือไม่? คำตอบสำหรับทุกคนนั้นคือ "ใช่"

แก้ไข? ฉันได้ตรวจสอบและทำงานร่วมกันในเอกสารจำนวนไม่กี่โหลการวิเคราะห์ข้อมูลเชิงสังเกตการณ์ส่วนใหญ่และฉันไม่ค่อยรู้สึกว่ามีการอภิปรายเกี่ยวกับสาเหตุที่เพียงพอ วิธีการ "ปรับ" เกี่ยวข้องกับการเลือกตัวแปรเพราะมันถูกเลือกด้วยมือจาก DD ว่าเป็น "ประโยชน์" "ที่เกี่ยวข้อง" "สำคัญ" หรือไร้สาระอื่น ๆ 1

จำเป็น? สื่อกำลังจมอยู่ใต้น้ำกับข้อความที่ขัดแย้งกันเกี่ยวกับผลกระทบต่อสุขภาพของการสัมผัสที่สำคัญ ความไม่สอดคล้องกับการวิเคราะห์ข้อมูลมีหลักฐานที่ซบเซาซึ่งทำให้เราขาดนโยบายที่เป็นประโยชน์ขั้นตอนการดูแลสุขภาพและคำแนะนำสำหรับการมีชีวิตที่ดีขึ้น

มีประโยชน์หรือไม่ ความคิดเห็นของจูเดียนั้นตรงประเด็นและเจาะจงพอที่จะหยุดชั่วคราว มันเกี่ยวข้องโดยตรงกับการวิเคราะห์ข้อมูลใด ๆ ที่นักสถิติหรือผู้เชี่ยวชาญด้านข้อมูลอาจพบ

มันเสนอทางเลือกอื่นหรือไม่? ใช่แล้วยูเดียพูดถึงความเป็นไปได้ของวิธีการทางสถิติขั้นสูงและแม้แต่วิธีที่พวกเขาลดลงไปสู่กรอบงานทางสถิติที่รู้จัก (เช่นการสร้างแบบจำลองสมการโครงสร้าง) และการเชื่อมต่อกับตัวแบบการถดถอย จำเป็นอย่างยิ่งที่จะต้องมีคำชี้แจงที่ชัดเจนเกี่ยวกับความรู้ด้านเนื้อหาที่มีแนวทางแนวทางการสร้างแบบจำลอง

จูเดียไม่เพียง แต่แนะนำให้เรากำหนดวิธีการทางสถิติทั้งหมด (เช่นการถดถอย) แต่เขากำลังบอกว่าเราจำเป็นต้องยอมรับทฤษฎีเชิงสาเหตุบางอย่างเพื่อปรับแบบจำลอง

1การร้องเรียนที่นี่เป็นเรื่องเกี่ยวกับการใช้ภาษาที่น่าเชื่อถือและไม่แน่ชัดเพื่อพิสูจน์ว่าอะไรคือวิธีที่ผิดในการสร้างแบบจำลอง อาจมีการทับซ้อน serendipitously แต่ Pearl มีความชัดเจนเกี่ยวกับวัตถุประสงค์ของแผนภาพสาเหตุ (DAG) และวิธีการที่ตัวแปรสามารถจัดเป็น "confounders"


3
คำตอบที่ดี โปรดทราบว่าการไม่ได้เป็นนักสถิติ แต่ได้ทำหน้าที่เป็นส่วนต่อประสานระหว่างสถิติและชีววิทยามาเป็นเวลาหลายปีสำหรับฉันคำติชมของนักสถิติก็ไม่ยากที่จะได้ยิน ;-) อย่างไรก็ตามคุณคิดว่า "สถิติดั้งเดิม" ไม่สามารถจัดการกับเวรกรรมได้ อย่างที่เพิร์ลบอกไว้อย่างชัดเจน?
มกราคม

4
@January contraire au ฉันคิดว่าการขาดในหมู่นักสถิติในการรับการอนุมานสาเหตุในการวิเคราะห์ของพวกเขาจะเกี่ยวข้องโดยตรงกับการขาดของพวกเขาในการทำความเข้าใจการอนุมานประจำ มันเป็นเหตุผลที่ไม่มีเหตุผลในทางลบ
AdamO

4
+1 " 'การปรับวิธีการ' เกี่ยวข้องกับการเลือกตัวแปรเพราะพวกเขาถูกมือหยิบจาก DD เป็น 'ประโยชน์' 'เกี่ยวข้อง' 'สำคัญ' หรือเรื่องไร้สาระอื่น ๆโดยไม่ต้องใช้มาตรการสมมติฐานอย่างเป็นทางการเกี่ยวกับความสัมพันธ์เชิงสาเหตุที่เฉพาะเจาะจงในหมู่พวกเขา ( ลาการใช้ DAG อย่างเป็นทางการ) " เพิ่มการแก้ไขแล้ว :)
อเล็กซิส

ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Scortchi

23

ฉันไม่ได้อ่านหนังสือเล่มนี้ดังนั้นฉันสามารถตัดสินเฉพาะข้อความที่คุณให้ อย่างไรก็ตามแม้บนพื้นฐานนี้ฉันเห็นด้วยกับคุณว่านี่ดูเหมือนจะไม่ยุติธรรมอย่างมากต่ออาชีพทางสถิติ ฉันคิดว่านักสถิติได้ทำงานที่ดีอย่างน่าทึ่งโดยเน้นย้ำถึงความแตกต่างระหว่างการเชื่อมโยงทางสถิติ (ความสัมพันธ์ ฯลฯ ) และความเป็นเหตุเป็นผลและเตือนต่อการเกิดความสับสนของทั้งสอง จากประสบการณ์ของฉันนักสถิติมักจะเป็นกำลังหลักในการต่อสู้กับความสับสนอย่างแพร่หลายระหว่างสาเหตุและความสัมพันธ์ มันเป็นความเท็จทันที (และใส่ร้ายป้ายสี) เพื่ออ้างว่านักสถิติเป็น "... ไม่เต็มใจที่จะพูดคุยเกี่ยวกับเวรกรรมเลย" ฉันเห็นได้ว่าทำไมคุณรู้สึกหงุดหงิดกับการอ่านเรื่องขี่ม้ายโสแบบนี้

ฉันจะบอกว่ามันเป็นเรื่องธรรมดาที่สมเหตุสมผลสำหรับนักสถิติผู้ใช้แบบจำลองทางสถิติจะมีความเข้าใจที่ไม่ดีเกี่ยวกับความสัมพันธ์ระหว่างการเชื่อมโยงทางสถิติและความเป็นเหตุเป็นผล บางคนมีการฝึกอบรมทางวิทยาศาสตร์ที่ดีจากสาขาอื่น ๆ ซึ่งในกรณีนี้พวกเขาอาจตระหนักถึงปัญหานี้เป็นอย่างดี แต่มีบางคนที่ใช้แบบจำลองทางสถิติที่เข้าใจปัญหาเหล่านี้ไม่ดี นี่เป็นความจริงในหลาย ๆ สาขาวิทยาศาสตร์ประยุกต์ที่ผู้ฝึกปฏิบัติมีการฝึกขั้นพื้นฐานทางสถิติ แต่ไม่ได้เรียนรู้ในระดับลึก ในกรณีเหล่านี้มักจะเป็นนักสถิติมืออาชีพที่เตือนนักวิจัยคนอื่นถึงความแตกต่างระหว่างแนวคิดเหล่านี้และความสัมพันธ์ที่เหมาะสม นักสถิติมักจะเป็นนักออกแบบที่สำคัญของ RCT และการทดลองอื่น ๆ ที่เกี่ยวข้องกับการควบคุมที่ใช้ในการแยกสาเหตุ พวกเขามักจะถูกเรียกให้อธิบายโปรโตคอลเช่นการสุ่มวางยา และโปรโตคอลอื่น ๆ ที่ใช้ในการพยายามตัดความสัมพันธ์กับตัวแปรที่อาจทำให้สับสน มันเป็นความจริงที่บางครั้งนักสถิติควบคุมตัวแปรมากกว่าที่จำเป็นอย่างเคร่งครัด แต่สิ่งนี้ไม่ค่อยนำไปสู่ข้อผิดพลาด (อย่างน้อยก็ในประสบการณ์ของฉัน) ฉันคิดว่านักสถิติส่วนใหญ่ตระหนักถึงความแตกต่างระหว่างตัวแปรที่สับสนและตัวแปรcolliderเมื่อพวกเขาทำการวิเคราะห์การถดถอยด้วยมุมมองของการอนุมานเชิงสาเหตุและแม้ว่าพวกเขาจะไม่ได้สร้างแบบจำลองที่สมบูรณ์แบบเสมอไป

ฉันคิดว่าจูเดียเพิร์ลมีส่วนช่วยอันมีค่ามากในการทำสถิติเกี่ยวกับงานของเขาเกี่ยวกับเรื่องเวรกรรม เขาได้สร้างและตรวจสอบพิธีการที่มีประโยชน์บางอย่างที่ช่วยในการแยกความสัมพันธ์เชิงสาเหตุและงานของเขากลายเป็นแก่นของการศึกษาทางสถิติที่ดี ฉันอ่านหนังสือเวรกรรมของเขาในขณะที่ฉันเป็นนักเรียนที่จบและอยู่บนชั้นของฉันและบนชั้นวางของนักสถิติอื่น ๆ พิธีการส่วนใหญ่สะท้อนสิ่งต่าง ๆ ที่เป็นที่รู้จักโดยสัญชาตญาณของนักสถิติตั้งแต่ก่อนที่พวกเขาจะถูกทำเป็นกรงเข้าสู่ระบบพีชคณิต แต่มันมีค่ามากในทุกกรณีและนอกเหนือไปจากสิ่งที่เห็นได้ชัด (ฉันคิดว่าในอนาคตเราจะเห็นการรวมกันของการดำเนินการ "ทำ" กับพีชคณิตความน่าจะเป็นที่เกิดขึ้นในระดับที่เป็นจริงและในที่สุดมันก็อาจกลายเป็นแกนหลักของทฤษฎีความน่าจะเป็นฉันอยากจะเห็นสิ่งนี้ เพื่อให้คุณเรียนรู้เกี่ยวกับแบบจำลองเชิงสาเหตุและการดำเนินการ "ทำ" เมื่อคุณเรียนรู้เกี่ยวกับการวัดความน่าจะเป็น)

สิ่งสุดท้ายที่ควรคำนึงถึงที่นี่คือมีแอปพลิเคชั่นสถิติจำนวนมากที่เป้าหมายพยากรณ์ได้ซึ่งผู้ประกอบการไม่ได้พยายามหาสาเหตุ แอปพลิเคชันประเภทนี้มีอยู่ทั่วไปอย่างมากในสถิติและในกรณีเช่นนี้มันเป็นสิ่งสำคัญที่จะไม่จำกัด ตัวเองกับความสัมพันธ์เชิงสาเหตุ สิ่งนี้เป็นจริงในการประยุกต์ใช้สถิติส่วนใหญ่ในด้านการเงินการบริหารทรัพยากรบุคคลการสร้างแบบจำลองกำลังคนและสาขาอื่น ๆ หนึ่งไม่ควรประมาทจำนวนบริบทที่ไม่สามารถหรือไม่ควรพยายามควบคุมตัวแปร


UPDATE:ผมสังเกตเห็นว่าคำตอบของฉันไม่เห็นด้วยกับคนที่ให้บริการโดยคาร์ลอ บางทีเราไม่เห็นด้วยกับสิ่งที่ถือเป็น "นักสถิติ / นักเศรษฐศาสตร์ที่มีการฝึกอบรมเป็นประจำ" ทุกคนที่ฉันจะเรียกว่า "นักสถิติ" มักจะมีการศึกษาระดับบัณฑิตศึกษาอย่างน้อยและมักจะมีการฝึกอบรม / ประสบการณ์อย่างมืออาชีพ (ตัวอย่างเช่นในออสเตรเลียข้อกำหนดในการเป็น "นักสถิติที่ได้รับการรับรอง" กับหน่วยงานวิชาชีพของประเทศของเราต้องมีประสบการณ์อย่างน้อยสี่ปีหลังจากสำเร็จการศึกษาระดับปริญญาตรีเกียรตินิยมหรือประสบการณ์หกปีหลังจากสำเร็จการศึกษาระดับปริญญาตรีตามปกติ) การศึกษาสถิติไม่ได้เป็นสถิติ

ฉันสังเกตเห็นว่าในฐานะที่เป็นหลักฐานของการขาดความเข้าใจเกี่ยวกับความเป็นเหตุเป็นผลโดยนักสถิติคาร์ลอสตอบคำถามหลายข้อเกี่ยวกับ CV.SE ซึ่งถามเกี่ยวกับสาเหตุในการถดถอย ในทุกกรณีเหล่านี้คำถามที่ถามโดยคนที่เห็นได้ชัดว่าเป็นสามเณร (ไม่ใช่นักสถิติ) และคำตอบที่คาร์ลอสและคนอื่น ๆ (ซึ่งสะท้อนให้เห็นถึงคำอธิบายที่ถูกต้อง) เป็นคำตอบที่ยกระดับสูง ในหลายกรณีคาร์ลอสได้ให้รายละเอียดเกี่ยวกับสาเหตุและคำตอบของเขานั้นได้รับการโหวตมากที่สุด นี้ก็พิสูจน์ให้เห็นว่าสถิติไม่เข้าใจเหตุและผล

ผู้โพสต์อื่นบางคนชี้ให้เห็นว่าการวิเคราะห์เวรกรรมมักไม่รวมอยู่ในหลักสูตรสถิติ นั่นเป็นความจริงและเป็นความอัปยศที่ยิ่งใหญ่ แต่นักสถิติอาชีพส่วนใหญ่ไม่ได้เป็นบัณฑิตที่ผ่านมาและพวกเขาได้เรียนรู้มากกว่าสิ่งที่รวมอยู่ในโปรแกรมปริญญาโทมาตรฐาน อีกครั้งในแง่นี้ปรากฏว่าฉันมีมุมมองที่สูงขึ้นของระดับเฉลี่ยของความรู้ของนักสถิติกว่าผู้โพสต์อื่น ๆ


12
ฉันไม่ใช่นักสถิติที่มีการฝึกอบรมด้านสถิติอย่างเป็นทางการโดยผู้ที่ไม่ใช่นักสถิติในสาขาเดียวกันและฉันสอนและวิจัยกับนักสถิติที่ไม่ใช่นักสถิติที่ใช้สถิติ ฉันรับรองกับคุณได้ว่าหลักการที่มีความสัมพันธ์ (เช่น) นั้นไม่ได้เป็นสาเหตุและเป็นมนต์ที่เกิดขึ้นซ้ำในสาขาของฉัน อันที่จริงฉันไม่เจอคนที่ไม่สามารถเห็นว่าความสัมพันธ์ระหว่างปริมาณน้ำฝนกับผลผลิตของข้าวสาลีนั้นไม่ใช่สิ่งที่จำเป็นต้องพูดเกี่ยวกับความสัมพันธ์ระหว่างพวกเขากับกระบวนการพื้นฐาน ตามประสบการณ์ของฉันนักสถิติก็ไม่ได้คิดเช่นนี้มานานแล้ว
Nick Cox

8
ในฐานะนักระบาดวิทยาฉันรู้สึกหงุดหงิดมากขึ้นจากมนต์นี้ @NickCox พูดว่านี่คือสิ่งที่แม้แต่นักวิทยาศาสตร์ที่ไม่เข้าใจ ปัญหาที่ฉันมีคือเมื่อทุกคนกระโดดบน bandwagon ของ "ความสัมพันธ์ไม่ได้หมายความว่าเป็นสาเหตุ!" เมื่อใดก็ตามที่มีการเผยแพร่การศึกษาเชิงสังเกตการณ์ (กรณีศึกษาการควบคุมการพูด) จะถูกเผยแพร่ ใช่ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ แต่นักวิจัยมักจะตระหนักถึงสิ่งนั้นและจะทำทุกอย่างเพื่อออกแบบและวิเคราะห์การศึกษาในลักษณะที่การตีความเชิงสาเหตุเป็นไปได้อย่างน้อยก็เป็นไปได้
COOLSerdash

5
@Nick Cox: ฉันได้แก้ไขให้ถูกต้องมากขึ้นว่ามีนักสถิติที่เข้าใจเรื่องนี้เป็นอย่างดี ไม่ใช่ความตั้งใจของฉันที่จะกระจายไปสู่วิชาชีพอื่น ๆ - เพียงเพื่อเน้นว่าปัญหานี้เป็นที่เข้าใจอย่างดีจากนักสถิติ
Ben

7
@NickCox มีหลายสิ่งที่เพิร์ลให้การสนับสนุนเกี่ยวกับเวรกรรมมากกว่า "ความสัมพันธ์ไม่ใช่สิ่งที่เป็นสาเหตุ" ฉันอยู่กับคาร์ลอสที่นี่ มีเพียงพอที่จะเรียนรู้เกี่ยวกับสาเหตุที่ควรจะเป็นหลักสูตรทั้งหมด เท่าที่ฉันรู้แผนกสถิติส่วนใหญ่ไม่ได้เสนอหลักสูตรดังกล่าว
Neil G

12
@Ben: Pearl ไม่ได้กล่าวโทษนักสถิติที่ทำให้เกิดความสับสนและความสัมพันธ์ เขากล่าวโทษพวกเขาโดยส่วนใหญ่มีเหตุผลที่ชัดเจน ฉันเห็นด้วยกับคุณว่าน้ำเสียงของเขาหยิ่ง แต่ฉันคิดว่าเขามีประเด็น
mitchus

11

การถดถอยเชิงเส้นอย่างง่ายเป็นหลักแบบจำลองเชิงสาเหตุ

นี่คือตัวอย่างที่ฉันสร้างขึ้นโดยที่ตัวแบบการถดถอยเชิงเส้นไม่สามารถเป็นสาเหตุได้ สมมติว่าเบื้องต้นว่ายาเสพติดที่ถูกนำมาเวลา 0 ( t = 0 ) และบอกว่ามันไม่มีผลต่ออัตราของโรคหัวใจที่ t = 1 การโจมตีหัวใจที่t = 1ส่งผลกระทบต่อการโจมตีของหัวใจที่t = 2 (เช่นความเสียหายก่อนหน้านี้ทำให้หัวใจไวต่อความเสียหายมากขึ้น) การอยู่รอดที่t = 3ขึ้นอยู่กับว่าผู้คนมีอาการหัวใจวายที่t = 2 - อาการหัวใจวายที่ t = 1 จะมีผลต่อการอยู่รอดที่t = 3 ตามความเป็นจริง แต่เราจะไม่มีลูกศรเพื่อประโยชน์ของ ความง่าย

นี่คือตำนาน:

ตำนาน DAG

นี่คือกราฟสาเหตุที่แท้จริง: collider bias

ลองแกล้งทำเป็นว่าเราไม่ทราบว่าการโจมตีหัวใจที่t = 1เป็นอิสระจากการใช้ยาที่t = 0ดังนั้นเราจึงสร้างรูปแบบการถดถอยเชิงเส้นอย่างง่ายที่จะประเมินผลกระทบของยาเสพติดในหัวใจวายที่t = 0 นี่ทำนายของเราจะเป็นยาเสพติด t = 0และตัวแปรผลของเราจะหัวใจวาย t = 1 ข้อมูลเดียวที่เรามีคือคนที่อยู่รอดที่t = 3ดังนั้นเราจะดำเนินการถดถอยกับข้อมูลนั้น

นี่คือช่วงเวลาที่น่าเชื่อถือ 95% ของเบย์สำหรับค่าสัมประสิทธิ์ของยา t = 0 : ช่วงเวลาที่น่าเชื่อถือ 95%, อคติของคอลไลเดอร์

ความน่าจะเป็นมากที่เราสามารถเห็นได้มากกว่า 0 ดังนั้นดูเหมือนว่าจะมีผลกระทบ! อย่างไรก็ตามเรารู้เบื้องต้นว่ามีเอฟเฟกต์ 0 รายการ คณิตศาสตร์ของสาเหตุที่พัฒนาโดยจูเดียเพิร์ลและคนอื่น ๆ ทำให้ง่ายขึ้นมากที่จะเห็นว่าจะมีอคติในตัวอย่างนี้ (เนื่องจากเงื่อนไขในลูกหลานของ collider) งานของจูเดียหมายถึงว่าในสถานการณ์เช่นนี้เราควรใช้ชุดข้อมูลแบบเต็ม (เช่นอย่ามองคนที่รอดชีวิตมาได้เท่านั้น) ซึ่งจะลบเส้นทางที่ลำเอียง:

ไม่มีอคติ

นี่คือช่วงเวลาที่เชื่อถือได้ 95% เมื่อดูชุดข้อมูลแบบเต็ม (เช่นไม่ จำกัด ผู้ที่รอดชีวิต)

ช่วงเวลาที่น่าเชื่อถือ 95% ไม่มีอคติ.

มีศูนย์กลางอยู่ที่ 0 ซึ่งแสดงว่าไม่มีการเชื่อมโยงเลย

ในตัวอย่างในชีวิตจริงสิ่งต่าง ๆ อาจไม่ง่ายนัก อาจมีตัวแปรอื่น ๆ อีกมากมายที่อาจทำให้เกิดอคติอย่างเป็นระบบ (รบกวนการเลือกอคติ ฯลฯ ) สิ่งที่ต้องปรับในการวิเคราะห์ได้รับการคำนวณโดย Pearl อัลกอริธึมสามารถแนะนำตัวแปรที่ต้องปรับตัวหรือบอกเราเมื่อการปรับไม่เพียงพอที่จะลบอคติอย่างเป็นระบบ ด้วยทฤษฎีทางการที่วางไว้นี้เราไม่จำเป็นต้องใช้เวลามากในการพิจารณาว่าจะปรับตัวอย่างไรและไม่ปรับอะไร เราสามารถสรุปได้อย่างรวดเร็วว่าผลลัพธ์ของเราดีหรือไม่ เราสามารถออกแบบการทดลองของเราได้ดีขึ้นเราสามารถวิเคราะห์ข้อมูลเชิงสังเกตได้ง่ายขึ้น

นี่คือหลักสูตรออนไลน์ที่ให้บริการโดยไม่เสียค่าใช้จ่ายทางออนไลน์ที่ Causal DAG โดย Miguel Hernàn มันมีกรณีศึกษามากมายในชีวิตจริงที่อาจารย์ / นักวิทยาศาสตร์ / นักสถิติได้มาสรุปตรงข้ามเกี่ยวกับคำถามในมือ บางคนอาจดูเหมือนขัดแย้ง อย่างไรก็ตามคุณสามารถแก้พวกเขาผ่านทางแคว้นยูเดียไข่มุกงแยกและลับๆ-เกณฑ์

สำหรับการอ้างอิงรหัสของนี่คือกระบวนการสร้างข้อมูลและรหัสสำหรับช่วงเวลาที่น่าเชื่อถือที่แสดงด้านบน:

import numpy as np
import pandas as pd
import statsmodels as sm
import pymc3 as pm
from sklearn.linear_model import LinearRegression

%matplotlib inline

# notice that taking the drug is independent of heart attack at time 1.
# heart_attack_time_1 doesn't "listen" to take_drug_t_0
take_drug_t_0 = np.random.binomial(n=1, p=0.7, size=10000)
heart_attack_time_1 = np.random.binomial(n=1, p=0.4, size=10000)

proba_heart_attack_time_2 = []

# heart_attack_time_1 increases the probability of heart_attack_time_2. Let's say
# it's because it weakens the heart and makes it more susceptible to further
# injuries
# 
# Yet, take_drug_t_0 decreases the probability of heart attacks happening at
# time 2
for drug_t_0, heart_attack_t_1 in zip(take_drug_t_0, heart_attack_time_1):
    if drug_t_0 == 0 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 1 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 0 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.5)
    elif drug_t_0 == 1 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.05)

heart_attack_time_2 = np.random.binomial(
    n=2, p=proba_heart_attack_time_2, size=10000
)

# people who've had a heart attack at time 2 are more likely to die by time 3

proba_survive_t_3 = []
for heart_attack_t_2 in heart_attack_time_2:
    if heart_attack_t_2 == 0:
        proba_survive_t_3.append(0.95)
    else:
        proba_survive_t_3.append(0.6)

survive_t_3 = np.random.binomial(
    n=1, p=proba_survive_t_3, size=10000
)

df = pd.DataFrame(
    {
        'survive_t_3': survive_t_3,
        'take_drug_t_0': take_drug_t_0,
        'heart_attack_time_1': heart_attack_time_1,
        'heart_attack_time_2': heart_attack_time_2
    }
)

# we only have access to data of the people who survived
survive_t_3_data = df[
    df['survive_t_3'] == 1
]

survive_t_3_X = survive_t_3_data[['take_drug_t_0']]

lr = LinearRegression()
lr.fit(survive_t_3_X, survive_t_3_data['heart_attack_time_1'])
lr.coef_

with pm.Model() as collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * survive_t_3_data['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=survive_t_3_data['heart_attack_time_1']
    )

    collider_bias_normal_trace = pm.sample(2000, tune=1000)

pm.plot_posterior(collider_bias_normal_trace['take_drug_t_0'])

with pm.Model() as no_collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * df['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=df['heart_attack_time_1']
    )

    no_collider_bias_normal_trace = pm.sample(2000, tune=2000)

pm.plot_posterior(no_collider_bias_normal_trace['take_drug_t_0'])

4

เอกสารสองฉบับฉบับที่สองเป็นแบบคลาสสิกที่ช่วย (ฉันคิดว่า) ฉายแสงเพิ่มเติมเกี่ยวกับคะแนนของจูเดียและหัวข้อนี้โดยทั่วไป สิ่งนี้มาจากคนที่เคยใช้ SEM (ซึ่งเป็นสหสัมพันธ์และการถดถอย) ซ้ำแล้วซ้ำอีกและสะท้อนกับคำวิจารณ์ของเขา:

https://www.sciencedirect.com/science/article/pii/S0022103111001466

http://psycnet.apa.org/record/1973-20037-001

โดยพื้นฐานแล้วเอกสารอธิบายว่าทำไมตัวแบบสหสัมพันธ์ (การถดถอย) จึงไม่สามารถนำมาใช้เป็นตัวบ่งชี้ถึงการอนุมานสาเหตุที่แข็งแกร่ง รูปแบบของการเชื่อมโยงใด ๆ สามารถพอดีกับเมทริกซ์ความแปรปรวนร่วมที่กำหนดได้ (เช่นการไม่ระบุทิศทางและหรือความสัมพันธ์ระหว่างตัวแปร) ดังนั้นความต้องการสิ่งต่าง ๆ เช่นการออกแบบการทดลองข้อเสนอ counterfactual ฯลฯ แม้เมื่อมีโครงสร้างชั่วคราวกับข้อมูลที่เกิดขึ้นเมื่อเวลาสมมุติสมมุติสมมุติก่อนที่จะเกิดผลสมมุติ


1

"... เนื่องจากเราสมมติว่าตัวแปรหนึ่งเป็นสาเหตุและอีกปัจจัยหนึ่งคือผลกระทบ (ดังนั้นความสัมพันธ์จึงเป็นวิธีการที่แตกต่างจากแบบจำลองการถดถอย) ... "

การสร้างแบบจำลองการถดถอยอย่างแน่นอนที่สุดไม่ได้ทำให้สมมติฐานนี้

"... และทดสอบว่าความสัมพันธ์เชิงสาเหตุนี้อธิบายรูปแบบที่สังเกตได้หรือไม่"

หากคุณสมมติว่าเป็นเวรกรรมและตรวจสอบความถูกต้องกับข้อสังเกตคุณกำลังทำแบบจำลอง SEM หรือสิ่งที่ Pearl เรียกว่าแบบจำลอง SCM ไม่ว่าคุณต้องการโทรหาส่วนหนึ่งของโดเมนสถิติหรือไม่ก็ตาม แต่ฉันคิดว่าส่วนใหญ่จะไม่เรียกว่าสถิติคลาสสิก

แทนที่จะทิ้งสถิติโดยทั่วไปฉันเชื่อว่า Pearl เป็นเพียงการวิพากษ์วิจารณ์ความลับของนักสถิติเพื่อแก้ไขความหมายเชิงสาเหตุ เขาคิดว่านี่เป็นปัญหาร้ายแรงเพราะสิ่งที่คาร์ลเซแกนเรียกว่าปรากฏการณ์ "เข้าและออก" ซึ่งคุณทิ้งการศึกษาที่ระบุว่า "การบริโภคเนื้อสัตว์ 'เกี่ยวข้องอย่างยิ่ง' กับความใคร่ที่เพิ่มขึ้น, p <.05" แล้วโค้งออกไปรู้ อย่างเต็มรูปแบบผลลัพธ์ทั้งสองจะเชื่อมโยงอย่างมีเหตุผลในใจของประชาชน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.