คำถามติดแท็ก causality

ความสัมพันธ์ระหว่างสาเหตุและผลกระทบ

5
“ การควบคุมตัวแปรอื่น ๆ ” ได้อย่างไร?
นี่คือบทความที่กระตุ้นคำถามนี้: ความกระวนกระวายทำให้เราอ้วนหรือไม่? ฉันชอบบทความนี้และแสดงให้เห็นอย่างชัดเจนถึงแนวคิดของ "การควบคุมตัวแปรอื่น ๆ " (IQ, อาชีพ, รายได้, อายุ, ฯลฯ ) เพื่อแยกความสัมพันธ์ที่แท้จริงระหว่างตัวแปร 2 ตัวที่มีปัญหา คุณช่วยอธิบายให้ฉันฟังว่าคุณควบคุมตัวแปรในชุดข้อมูลทั่วไปได้อย่างไร? เช่นหากคุณมี 2 คนที่มีระดับความอดทนและ BMI เหมือนกัน แต่มีรายได้ต่างกันคุณจะจัดการกับข้อมูลเหล่านี้อย่างไร คุณแบ่งกลุ่มพวกเขาออกเป็นกลุ่มย่อยต่าง ๆ ที่มีรายได้ความอดทนและค่าดัชนีมวลกายใกล้เคียงกันหรือไม่? แต่ท้ายที่สุดก็มีตัวแปรหลายสิบตัวที่จะควบคุม (IQ, อาชีพ, รายได้, อายุ, ฯลฯ ) จากนั้นคุณจะรวมกลุ่มย่อย 100 กลุ่มเหล่านี้ได้อย่างไร ในความเป็นจริงฉันมีความรู้สึกว่าวิธีนี้กำลังเห่าต้นไม้ที่ไม่ถูกต้องตอนนี้ที่ฉันพูดด้วยวาจาแล้ว ขอบคุณที่ส่องแสงบางอย่างที่ฉันตั้งใจจะทำตอนนี้สองสามปีที่ผ่านมา ... !

8
สาเหตุบ่งบอกถึงความสัมพันธ์หรือไม่?
ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุเนื่องจากอาจมีคำอธิบายมากมายสำหรับสหสัมพันธ์ แต่สาเหตุแสดงถึงความสัมพันธ์หรือไม่? โดยสังหรณ์ใจฉันจะคิดว่าการปรากฏตัวของสาเหตุหมายถึงมีความสัมพันธ์จำเป็น แต่สัญชาตญาณของฉันไม่ได้ให้บริการฉันอย่างดีในสถิติ สาเหตุบ่งบอกถึงความสัมพันธ์หรือไม่?

16
ภายใต้เงื่อนไขใดที่ความสัมพันธ์บ่งบอกถึงสาเหตุ?
เราทุกคนรู้ว่ามนต์ "ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ" ซึ่งตีกลองในนักเรียนสถิติปีแรกทั้งหมด มีตัวอย่างที่ดีที่นี่เพื่อแสดงความคิด แต่บางครั้งความสัมพันธ์ก็บอกเป็นนัยถึงสาเหตุ ตัวอย่างต่อไปนี้มาจากหน้า Wikipedia นี้ ตัวอย่างเช่นเราสามารถทำการทดสอบในฝาแฝดที่เหมือนกันซึ่งเป็นที่ทราบกันว่าได้คะแนนที่เท่ากันในการทดสอบ คู่หนึ่งถูกส่งไปเรียนหกชั่วโมงขณะที่อีกคู่ถูกส่งไปที่สวนสนุก หากคะแนนการทดสอบของพวกเขาแตกต่างกันไปในระดับใหญ่สิ่งนี้จะเป็นหลักฐานที่ชัดเจนว่าการศึกษา (หรือไปที่สวนสนุก) มีผลต่อคะแนนการทดสอบ ในกรณีนี้ความสัมพันธ์ระหว่างการเรียนและคะแนนการทดสอบจะบอกเป็นนัยถึงสาเหตุ มีสถานการณ์อื่นที่ความสัมพันธ์หมายถึงสาเหตุหรือไม่

7
The Book of Why โดย Judea Pearl: ทำไมเขาถึงทุบสถิติ
ฉันอ่านหนังสือทำไมจากแคว้นยูเดียเพิร์ลและมันจะได้รับภายใต้ผิวของฉัน1 โดยเฉพาะสำหรับฉันมันดูเหมือนว่าเขาจะทุบสถิติ "คลาสสิก" อย่างไร้เงื่อนไขโดยการใส่อาร์กิวเมนต์ของมนุษย์ฟางที่สถิติไม่เคยสามารถตรวจสอบความสัมพันธ์เชิงสาเหตุที่ไม่เคยสนใจความสัมพันธ์เชิงสาเหตุและสถิตินั้น "กลายเป็นแบบจำลอง - ลดข้อมูลองค์กร " สถิติกลายเป็นคำน่าเกลียดในหนังสือของเขา ตัวอย่างเช่น: นักสถิติสับสนอย่างมากเกี่ยวกับตัวแปรที่ควรและไม่ควรควบคุมดังนั้นการฝึกหัดเริ่มต้นคือการควบคุมทุกสิ่งที่เราสามารถวัดได้ [... ] มันเป็นวิธีที่สะดวกและง่ายในการติดตาม แต่มันทั้งสิ้นเปลืองและขี่ไปด้วยความผิดพลาด ความสำเร็จที่สำคัญของการปฏิวัติเชิงสาเหตุได้ทำให้ความสับสนนี้สิ้นสุดลง ในขณะเดียวกันนักสถิติก็ประเมินการควบคุมในแง่ที่ว่าพวกเขาไม่เต็มใจที่จะพูดคุยเกี่ยวกับความเป็นเหตุเป็นผล [... ] อย่างไรก็ตามแบบจำลองเชิงสาเหตุมีสถิติเช่นนี้ตลอดไป ฉันหมายถึงแบบจำลองการถดถอยสามารถนำมาใช้เป็นแบบจำลองเชิงสาเหตุได้เนื่องจากเราสมมติว่าตัวแปรหนึ่งเป็นสาเหตุและอีกอย่างคือผลกระทบ . อ้างอีก: ไม่น่าแปลกใจที่นักสถิติพบว่าปริศนานี้ [ปัญหา Monty Hall] ยากที่จะเข้าใจ พวกเขาเคยชินกับการที่ RA Fisher (1922) กล่าวว่า "การลดลงของข้อมูล" และไม่สนใจกระบวนการสร้างข้อมูล สิ่งนี้ทำให้ฉันนึกถึงคำตอบที่แอนดรูว์เจลแมนเขียนถึงการ์ตูน xkcd ที่มีชื่อเสียงใน Bayesians และผู้ที่พบบ่อย: "ถึงกระนั้นฉันคิดว่าการ์ตูนโดยรวมนั้นไม่ยุติธรรมในการเปรียบเทียบ Bayesian ที่สมเหตุสมผลกับสถิติ ." จำนวนการบิดเบือนความจริงของคำที่ฉันเห็นมันมีอยู่ในหนังสือจูเดียเพิร์ลทำให้ฉันสงสัยว่าการอนุมานเชิงสาเหตุ (ซึ่งฉันเห็นว่าเป็นวิธีที่มีประโยชน์และน่าสนใจในการจัดระเบียบและการทดสอบสมมติฐานทางวิทยาศาสตร์2 ) คำถาม:คุณคิดว่าจูเดียเพิร์ลเป็นสถิติที่บิดเบือนความจริงและถ้าใช่ทำไม? เพียงเพื่อให้การอนุมานเชิงสาเหตุมีขนาดใหญ่กว่าที่เป็นอยู่? คุณคิดว่าการอนุมานเชิงสาเหตุเป็นการปฏิวัติที่มี …
79 causality 

6
ไม่มีความสัมพันธ์กันไม่ได้หมายความว่าไม่มีเวรกรรม?
ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผล แต่การขาดความสัมพันธ์นั้นหมายถึงการขาดความเป็นเหตุเป็นผล?


3
สถิติและการอนุมานสาเหตุ?
ใน 1,984 กระดาษของเขา"สถิติและการอนุมานสาเหตุ" Paul Holland ยกหนึ่งในคำถามพื้นฐานที่สุดในสถิติ: แบบจำลองทางสถิติสามารถพูดเกี่ยวกับสาเหตุได้อย่างไร สิ่งนี้นำไปสู่คำขวัญของเขา: ไม่มีการแย้งโดยไม่มีการจัดการ ซึ่งเน้นความสำคัญของข้อ จำกัด เกี่ยวกับการทดลองที่พิจารณาถึงสาเหตุ Andrew Gelman ทำให้ประเด็นที่คล้ายกัน : "เพื่อค้นหาว่าเกิดอะไรขึ้นเมื่อคุณเปลี่ยนแปลงบางสิ่งจำเป็นต้องเปลี่ยนมัน" ... มีบางสิ่งที่คุณเรียนรู้จากการรบกวนระบบที่คุณจะไม่พบจากการสังเกตเชิงรับจำนวนมาก ความคิดของเขาได้สรุปไว้ในบทความนี้ ข้อควรพิจารณาอะไรควรทำเมื่อทำการอนุมานเชิงสาเหตุจากแบบจำลองทางสถิติ
51 causality 

5
“ endogeneity” และ“ exogeneity” หมายถึงอะไรอย่างมาก?
ฉันเข้าใจว่าคำจำกัดความพื้นฐานของ endogeneity คือ ไม่พอใจ แต่สิ่งนี้มีความหมายอย่างไรในโลกแห่งความจริง? ฉันอ่านบทความ Wikipedia พร้อมตัวอย่างอุปสงค์และอุปทานพยายามทำความเข้าใจ แต่ไม่ได้ช่วยอะไรจริงๆ ฉันเคยได้ยินคำอธิบายอื่น ๆ เกี่ยวกับภายนอกและภายนอกว่าอยู่ในระบบและอยู่นอกระบบและนั่นก็ไม่สมเหตุสมผลสำหรับฉันX′ϵ=0X′ϵ=0 X'\epsilon=0

9
ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ แต่สิ่งที่เกี่ยวกับเมื่อหนึ่งในตัวแปรเป็นเวลาหรือไม่
ฉันรู้ว่าคำถามนี้ถูกถามเป็นพันล้านครั้งดังนั้นหลังจากดูออนไลน์ฉันเชื่อมั่นอย่างเต็มที่ว่าความสัมพันธ์ระหว่าง 2 ตัวแปรไม่ได้บ่งบอกถึงสาเหตุ ในหนึ่งในการบรรยายสถิติของฉันในวันนี้เรามีการบรรยายแบบแขกรับเชิญจากนักฟิสิกส์เกี่ยวกับความสำคัญของวิธีการทางสถิติในฟิสิกส์ เขากล่าวว่าคำสั่งที่น่าประหลาดใจ: สหสัมพันธ์ไม่ได้บอกถึงสาเหตุ แต่อย่างใดอย่างหนึ่งของตัวแปรคือเวลา ดังนั้นหากมีความสัมพันธ์ที่ดีระหว่างตัวแปรอิสระและเวลาบางอย่างนี่ก็แสดงถึงสาเหตุเช่นกัน ฉันไม่เคยได้ยินคำแถลงนี้มาก่อน นักฟิสิกส์ / นักสัมพัทธภาพเห็น "สาเหตุ" ต่างจากสถิติของคนหรือไม่?

5
คะแนนความชอบต่างจากการเพิ่ม covariates ในการถดถอยอย่างไรและเมื่อใดที่พวกเขาต้องการคะแนนหลัง
ฉันยอมรับว่าฉันค่อนข้างใหม่กับคะแนนความชอบและการวิเคราะห์เชิงสาเหตุ สิ่งหนึ่งที่ไม่ชัดเจนสำหรับฉันในฐานะผู้มาใหม่คือ "การปรับสมดุล" โดยใช้คะแนนความชอบมีความแตกต่างทางคณิตศาสตร์จากสิ่งที่เกิดขึ้นเมื่อเราเพิ่ม covariates ลงในการถดถอย มีอะไรแตกต่างกันเกี่ยวกับการผ่าตัดและทำไมมันถึงดีกว่าการเพิ่มประชากรย่อยในการถดถอย ฉันเคยเห็นการศึกษาบางอย่างที่ทำการเปรียบเทียบเชิงประจักษ์ของวิธีการ แต่ฉันไม่เคยเห็นการสนทนาที่ดีเกี่ยวกับคุณสมบัติทางคณิตศาสตร์ของทั้งสองวิธีและทำไม PSM ให้ยืมตัวเองไปสู่การตีความเชิงสาเหตุ ดูเหมือนจะมีความสับสนและการโต้เถียงกันมากมายในสาขานี้ซึ่งทำให้สิ่งต่าง ๆ ยากขึ้น ความคิดใด ๆ เกี่ยวกับสิ่งนี้หรือตัวชี้ไปยังแหล่งข้อมูลที่ดี / กระดาษเพื่อทำความเข้าใจความแตกต่าง? (ฉันค่อย ๆ เดินผ่านหนังสือเวรกรรมของจูเดียเพิร์ลดังนั้นไม่จำเป็นต้องชี้ให้ฉันเห็น)

3
ความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุหรือไม่?
ตัวแปรสุ่มสองตัวคือ A และ B มีความเป็นอิสระทางสถิติ นั่นหมายความว่าใน DAG ของกระบวนการ:และแน่นอน(A) แต่นั่นก็หมายความว่าไม่มีประตูหน้าจาก B ถึง A?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) เพราะเราก็ควรจะได้รับ(A) ดังนั้นหากเป็นเช่นนั้นความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุโดยอัตโนมัติหรือไม่?P(A|do(B))=P(A)P(A|do(B))=P(A)P(A|do(B))=P(A)

7
สามารถใช้การตรวจสอบความถูกต้องไขว้สำหรับการอนุมานเชิงสาเหตุได้หรือไม่?
ในบริบททั้งหมดฉันคุ้นเคยกับการตรวจสอบข้ามมันถูกใช้เพียงกับเป้าหมายของการเพิ่มความแม่นยำในการทำนาย สามารถขยายตรรกะของการตรวจสอบข้ามในการประมาณความสัมพันธ์ที่ไม่เอนเอียงระหว่างตัวแปรได้หรือไม่? ในขณะที่บทความนี้ของ Richard Berk แสดงให้เห็นถึงการใช้ตัวอย่างที่ระงับไว้สำหรับการเลือกพารามิเตอร์ในรูปแบบการถดถอย "ขั้นสุดท้าย" (และแสดงให้เห็นว่าทำไมการเลือกพารามิเตอร์ขั้นตอนที่ชาญฉลาดไม่ใช่ความคิดที่ดี) การประเมินเอฟเฟ็กต์ที่เป็นกลางโดยไม่ลำเอียงมีต่อ Y มากกว่าการเลือกแบบจำลองตามตรรกะและความรู้เดิมของเรื่อง ฉันขอให้ผู้คนยกตัวอย่างที่คนหนึ่งใช้ตัวอย่างที่ระงับไว้เพื่อช่วยในการอนุมานเชิงสาเหตุหรือบทความทั่วไปที่อาจช่วยฉันเข้าใจ ฉันไม่สงสัยเลยว่าความคิดของฉันเกี่ยวกับการตรวจสอบไขว้นั้นไร้เดียงสาและดังนั้นถ้าพูดเช่นนั้น ดูเหมือนว่าการใช้ตัวอย่างที่ระงับไว้จะเป็นการคล้อยตามการอนุมานเชิงสาเหตุ แต่ฉันไม่ทราบว่ามีงานใดที่ทำสิ่งนี้หรือวิธีที่พวกเขาจะทำสิ่งนี้ การอ้างอิงสำหรับ Berk Paper: การอนุมานทางสถิติหลังจากการเลือกแบบจำลอง โดย: Richard Berk, Lawrence Brown, Linda Zhao วารสารอาชญาวิทยาเชิงปริมาณ, Vol 26, ลำดับที่ 2 (1 มิถุนายน 2010), หน้า 217-236 รุ่น PDF ที่นี่ นี้คำถามเกี่ยวกับการวิเคราะห์ข้อมูลในการศึกษาสำรวจกลุ่มตัวอย่างขนาดเล็กโดย CHL รับแจ้งคำถามนี้

8
ความแตกต่างระหว่างการทำนายและการอนุมานคืออะไร?
ฉันกำลังอ่านคำว่า " ความรู้เบื้องต้นเกี่ยวกับสถิติ " ในบทที่ 2 พวกเขาหารือเกี่ยวกับเหตุผลสำหรับการประเมินการทำงานฉfff 2.1.1 ทำไมประมาณการ ?fff มีสองเหตุผลหลักที่เราอาจต้องการที่จะประเมินเป็นF : การคาดการณ์และการอนุมาน เราคุยกันในทางกลับกัน ฉันอ่านมันมาสองสามครั้งแล้ว แต่ฉันก็ยังไม่ชัดเจนเกี่ยวกับความแตกต่างระหว่างการทำนายและการอนุมาน มีคนให้ตัวอย่างที่แตกต่าง (จริง) หรือไม่?

4
X และ Y ไม่มีความสัมพันธ์ แต่ X เป็นตัวทำนายที่สำคัญของ Y ในการถดถอยหลายครั้ง มันหมายความว่าอะไร?
X และ Y ไม่มีความสัมพันธ์ (-.01); อย่างไรก็ตามเมื่อฉันวาง X ลงในการพยากรณ์การถดถอยหลายครั้งพร้อมกับตัวแปร (A, B, C) อื่น (ที่เกี่ยวข้อง) ตัวแปรสามตัว, X และตัวแปรอื่นอีกสองตัว (A, B) เป็นตัวทำนายที่สำคัญของ Y โปรดทราบว่าอีกสอง ( ตัวแปร A, B) มีความสัมพันธ์อย่างมีนัยสำคัญกับ Y นอกการถดถอย ฉันควรตีความข้อค้นพบเหล่านี้อย่างไร X ทำนายความแปรปรวนที่ไม่ซ้ำกันใน Y แต่เนื่องจากสิ่งเหล่านี้ไม่มีความสัมพันธ์ (Pearson) จึงยากที่จะตีความ ฉันรู้กรณีตรงกันข้าม (เช่นตัวแปรสองตัวมีความสัมพันธ์กัน แต่การถดถอยไม่สำคัญ) และค่อนข้างง่ายกว่าที่จะเข้าใจจากมุมมองเชิงทฤษฎีและสถิติ โปรดทราบว่าตัวพยากรณ์บางตัวมีความสัมพันธ์กันค่อนข้างมาก (เช่น. 70) แต่ไม่ใช่ในระดับที่ฉันคาดหวังว่าจะมีความหลากหลายทางชีวภาพที่สำคัญ บางทีฉันอาจเข้าใจผิด หมายเหตุ: ฉันถามคำถามนี้ก่อนหน้านี้และมันถูกปิด เหตุผลก็คือคำถามนี้ซ้ำซ้อนกับคำถามที่ว่า " การถดถอยจะมีความสำคัญได้อย่างไรบางทีฉันไม่เข้าใจคำถามอื่น แต่ฉันเชื่อว่าคำถามเหล่านี้เป็นคำถามที่แยกจากกันทั้งในเชิงคณิตศาสตร์และเชิงทฤษฎีคำถามของฉันไม่ขึ้นอยู่กับว่า …

3
เครือข่ายนิวรัลโมเดลแบบกราฟิกเครือข่ายแบบเบย์คืออะไรความสัมพันธ์ระหว่างแบบลำดับชั้น
พวกเขาทั้งหมดดูเหมือนจะเป็นตัวแทนของตัวแปรสุ่มโดยโหนดและ (ใน) การพึ่งพาผ่านขอบ (อาจกำกับ) ฉันสนใจในมุมมองแบบเบย์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.