คำถามติดแท็ก causality

ความสัมพันธ์ระหว่างสาเหตุและผลกระทบ

1
ทฤษฎีใดที่ฉันควรรู้
ฉันควรทราบวิธีการเชิงทฤษฎีเกี่ยวกับเวรกรรมในฐานะนักสถิติประยุกต์ / เศรษฐมิติ ฉันรู้ (เล็กน้อยมาก) Neyman – Rubin โมเดลเชิงสาเหตุ (และRoy , Haavelmoเป็นต้น) ผลงานของ Pearl ในเรื่องเวรกรรม Granger Causality (เน้นการรักษาน้อยกว่า) ฉันควรพลาดแนวคิดใดหรือควรระวัง ที่เกี่ยวข้อง: ทฤษฎีใดบ้างที่เป็นรากฐานสำหรับเวรกรรมในการเรียนรู้ของเครื่อง? ฉันได้อ่านคำถามที่น่าสนใจและคำตอบ ( 1 , 2 , 3 ) แต่ฉันคิดว่าเป็นคำถามที่แตกต่าง และฉันรู้สึกประหลาดใจมากที่จะเห็นว่า "เวรกรรม" ยกตัวอย่างเช่นไม่ได้กล่าวถึงในองค์ประกอบของการเรียนรู้ทางสถิติ

1
การตีความผลลัพธ์ของการทดสอบ Granger Causality
ฉันพยายามที่จะให้ความรู้กับ Granger Causality ฉันได้อ่านโพสต์บนเว็บไซต์นี้และบทความดีๆหลายฉบับทางออนไลน์ ฉันยังเจอเครื่องมือที่มีประโยชน์มากBivariate Granger Causality - เครื่องคำนวณสถิติฟรีที่ให้คุณป้อนอนุกรมเวลาของคุณและคำนวณ Granger Stats ด้านล่างคือผลลัพธ์จากข้อมูลตัวอย่างที่รวมอยู่ในเว็บไซต์ ฉันได้ทำการวิเคราะห์ผลลัพธ์ด้วย คำถามของฉัน: การตีความของฉันถูกต้องในทิศทางหรือไม่? ฉันมองข้ามข้อมูลเชิงลึกที่สำคัญอะไร ความหมายและการตีความของแผนภูมิ CCF คืออะไร (ฉันสมมติว่า CCF เป็นความสัมพันธ์ข้าม) นี่คือผลลัพธ์และแผนการที่ฉันตีความ: Summary of computational transaction Raw Input view raw input (R code) Raw Output view raw output of R engine Computing time 2 seconds R Server 'Herman Ole …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
ทำความเข้าใจกับทฤษฎีการแยก d ในเครือข่าย Bayesian ที่เป็นสาเหตุ
ฉันกำลังพยายามทำความเข้าใจกับตรรกะการแบ่งแยกในเครือข่าย Causal Bayesian ฉันรู้ว่าอัลกอริทึมทำงานอย่างไร แต่ฉันไม่เข้าใจว่าทำไม "การไหลของข้อมูล" ทำงานตามที่ระบุไว้ในอัลกอริทึม ตัวอย่างเช่นในกราฟด้านบนสมมติว่าเราได้รับ X เท่านั้นและไม่พบตัวแปรอื่น จากนั้นตามกฎของการแยก d การไหลของข้อมูลจาก X ถึง D: X อิทธิพลซึ่งเป็นX) ไม่เป็นไรเนื่องจาก A เป็นสาเหตุของ X และหากเราทราบเกี่ยวกับผลกระทบ X สิ่งนี้จะส่งผลต่อความเชื่อของเราเกี่ยวกับสาเหตุ A. ข้อมูลไหลP(A)≠P(A|X)P(A)≠P(A|X)P(A)\neq P(A|X) X มีอิทธิพลต่อ B ซึ่งเป็นX) ไม่เป็นไรเนื่องจากความรู้ของเราเกี่ยวกับ X เปลี่ยนแปลงไป A การเปลี่ยนแปลงที่ A สามารถส่งผลต่อความเชื่อของเราเกี่ยวกับสาเหตุ B เช่นกันP(B)≠P(B|X)P(B)≠P(B|X)P(B)\neq P(B|X) X มีอิทธิพลต่อ C ซึ่งเป็นX) ไม่เป็นไรเพราะเรารู้ว่า B นั้นลำเอียงโดยความรู้ของเราเกี่ยวกับผลกระทบทางอ้อม X …

2
สามารถเขียนสมการตัวแปรเครื่องมือเป็นกราฟ acyclic (DAG) ได้หรือไม่?
Directed acyclic graphs (DAG) เป็นการนำเสนอภาพที่มีประสิทธิภาพของสมมติฐานเชิงสาเหตุเชิงคุณภาพในแบบจำลองทางสถิติ แต่สามารถใช้เพื่อแสดงสมการตัวแปรเครื่องมือแบบปกติ (หรือสมการอื่น ๆ ) ได้หรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร ถ้าไม่ทำไม

1
ความแตกต่างระหว่างค่าเฉลี่ยและผลการรักษาชายขอบ
ฉันอ่านบทความมาแล้วและฉันไม่แน่ใจเกี่ยวกับคำจำกัดความเฉพาะของ Average Treatment Effect (ATE) และ Marginal Treatment Effect (MTE) พวกเขาเหมือนกันหรือไม่ ตามที่ออสติน ... ผลตามเงื่อนไขคือผลกระทบโดยเฉลี่ยที่ระดับตัวแบบในการย้ายตัวแบบจากไม่ถูกรักษาไปสู่การรักษา สัมประสิทธิ์การถดถอยสำหรับตัวแปรตัวบ่งชี้การกำหนดการรักษาจากตัวแบบการถดถอยหลายตัวแปรคือการประมาณของผลตามเงื่อนไขหรือปรับ ในทางตรงกันข้ามผลกระทบส่วนเพิ่มคือผลเฉลี่ยในระดับประชากรในการเคลื่อนย้ายประชากรทั้งหมดจากการไม่ได้รับการรักษาไปยังการรักษา [10]ผลการรักษาเชิงเส้น (ความแตกต่างของค่าเฉลี่ยและความแตกต่างของสัดส่วน) นั้นสามารถยุบได้: ผลการรักษาแบบมีเงื่อนไขและส่วนเพิ่มจะตรงกัน อย่างไรก็ตามเมื่อผลลัพธ์เป็นแบบไบนารีหรือเวลาต่อเหตุการณ์โดยธรรมชาติอัตราส่วนอัตราต่อรองและอัตราส่วนความเป็นอันตรายจะไม่สามารถยุบได้ [11] Rosenbaum ตั้งข้อสังเกตว่าวิธีการให้คะแนนความชอบอนุญาตให้หนึ่งในการประเมินผลกระทบมากกว่าเงื่อนไขเงื่อนไข [12] มีความขัดสนของการวิจัยเกี่ยวกับประสิทธิภาพของวิธีคะแนนความชอบที่แตกต่างกันเพื่อประเมินผลการรักษาชายขอบ แต่ในอีกกระดาษออสตินเขาพูดว่า Yผม( 1 ) - Yผม( 0 )Yผม(1)-Yผม(0)Y_i(1)- Y_i(0)E[ Yผม( 1 ) - Yผม( 0 ) ]E[Yผม(1)-Yผม(0)]E[Y_i(1)- Y_i(0)] ดังนั้นคำถามที่ฉันมีคือ ... อะไรคือความแตกต่างระหว่างผลการรักษาโดยเฉลี่ยกับผลการรักษาเล็กน้อย? เช่นกันฉันจะจำแนกการประมาณค่าของฉันได้อย่างไร ฉันมีคะแนนความชอบ (IPTW) …

1
Confounder - คำจำกัดความ
ตามที่เอ็มแคทซ์ในหนังสือของเขาวิเคราะห์หลายตัวแปร (มาตรา 1.2, หน้า 6), " ปัจจัยรบกวนมีความเกี่ยวข้องกับปัจจัยเสี่ยงที่เกี่ยวข้องและเหตุผลเพื่อผล. " ทำไมต้องปัจจัยรบกวนจะเหตุผลที่เกี่ยวข้องกับผล? มันจะเพียงพอหรือไม่ที่ผู้สับสนจะเชื่อมโยงกับผลลัพธ์?

6
อะไรคือความแตกต่างระหว่างประสิทธิผลและประสิทธิผลในการพิจารณาประโยชน์ของการบำบัดด้วย 'A' โดยมีเงื่อนไข 'B'
บริบทของคำถามนี้อยู่ในกรอบของสุขภาพคือดูที่การรักษาหนึ่งหรือหลายวิธีในการรักษาสภาพ ปรากฏว่าแม้นักวิจัยที่น่านับถือก็ยังสับสนในเรื่องประสิทธิภาพและประสิทธิผลของการใช้คำศัพท์ เราจะนึกถึงประสิทธิภาพและประสิทธิผลในวิธีที่ช่วยขจัดความสับสนได้อย่างไร การออกแบบการศึกษาแบบใดที่เหมาะสมที่สุดในการพิจารณาผลลัพธ์ทั้งสองประเภท มีวารสารสิ่งพิมพ์หนังสือหรือพจนานุกรมทางเว็บใด ๆ ที่อาจช่วยฉันได้หรือไม่

2
ตัวดำเนินการ (x) หมายถึงอะไร
ฉันได้เห็นตัวการทุกหนทุกแห่งในการทบทวนวรรณกรรมที่ฉันทำกับ Causality (ดูตัวอย่างเช่นรายการวิกิพีเดียนี้ ) อย่างไรก็ตามฉันไม่สามารถหาคำจำกัดความที่เป็นทางการและทั่วไปของโอเปอเรเตอร์นี้ได้do ( x )do(x)do(x) ใครสามารถชี้ให้ฉันอ้างอิงที่ดีเกี่ยวกับเรื่องนี้? ฉันสนใจคำจำกัดความทั่วไปมากกว่าการตีความในการทดสอบเฉพาะ

2
เวรกรรมใน microeconometrics เทียบกับเวรกรรมของ granger ในเศรษฐมิติอนุกรมเวลา
ฉันเข้าใจถึงสาเหตุที่ใช้ในเศรษฐศาสตร์จุลภาค (โดยเฉพาะอย่างยิ่ง IV หรือการออกแบบความไม่ต่อเนื่องของการถดถอย) และสาเหตุของ Granger ที่ใช้ในเศรษฐมิติอนุกรมเวลา ฉันจะสัมพันธ์กับอีกวิธีหนึ่งได้อย่างไร ตัวอย่างเช่นฉันได้เห็นวิธีการทั้งสองที่ใช้สำหรับข้อมูลพาเนล (พูดว่า , ) การอ้างอิงถึงเอกสารใด ๆ ในเรื่องนี้จะได้รับการชื่นชมT = 20ยังไม่มีข้อความ= 30N=30N=30T= 20T=20T=20

4
อะไรคือประเด็นของการถดถอยแบบ univariate ก่อนการถดถอยหลายตัวแปร?
ขณะนี้ฉันกำลังทำงานกับปัญหาที่เรามีชุดข้อมูลขนาดเล็กและมีความสนใจในลักษณะพิเศษเวรกรรมของการรักษาผล ที่ปรึกษาของฉันได้สั่งให้ฉันทำการถดถอยแบบไม่มีการเปลี่ยนแปลงบนตัวทำนายแต่ละตัวโดยให้ผลลัพธ์เป็นคำตอบจากนั้นให้การกำหนดการรักษาเป็นการตอบสนอง คือฉันกำลังถูกขอให้พอดีกับการถดถอยกับตัวแปรหนึ่งตัวในแต่ละครั้งและสร้างตารางผลลัพธ์ ฉันถามว่า "ทำไมเราต้องทำสิ่งนี้?" และคำตอบก็คือสิ่งที่เกิดขึ้นจาก "เราสนใจว่าตัวทำนายใดที่เกี่ยวข้องกับการกำหนดการรักษาและผลที่เกิดขึ้น ที่ปรึกษาของฉันเป็นนักสถิติที่ผ่านการฝึกอบรมไม่ใช่นักวิทยาศาสตร์ในสาขาอื่นดังนั้นฉันจึงเชื่อใจพวกเขา สิ่งนี้สมเหตุสมผล แต่ยังไม่ชัดเจนว่าจะใช้ผลลัพธ์ของการวิเคราะห์ที่ไม่แปรปรวนได้อย่างไร จะไม่เลือกตัวเลือกแบบจำลองจากผลลัพธ์นี้ในอคติที่สำคัญของการประมาณการและช่วงความเชื่อมั่นที่แคบลงหรือไม่ ทำไมทุกคนควรทำเช่นนี้? ฉันสับสนและที่ปรึกษาของฉันค่อนข้างทึบแสงในประเด็นเมื่อฉันนำมันมา ใครบ้างมีทรัพยากรเกี่ยวกับเทคนิคนี้ (NB: ที่ปรึกษาของฉันบอกว่าเราไม่ได้ใช้ค่า p เป็นค่าตัด แต่เราต้องการพิจารณา "ทุกอย่าง")

2
เป็นสาเหตุการถดถอยถ้าไม่มีตัวแปรที่ละเว้นหรือไม่?
ถดถอยของบนไม่จำเป็นต้องเป็นสาเหตุถ้ามีจะถูกตัดตัวแปรที่มีอิทธิพลต่อทั้งและy ที่แต่ถ้าไม่ใช่สำหรับตัวแปรที่ละเว้นและข้อผิดพลาดการวัดสาเหตุการถดถอยคืออะไร นั่นคือถ้าทุกตัวแปรที่เป็นไปได้รวมอยู่ในการถดถอย?YyyxxxxxxYyy

4
ขอบของกราฟไซโคลชี้นำเป็นตัวแทนของเวรกรรมหรือไม่?
ฉันกำลังเรียนแบบจำลองความน่าจะเป็นหนังสือสำหรับศึกษาด้วยตนเอง ขอบในกราฟไซเคิลกำกับ (DAG)แสดงถึงความสัมพันธ์เชิงสาเหตุหรือไม่? ถ้าฉันต้องการสร้างเครือข่ายแบบเบย์แต่ฉันไม่แน่ใจเกี่ยวกับทิศทางของลูกศรในนั้น ข้อมูลทั้งหมดจะบอกฉันว่าเป็นความสัมพันธ์ที่สังเกตไม่ใช่การเชื่อมโยงระหว่างกัน ฉันรู้ว่าฉันถามมากเกินไปเนื่องจากฉันแน่ใจว่าการติดตามบทจะช่วยแก้ไขปัญหาเหล่านี้ได้ แต่เป็นเพียงสิ่งที่ฉันไม่สามารถหยุดคิดได้

4
ทำไมการจับคู่คะแนนความชอบมีเหตุผลสำหรับการอนุมานสาเหตุ
การจับคู่คะแนนความชอบใช้สำหรับการหาสาเหตุในการศึกษาเชิงสังเกตการณ์ (ดูที่กระดาษ Rosenbaum / Rubin ) สัญชาตญาณง่าย ๆ ของเบื้องหลังทำไมมันทำงาน อีกนัยหนึ่งทำไมถ้าเราแน่ใจว่าความน่าจะเป็นของการมีส่วนร่วมในการรักษานั้นเท่ากันทั้งสองกลุ่มผลข้างเคียงที่หายไปและเราสามารถใช้ผลลัพธ์เพื่อสรุปข้อสรุปเกี่ยวกับการรักษาได้?

2
unoundoundedness ในรูปแบบสาเหตุของรูบิน - คำอธิบายของคนธรรมดา
เมื่อใช้โมเดลเชิงสาเหตุของรูบินหนึ่งในข้อสมมติฐานที่ไม่สามารถพิสูจน์ได้ที่เราต้องการคือ unoundounded ซึ่งหมายความว่า ( Y( 0 ) , Y( 1 ) ) ⊥ T| X(Y(0),Y(1))⊥T|X(Y(0),Y(1))\perp T|X ในกรณีที่ LHS เป็นสิ่งกีดขวาง T คือการรักษาและ X คือโควาเรียตที่เราควบคุม ฉันสงสัยว่าจะอธิบายเรื่องนี้อย่างไรกับคนที่ไม่ค่อยรู้อะไรเกี่ยวกับแบบจำลองสาเหตุรูบิน ฉันเข้าใจว่าทำไมเราถึงต้องการสมมติฐานนี้ในทางทฤษฎี แต่ฉันไม่แน่ใจเกี่ยวกับแนวคิดว่าทำไมสิ่งนี้ถึงสำคัญ โดยเฉพาะอย่างยิ่งถ้า T คือการรักษาผลที่อาจเกิดขึ้นจะขึ้นอยู่กับมันหรือไม่? เช่นกันถ้าเรามีสุ่มทดลองแล้วโดยอัตโนมัติT ทำไมสิ่งนี้ถึงเป็นจริง?(Y(0),Y(1))⊥T(Y(0),Y(1))⊥T(Y(0),Y(1))\perp T คุณจะอธิบายข้อสมมติฐานที่ไร้เหตุผล / ความเพิกเฉยต่อคนที่ไม่ได้ศึกษา RCM อย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.