คำถามติดแท็ก instrumental-variables

ตัวแปรเครื่องมือ (IV) ใช้สำหรับการอนุมานเชิงสาเหตุด้วยข้อมูลเชิงสังเกตในกรณีที่มี endogeneity เมื่อวิธีการถดถอยมาตรฐานให้ผลการประมาณที่เอนเอียงและไม่สอดคล้องกัน

5
“ endogeneity” และ“ exogeneity” หมายถึงอะไรอย่างมาก?
ฉันเข้าใจว่าคำจำกัดความพื้นฐานของ endogeneity คือ ไม่พอใจ แต่สิ่งนี้มีความหมายอย่างไรในโลกแห่งความจริง? ฉันอ่านบทความ Wikipedia พร้อมตัวอย่างอุปสงค์และอุปทานพยายามทำความเข้าใจ แต่ไม่ได้ช่วยอะไรจริงๆ ฉันเคยได้ยินคำอธิบายอื่น ๆ เกี่ยวกับภายนอกและภายนอกว่าอยู่ในระบบและอยู่นอกระบบและนั่นก็ไม่สมเหตุสมผลสำหรับฉันX′ϵ=0X′ϵ=0 X'\epsilon=0

4
ตัวแปรเครื่องมือคืออะไร?
ตัวแปรเครื่องมือกำลังกลายเป็นเรื่องธรรมดามากขึ้นในเศรษฐศาสตร์ประยุกต์และสถิติ สำหรับผู้เริ่มต้นเราสามารถมีคำตอบที่ไม่ใช่ด้านเทคนิคสำหรับคำถามต่อไปนี้: ตัวแปรเครื่องมือคืออะไร? เมื่อไหร่ที่จะต้องการใช้ตัวแปรเครื่องมือ? เราจะค้นหาหรือเลือกตัวแปรเครื่องมือได้อย่างไร

3
แบบจำลองสองขั้นตอน: ความแตกต่างระหว่างแบบจำลอง Heckman (เพื่อจัดการกับการเลือกตัวอย่าง) และตัวแปรเครื่องมือ (เพื่อจัดการกับ endogenity)
ฉันกำลังพยายามทำให้เข้าใจถึงความแตกต่างระหว่างการเลือกตัวอย่างและ endogeneity และในทางกลับกันว่าแบบจำลองของ Heckman (เพื่อจัดการกับการเลือกตัวอย่าง) แตกต่างจากการถดถอยตัวแปรเครื่องมือ (เพื่อจัดการกับ endogeneity) อย่างไร มันถูกต้องหรือไม่ที่จะบอกว่าการเลือกตัวอย่างเป็นรูปแบบเฉพาะของ endogeneity ซึ่งตัวแปรภายนอกนั้นมีโอกาสที่จะได้รับการรักษา? นอกจากนี้ฉันคิดว่าทั้ง Heckman model และ IV regression เป็น 2-stage model ซึ่งในระยะแรกคาดการณ์ความน่าจะเป็นที่ได้รับการรักษา - ฉันคิดว่าพวกเขาจะต้องแตกต่างกันในแง่ของสิ่งที่พวกเขากำลังประจักษ์วัตถุประสงค์และสมมติฐานของพวกเขา แต่อย่างไร

3
วรรณกรรมเกี่ยวกับการถดถอยแบบควอนไทล์ IV
ในช่วงหลายเดือนที่ผ่านมาฉันได้อ่านอย่างละเอียดเกี่ยวกับการถดถอยเชิงปริมาณเพื่อเตรียมสำหรับวิทยานิพนธ์ปริญญาโทของฉันในฤดูร้อนนี้ โดยเฉพาะฉันได้อ่านหนังสือของ Roger Koenker 2005 ส่วนใหญ่ในหัวข้อ ตอนนี้ฉันต้องการที่จะขยายความรู้ที่มีอยู่นี้เพื่อเทคนิคการถดถอยเชิงปริมาณที่อนุญาตให้ตัวแปรเครื่องมือ (IV) นี่ดูเหมือนจะเป็นงานวิจัยที่กำลังเติบโตอย่างรวดเร็ว อาจมีคนแนะนำให้ฉัน: เอกสารหรือวรรณกรรมอื่น ๆ เกี่ยวกับการถดถอยเชิงปริมาณ IV ภาพรวมสั้น ๆ ของเทคนิคทางสถิติที่แตกต่างกันเหล่านี้ ข้อดีข้อเสียของเทคนิคต่าง ๆ ฉันกำลังมองหาวรรณกรรมเพื่อให้ฉันเริ่มต้นและมีภาพรวมที่ดีของสิ่งที่มีอยู่ ดังนั้นประเด็นแรกคือสิ่งที่สำคัญ ที่สองและสามจะดีที่มี! ความสนใจของฉันยังอยู่ที่วิธีการแบบตัดขวางเป็นหลัก แต่ก็ยินดีต้อนรับวิธีการแบบแผง ขอบคุณล่วงหน้า.

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
2SLS แต่ Probit ขั้นที่สอง
ฉันพยายามใช้การวิเคราะห์ตัวแปรเครื่องมือเพื่ออนุมานสาเหตุของข้อมูลเชิงสังเกต ฉันได้เจอการถดถอยสองขั้นตอนสองขั้น (2SLS) ซึ่งมีแนวโน้มที่จะแก้ไขปัญหา endogeneity ในการวิจัยของฉัน อย่างไรก็ตามฉันอยากจะเป็นด่านแรกที่จะเป็น OLS และด่านที่สองเพื่อเป็นผู้ที่อยู่ภายใน 2SLS จากการอ่านและการค้นหาของฉันฉันได้เห็นนักวิจัยใช้ 2SLS หรือ prost ขั้นตอนแรกและขั้นตอนที่สอง OLS แต่ไม่ใช่รอบอื่น ๆ ซึ่งเป็นสิ่งที่ฉันพยายามบรรลุ ฉันกำลังใช้คำสั่งStata และivregใน Stata สำหรับ 2SLS แบบตรง

2
สามารถเขียนสมการตัวแปรเครื่องมือเป็นกราฟ acyclic (DAG) ได้หรือไม่?
Directed acyclic graphs (DAG) เป็นการนำเสนอภาพที่มีประสิทธิภาพของสมมติฐานเชิงสาเหตุเชิงคุณภาพในแบบจำลองทางสถิติ แต่สามารถใช้เพื่อแสดงสมการตัวแปรเครื่องมือแบบปกติ (หรือสมการอื่น ๆ ) ได้หรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร ถ้าไม่ทำไม

6
อะไรคือความแตกต่างระหว่างประสิทธิผลและประสิทธิผลในการพิจารณาประโยชน์ของการบำบัดด้วย 'A' โดยมีเงื่อนไข 'B'
บริบทของคำถามนี้อยู่ในกรอบของสุขภาพคือดูที่การรักษาหนึ่งหรือหลายวิธีในการรักษาสภาพ ปรากฏว่าแม้นักวิจัยที่น่านับถือก็ยังสับสนในเรื่องประสิทธิภาพและประสิทธิผลของการใช้คำศัพท์ เราจะนึกถึงประสิทธิภาพและประสิทธิผลในวิธีที่ช่วยขจัดความสับสนได้อย่างไร การออกแบบการศึกษาแบบใดที่เหมาะสมที่สุดในการพิจารณาผลลัพธ์ทั้งสองประเภท มีวารสารสิ่งพิมพ์หนังสือหรือพจนานุกรมทางเว็บใด ๆ ที่อาจช่วยฉันได้หรือไม่

1
2SLS นั้นได้รับการจำแนกโดยชอบธรรม
ในเศรษฐมิติที่ไม่เป็นอันตรายส่วนใหญ่: สหายของนักประจักษ์ (Angrist and Pischke, 2009: หน้า 209) ฉันได้อ่านสิ่งต่อไปนี้: ( ... ) ในความเป็นจริง 2SLS เพียงระบุ (พูด, ประมาณการ Wald ง่าย) จะอยู่ที่ประมาณเป็นกลาง นี่เป็นเรื่องยากที่จะแสดงอย่างเป็นทางการเพราะ 2SLS ที่เพิ่งระบุมีช่วงเวลาไม่นาน (เช่นการกระจายตัวตัวอย่างมีหางอ้วน) อย่างไรก็ตามถึงแม้จะมีเครื่องมือที่อ่อนแอ แต่ 2SLS ที่เพิ่งได้รับการระบุก็ยังมีศูนย์กลางอยู่ที่ควร ดังนั้นเราจึงกล่าวว่า 2SLS ที่เพิ่งระบุมีค่ามัธยฐาน ( ... ) แม้ว่าผู้เขียนบอกว่า 2SLS เพียงระบุเป็นค่ามัธยฐาน-เป็นกลางพวกเขาไม่พิสูจน์มันมิได้ให้การอ้างอิงถึงหลักฐาน ที่หน้า 213 พวกเขากล่าวถึงข้อเสนออีกครั้ง แต่ไม่มีการอ้างอิงถึงข้อพิสูจน์ นอกจากนี้ฉันไม่สามารถหาแรงจูงใจสำหรับข้อเสนอในบันทึกการบรรยายของพวกเขาเกี่ยวกับตัวแปรเครื่องมือจาก MIT , หน้า 22 เหตุผลอาจเป็นไปได้ว่าเรื่องที่เป็นเท็จตั้งแต่พวกเขาปฏิเสธมันในข้อความในบล็อกของพวกเขา อย่างไรก็ตาม 2SLS ที่เพิ่งได้รับการระบุนั้นมีค่ามัธยฐานโดยประมาณโดยประมาณพวกเขาเขียน …

1
วิธีการถดถอยตัวแปรเครื่องมือด้วยคำที่ใช้โต้ตอบใน Stata ได้อย่างไร
ฉันมีปัญหาเล็กน้อยกับไวยากรณ์ของ Stata ฉันต้องทำการถดถอยต่อไปนี้: y=ax+bz+c(xz)+ey=ax+bz+c(xz)+ey = ax + bz + c(xz) + e ที่ทั้งและจะ instrumented และระยะปฏิสัมพันธ์ใช้ค่า instrumented ของและZxxxzzzxzxzxzxxxzzz เพียงแค่สร้างค่าที่คาดการณ์สำหรับและและใช้พวกเขาเป็น regressors ทำให้เกิดข้อผิดพลาดมาตรฐานที่ไม่ถูกต้องxxxzzz แก้ไข: ฉันยังต้องทำการถดถอยที่คล้ายกันโดยมีเพียงหนึ่งในตัวแปรที่มีเครื่องมือและมีตัวแปรที่ใช้ในการโต้ตอบนี้

2
Probit กำลังสองน้อยที่สุดสองขั้นตอน (2SLS)
ฉันได้รับการบอกว่าเป็นไปได้ที่จะเรียกใช้การถดถอย IV แบบสองขั้นตอนโดยขั้นตอนแรกเป็น probit และขั้นตอนที่สองคือ OLS เป็นไปได้ไหมที่จะใช้ 2SLS หากระยะแรกเป็น probit แต่ขั้นตอนที่สองเป็นแบบ probit / poisson?

3
เหตุใดจึงใช้ DV ที่ล้าหลังเป็นตัวแปรเครื่องมือ
ฉันได้รับรหัสการวิเคราะห์ข้อมูลที่ไม่ได้เป็นนักเศรษฐศาสตร์ฉันไม่สามารถเข้าใจได้ หนึ่งโมเดลรันการถดถอยตัวแปรเครื่องมือด้วยคำสั่ง Stata ต่อไปนี้ ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) ชุดข้อมูลนี้เป็นพาเนลที่มีการสังเกตแบบหลายลำดับสำหรับตัวแปรชุดนี้ ทำไมรหัสนี้ถึงใช้ค่า lagged ของ DV เป็นเครื่องดนตรี? ตามที่ฉันเข้าใจ (จากการขุดลงในตำราเรียนเก่า) การประมาณค่า IV จะถูกใช้เมื่อมีปัญหาเนื่องจาก regressor มีความสัมพันธ์กับคำที่ผิดพลาด อย่างไรก็ตามไม่มีการกล่าวถึงการเลือกหน่วงเวลาของ DV เป็นเครื่องมือ ความคิดเห็นในบรรทัดของรหัสนี้กล่าวถึง "causality" ความช่วยเหลือในการหาสิ่งที่เป็นเป้าหมายที่นี่จะได้รับการต้อนรับมากที่สุด

1
ตัวแปรเครื่องมือจัดการกับอคติการเลือกอย่างไร
ฉันสงสัยว่าตัวแปรเครื่องมือจัดการอคติการเลือกอย่างไรในการถดถอย นี่คือตัวอย่างที่ฉันกำลังพูดถึง: ในเศรษฐมิติที่ไม่เป็นอันตรายส่วนใหญ่ผู้เขียนอภิปรายเกี่ยวกับการถดถอย IV ที่เกี่ยวข้องกับการรับราชการทหารและรายได้ในภายหลัง คำถามคือ "การรับราชการในกองทัพเพิ่มหรือลดรายได้ในอนาคตหรือไม่" พวกเขาสำรวจคำถามนี้ในบริบทของสงครามเวียดนาม ฉันเข้าใจว่าการรับราชการทหารไม่สามารถสุ่มมอบหมายได้และนี่เป็นปัญหาสำหรับการอนุมานเชิงสาเหตุ ในการแก้ไขปัญหานี้ผู้วิจัยใช้ร่างเกณฑ์ (เช่นใน "หมายเลขร่างของคุณเรียกว่า") เป็นเครื่องมือสำหรับการรับราชการทหารที่แท้จริง ที่ทำให้ความรู้สึก: ร่างเวียดนามสุ่มมอบหมายคนอเมริกันหนุ่มทหาร (ในทางทฤษฎี - ไม่ว่านาวิกเสิร์ฟจริงสัมผัสกับคำถามของฉัน) เงื่อนไข IV อื่น ๆ ของเราดูแข็งแกร่ง: การมีสิทธิ์เข้าร่วมร่างและการเกณฑ์ทหารที่แท้จริงนั้นมีความสัมพันธ์กันในทางบวก นี่คือคำถามของฉัน ดูเหมือนว่าคุณจะได้รับอคติในการเลือกตนเอง: บางทีเด็ก ๆ ที่ร่ำรวยขึ้นอาจออกจากการรับใช้ในเวียดนามแม้ว่าจะมีการเรียกหมายเลขร่าง (ถ้าไม่ใช่อย่างนั้นจริง ๆ ลองทำเพื่อคำถามของฉัน) หากการเลือกตนเองนี้สร้างอคติเชิงระบบภายในตัวอย่างของเราตัวแปรเครื่องมือของเราจะจัดการอคตินี้อย่างไร เราต้อง จำกัด ขอบเขตการอนุมานของเราให้แคบลงหรือไม่ "ประเภทของคนที่ไม่สามารถหลบหนีจากร่างได้" หรือ IV ก็กอบกู้บางส่วนของการอนุมานของเรา? หากใครสามารถอธิบายวิธีการทำงานนี้ฉันจะขอบคุณมาก

2
ทิศทางของความเป็นเหตุเป็นผลระหว่างตราสารกับตัวแปรต่างกันหรือไม่?
รูปแบบมาตรฐานของตัวแปรเครื่องมือในแง่ของ causality ( ->) คือ: Z -> X -> Y โดยที่ Z เป็นเครื่องมือ, X คือตัวแปรภายนอกและการตอบสนอง Y เป็นไปได้ไหมว่ามีความสัมพันธ์ต่อไปนี้: Z <- X ->Y Z <-> X ->Y ถูกต้องหรือไม่ ในขณะที่ความสัมพันธ์ระหว่างเครื่องมือและตัวแปรเป็นที่พอใจฉันจะคิดถึงการ จำกัด การยกเว้นในกรณีเช่นนี้ได้อย่างไร หมายเหตุ: สัญลักษณ์<->ไม่ชัดเจนและอาจนำไปสู่ความเข้าใจที่แตกต่างกันของปัญหา แต่ถึงกระนั้นคำตอบก็เน้นที่ปัญหานี้และใช้เพื่อแสดงประเด็นสำคัญของปัญหา เมื่ออ่านโปรดดำเนินการด้วยความระมัดระวังเกี่ยวกับส่วนนี้ของคำถาม

1
วิธีการตีความสัมประสิทธิ์ระยะที่สองในการถดถอยตัวแปรเครื่องมือด้วยเครื่องมือไบนารีและตัวแปรภายนอกไบนารี?
(โพสต์ค่อนข้างยาวขออภัยมีข้อมูลพื้นหลังมากมายดังนั้นโปรดข้ามไปที่คำถามด้านล่าง) Intro:ฉันกำลังทำงานในโครงการที่เรากำลังพยายามที่จะระบุผลกระทบของตัวแปรภายนอกไบนารีบนผลอย่างต่อเนื่องปีเราได้สร้างเครื่องมือขึ้นมาซึ่งเราเชื่อมั่นอย่างยิ่งว่าจะได้รับการมอบหมายแบบสุ่มx1x1x_1YyyZ1z1z_1 ข้อมูล:ข้อมูลอยู่ในโครงสร้างแผงซึ่งมีการสังเกตการณ์ประมาณ 34,000 ครั้งกระจายไปทั่ว 1,000 หน่วยและประมาณ 56 ช่วงเวลา ใช้ค่า 1 สำหรับการสังเกตประมาณ 700 (2%) และทำประมาณ 3000 (9%) 111 (0.33%) สังเกตคะแนน 1 ทั้งและและมันก็เป็นสองเท่าแนวโน้มสำหรับข้อสังเกตที่จะทำคะแนน 1ถ้ามันยังคะแนน 1 z_1x1x1x_1Z1z1z_1Z1z1z_1x1x1x_1x1x1x_1Z1z1z_1 การประมาณ:เราประเมินโมเดล 2SLS ต่อไปนี้ผ่านขั้นตอน ivreg2 ของ Stata: x1=π0+π1Z1+ Z π+ vx1=π0+π1z1+Zπ+vx_1 = \pi_0 + \pi_1z_1 + \mathbf{Z}\mathbf{\pi} + v Y=β0+β1x* * * *1+ Z β+ uy=β0+β1x1∗+Zβ+uy …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.