วรรณกรรมเกี่ยวกับการถดถอยแบบควอนไทล์ IV


16

ในช่วงหลายเดือนที่ผ่านมาฉันได้อ่านอย่างละเอียดเกี่ยวกับการถดถอยเชิงปริมาณเพื่อเตรียมสำหรับวิทยานิพนธ์ปริญญาโทของฉันในฤดูร้อนนี้ โดยเฉพาะฉันได้อ่านหนังสือของ Roger Koenker 2005 ส่วนใหญ่ในหัวข้อ ตอนนี้ฉันต้องการที่จะขยายความรู้ที่มีอยู่นี้เพื่อเทคนิคการถดถอยเชิงปริมาณที่อนุญาตให้ตัวแปรเครื่องมือ (IV) นี่ดูเหมือนจะเป็นงานวิจัยที่กำลังเติบโตอย่างรวดเร็ว

อาจมีคนแนะนำให้ฉัน:

  • เอกสารหรือวรรณกรรมอื่น ๆ เกี่ยวกับการถดถอยเชิงปริมาณ IV
  • ภาพรวมสั้น ๆ ของเทคนิคทางสถิติที่แตกต่างกันเหล่านี้
  • ข้อดีข้อเสียของเทคนิคต่าง ๆ

ฉันกำลังมองหาวรรณกรรมเพื่อให้ฉันเริ่มต้นและมีภาพรวมที่ดีของสิ่งที่มีอยู่ ดังนั้นประเด็นแรกคือสิ่งที่สำคัญ ที่สองและสามจะดีที่มี! ความสนใจของฉันยังอยู่ที่วิธีการแบบตัดขวางเป็นหลัก แต่ก็ยินดีต้อนรับวิธีการแบบแผง

ขอบคุณล่วงหน้า.

คำตอบ:


12

ฉันจะไปเที่ยวที่ ดูเอกสาร 7 Chernozhukov และ Hansen IVQR กระดาษ 2005 มักถูกอ้างถึง พวกเขายังให้ลิงค์ไปยังข้อมูลและรหัสใน MATLAB, OX และ Stata

อีกกระดาษอ้างถึงบ่อยในวรรณคดีนี้อยู่Abadie, Angrist และ Imbens (2002)

Frolich and Melly (2010)และKwak (2010)ก็คุ้มค่าที่จะเช็คเอาท์โดยเฉพาะถ้าคุณใช้ Stata ทั้งสองให้รหัส


24

แม้ว่าคำถามนี้มีคำตอบที่ยอมรับแล้ว แต่ฉันคิดว่าฉันยังสามารถมีส่วนร่วมได้ หนังสือ Koenker (2005) จะไม่ทำให้คุณไปได้ไกลนักเนื่องจากพัฒนาการของการถดถอยแบบควอไทล์ IV เริ่มที่จะรับช่วงเวลานั้น

เทคนิคการถดถอยในช่วงต้น IV quantile รวมถึงกรอบโซ่สาเหตุโดยChesher (2003)ซึ่งได้รับการพัฒนาต่อไปในการเบี่ยงเบนเฉลี่ยถ่วงน้ำหนักวิธี (WAD) โดยMa และ Koenker (2006) ในบทความนี้พวกเขายังแนะนำวิธีการควบคุมการเปลี่ยนแปลง ความคิดที่คล้ายกันถูกใช้โดยLee (2007)ซึ่งได้รับตัวประมาณการถดถอยแบบควอนไทด์ IV โดยใช้ฟังก์ชั่นการควบคุม
ตัวประมาณเหล่านี้ทั้งหมดใช้ประโยชน์จากโครงสร้างข้อผิดพลาดสามเหลี่ยมที่จำเป็นสำหรับการระบุตัวตน ปัญหานี้คือว่าโครงสร้างสามเหลี่ยมนี้ไม่น่าเชื่อสำหรับปัญหา endogeneity ที่เกิดขึ้นเนื่องจากความพร้อมกัน ตัวอย่างเช่นคุณไม่สามารถใช้ตัวประมาณเหล่านี้สำหรับปัญหาการประมาณอุปสงค์และอุปทาน

ตัวประมาณโดย Abadie, Angrist และ Imbens (2002), ที่ Dimitriy V. Masterov กล่าวถึงสมมติว่าคุณมีทั้งตัวแปรภายนอกไบนารีและเครื่องมือไบนารี โดยทั่วไปนี่เป็นกรอบที่เข้มงวดมาก แต่มันขยายแนวทาง LATE จากการถดถอยเชิงเส้น IV ไปเป็นการถดถอยเชิงปริมาณ นี่เป็นเรื่องดีเพราะนักวิจัยหลายคนโดยเฉพาะอย่างยิ่งในด้านเศรษฐศาสตร์คุ้นเคยกับแนวคิดของ LATE และการตีความค่าสัมประสิทธิ์ที่เกิดขึ้น

กระดาษน้ำเชื้อของ Chernozhukov และ Hansen (2005) เริ่มต้นอย่างจริงจังในวรรณคดีนี้และคนสองคนนี้ได้ทำงานมากมายในพื้นที่นี้ ตัวประมาณการถดถอยแบบควอนไทด์ IV (IVQR) ให้การเชื่อมโยงแบบธรรมชาติกับตัวประมาณค่าแบบ 2SLS ในบริบทแบบควอไทล์ เครื่องมือประมาณของพวกเขาถูกใช้งานผ่าน Matlab หรือ Ox เนื่องจาก Dimitriy ชี้ให้เห็น แต่คุณสามารถลืมกระดาษ Kwak (2010) ได้ กระดาษนี้ไม่เคยทำมันเพื่อวารสาร Stata และรหัสของเขาไม่ทำงานอย่างถูกต้อง ฉันคิดว่าเขาละทิ้งโครงการนี้
แต่คุณควรพิจารณาประมาณการสมเรียบประมาณ IVQR (SEE-IVQR) Kaplan และ Sun (2012)โดย นี่คือตัวประมาณล่าสุดซึ่งเป็นการปรับปรุงตัวประมาณ IVQR ดั้งเดิมในแง่ของความเร็วในการคำนวณ (มันหลีกเลี่ยงอัลกอริทึมการค้นหากริดแบบภาระหนัก) และค่าคลาดเคลื่อนกำลังสองเฉลี่ย มีรหัส Matlabที่นี่

กระดาษโดยFrölichและ Melly (2010) เป็นสิ่งที่ดีเพราะมันพิจารณาความแตกต่างระหว่างการถดถอยเชิงปริมาณแบบมีเงื่อนไขและไม่มีเงื่อนไข ปัญหาของการถดถอยเชิงปริมาณโดยทั่วไปคือเมื่อคุณรวม covariates ในการถดถอยของคุณการเปลี่ยนแปลงการตีความ ใน OLS คุณสามารถไปจากเงื่อนไขไปยังการคาดการณ์แบบไม่มีเงื่อนไขผ่านกฎหมายของการคาดการณ์ซ้ำ แต่สำหรับปริมาณนี้ไม่สามารถใช้ได้ ปัญหานี้ถูกแสดงครั้งแรกโดย Firpo (2007)และ Firpo et al (2009). เขาใช้ฟังก์ชั่นอิทธิพลที่มีศูนย์กลางอีกครั้งเพื่อหาค่าสัมประสิทธิ์การถดถอยเชิงควอนไทด์แบบมีเงื่อนไขเพื่อที่พวกเขาสามารถตีความได้ว่าเป็นค่าสัมประสิทธิ์ OLS ตามปกติ เพื่อจุดประสงค์ของคุณตัวประมาณนี้จะไม่ช่วยอะไรมากนักเพราะมันอนุญาตให้ใช้กับตัวแปรภายนอกเท่านั้น หากคุณสนใจ Nicole Fortin ทำให้โค้ด Stata มีอยู่ในเว็บไซต์ของเธอ

ส่วนใหญ่ที่ผ่านมาประมาณการไม่มีเงื่อนไข IV quantile ถดถอยฉันรู้คือการพาวเวล (2013) เครื่องคำนวณการถดถอยแบบควอไทล์แบบทั่วไป (IV) ของเขาช่วยให้คุณสามารถประเมินผลการรักษาแบบควอไทล์ขอบในสถานะของ endogeneity ที่ไหนสักแห่งในเว็บไซต์ RAND เขายังทำให้รหัส Stata ของเขาใช้ได้ฉันไม่สามารถหาได้ในตอนนี้ เนื่องจากคุณถามว่า: ในบทความก่อนหน้านี้เขาได้ใช้ตัวประมาณนี้ในบริบทข้อมูลพาเนล (ดูPowell, 2012 ) ตัวประมาณนี้ยอดเยี่ยมเพราะไม่เหมือนกับวิธี QR ข้อมูลพาเนลก่อนหน้านี้ตัวประมาณนี้ไม่พึ่งพา T asymptotics ขนาดใหญ่ (ซึ่งโดยปกติคุณไม่ได้มี

สุดท้าย แต่ไม่ท้ายสุดตัวแปรที่แปลกใหม่มากขึ้น: ตัวประเมิน IVQR ที่ถูกเซ็นเซอร์ (CQIV) โดยChernozhukov et al (2011)อนุญาตให้ดูแลข้อมูลการตรวจสอบ - ตามชื่อแนะนำ มันเป็นส่วนขยายของบทความโดย Chernozhukov และ Hong (2003) ซึ่งฉันไม่ได้ลิงก์เนื่องจากไม่ใช่บริบท IV ตัวประมาณนี้คำนวณหนัก แต่ถ้าคุณมีข้อมูลที่ถูกเซ็นเซอร์และไม่มีทางอื่นรอบตัวนี่คือวิธีที่จะไป Amanda Kowalski ได้เผยแพร่รหัส Stata บนเว็บไซต์ของเธอหรือคุณสามารถดาวน์โหลดได้ RePEc. เครื่องมือประมาณนี้ (และโดยวิธี IVQR และ SEE-IVQR) คิดว่าคุณมีตัวแปรภายนอกอย่างต่อเนื่อง ฉันใช้ตัวประมาณเหล่านี้ในบริบทของการถดถอยของรายรับซึ่งการศึกษาเป็นตัวแปรภายนอกของฉันซึ่งใช้ค่าระหว่าง 18 ถึง 20 ค่าดังนั้นจึงไม่ต่อเนื่อง แต่ในแบบฝึกหัดการจำลองฉันสามารถแสดงให้เห็นได้เสมอว่านี่ไม่ใช่ปัญหา อย่างไรก็ตามนี่อาจขึ้นอยู่กับแอปพลิเคชั่นดังนั้นหากคุณตัดสินใจที่จะใช้สิ่งนี้ให้ตรวจสอบอีกครั้ง


นี่คือคำตอบที่ยอดเยี่ยม!
Dimitriy V. Masterov

2
บทสรุปการอัปเดตด้วยตนเองเป็นศูนย์กลางมาก: Kaplan and Sun (2012) ดังกล่าวได้รับการเผยแพร่ในปี 2560 ลิงก์ไปยังเวอร์ชันที่เผยแพร่และยอมรับ (เปิดการเข้าถึง) พร้อมกับลิงค์ไปยัง MATLAB และรหัส R อยู่ที่คณะคริสตจักรมิสซิสซูรี่. edu/~kaplandm เอกสาร / รหัสทั่วไปเพิ่มเติม ตอนนี้) จริง ๆ แล้วฉันพบว่ารีวิวที่เป็นประโยชน์ข้างต้นในขณะที่แก้ไขการแนะนำ
David M Kaplan

2

คู่มือใหม่ของ Quantile Regressionมีสองบทที่ยอดเยี่ยมในหัวข้อเหล่านี้:

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.