การถดถอยเชิงปริมาณแบบมีเงื่อนไขและไม่มีเงื่อนไขแตกต่างกันอย่างไร


38

ตัวประมาณการถดถอยเชิงควอนไทลตามเงื่อนไขโดย Koenker และ Basset (1978) สำหรับ quantile ถูกกำหนดเป็น โดยที่\ rho_ \ tau = u_i \ cdot (\ tau - 1 (u_i <0))เป็นฟังก์ชันการถ่วงน้ำหนักอีกครั้ง (เรียกว่า "ตรวจสอบ" - หน้าที่) ของเหลือu_iτth
ρτ=Uฉัน(τ-1(Uฉัน<0))Uฉัน

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

ในกระดาษโดยFirpo และคณะ (2009)ผู้เขียนระบุว่าการถดถอยเชิงปริมาณแบบมีเงื่อนไขไม่ได้ให้ผลที่น่าสนใจ พวกเขาบอกว่าผลลัพธ์แบบมีเงื่อนไขไม่สามารถสรุปได้โดยทั่วไปกับประชากร (ใน OLS เราสามารถเปลี่ยนจากเงื่อนไขเป็นเงื่อนไขแบบไม่มีเงื่อนไขผ่านกฎการทำซ้ำที่คาดหวังไว้ แต่นี่ไม่สามารถใช้ได้สำหรับปริมาณ) เพราะนี่คือτth quantile ไม่มีเงื่อนไขyiอาจจะไม่เป็นเช่นเดียวกับτthเงื่อนไข quantile yi|Xi|

หากฉันเข้าใจอย่างถูกต้องส่วนหนึ่งของปัญหาคือสิ่งที่ covariates รวมอยู่ในXiมีผลต่อการจัดอันดับตัวแปรuiเนื่องจากการรวมของ covariates แยกข้อผิดพลาดเป็นส่วนประกอบที่สังเกตและไม่ได้สังเกต ฉันไม่สามารถเข้าใจได้อย่างชัดเจนว่าทำไมสิ่งนี้จึงทำให้เกิดปัญหา

นี่คือคำถามของฉัน:

  1. อะไรที่ทำให้เกิดผลกระทบเชิงควอนไทล์แบบมีเงื่อนไขและไม่มีเงื่อนไขแตกต่างจากกัน?
  2. ฉันจะตีความสัมประสิทธิ์ของการถดถอยเชิงควอนตัมแบบมีเงื่อนไขได้อย่างไร
  3. การถดถอยแบบมีเงื่อนไขมีอคติหรือไม่?

อ้างอิง:

  • Koenker, R. , & Bassett, G. (1978) "ปริมาณการถดถอย", Econometrica , Vol. 46 (1), หน้า 33-50
  • Firpo, S. et al. (2009) "การถดถอยเชิงปริมาณแบบไม่มีเงื่อนไข", Econometrica , Vol. 77 (3), pp. 953-973

1
ฉันอยากจะแนะนำให้คุณตรวจสอบบทที่ 7 ของ "เศรษฐมิติที่ไม่เป็นอันตรายมากที่สุด" โดย Angrist และ Pischke มีตัวอย่างของการตีความค่าสัมประสิทธิ์การถดถอยเชิงควอนตัมและความหมายของควอนไทล์ที่มีเงื่อนไขกับ X ฉันเห็นด้วยกับคุณว่าความหมายเหล่านั้นไม่ได้ทำให้การใช้โมเดลนั้นไม่ถูกต้องเว้นแต่คุณกำลังมองหาผลกระทบของหนึ่งตัวแปรร่วม ฉันคิดว่าการถดถอยแบบควอไทล์สามารถลำเอียง Angrist และ Pischke สำรวจวิธีการที่เสนอบางอย่างเพื่อควบคุมตัวแปรที่ละเว้น
Juan C

1
ไม่ใช่คำตอบ แต่บางทีการถดถอยแบบเงื่อนงำ - ควอไทล์ก็สามารถกลายเป็นปัญหา "ข้อมูลที่หายไป" ซึ่งข้อมูลที่หายไปคือน้ำหนักที่ใช้ในการถดถอย OLS แบบถ่วงน้ำหนัก ตัวอย่างเช่นการใช้การแจกแจงเอ็กซ์โปเนนเชียลสำหรับน้ำหนักผกผันจะให้ค่ามัธยฐานถดถอย ( ) τ=50
ความน่าจะเป็นที่เป็นไปได้

คำตอบ:


29

ตั้งค่า
สมมติว่าคุณมีการถดถอยที่เรียบง่ายของรูปแบบ ที่ผลที่มีผลประกอบการเข้าสู่ระบบของสมาชิกผู้ ,คือจำนวนปีของการศึกษาและเป็น คำผิดพลาด แทนที่จะดูเฉพาะผลกระทบโดยเฉลี่ยของการศึกษาต่อรายได้ซึ่งคุณจะได้รับผ่าน OLS คุณยังต้องการเห็นผลกระทบในส่วนต่างๆของการกระจายผล i S i ϵ i

lnyi=α+βSi+ϵi
iSiϵi

1) อะไรคือความแตกต่างระหว่างการตั้งค่าแบบมีเงื่อนไขและแบบไม่มีเงื่อนไข
ก่อนกำหนดรายได้จากบันทึกและให้เราเลือกบุคคลสองคนคือและโดยที่อยู่ในส่วนล่างของการกระจายรายได้แบบไม่มีเงื่อนไขและอยู่ด้านบน B A BABABป้อนคำอธิบายรูปภาพที่นี่

มันไม่ได้ดูธรรมดามาก แต่นั่นเป็นเพราะฉันใช้การสังเกต 200 แบบในการจำลองเท่านั้น ตอนนี้จะเกิดอะไรขึ้นถ้าเรากำหนดเงื่อนไขรายรับของเราในปีการศึกษา? สำหรับแต่ละระดับของการศึกษาคุณจะได้รับการกระจายรายได้แบบมีเงื่อนไขนั่นคือคุณจะได้พล็อตความหนาแน่นตามด้านบน แต่สำหรับการศึกษาแต่ละระดับแยกกัน

ป้อนคำอธิบายรูปภาพที่นี่

เส้นสีน้ำเงินเข้มสองเส้นคือรายได้ที่คาดการณ์ไว้จากการถดถอยเชิงเส้นแบบควอไทล์ที่ค่ามัธยฐาน (เส้นล่าง) และ 90 เปอร์เซ็นไทล์ (เส้นบน) ความหนาแน่นสีแดงที่ 5 ปีและการศึกษา 15 ปีให้การประมาณของการกระจายรายได้ตามเงื่อนไข อย่างที่คุณเห็นบุคคลมีการศึกษา 5 ปีและแต่ละคนมีการศึกษา 15 ปี เห็นได้ชัดว่าบุคคลทำผลงานได้ดีในหมู่ลูกแพร์ของเขาในช่วง 5 ปีของการศึกษาดังนั้นเธอจึงอยู่ในเปอร์เซ็นไทล์ที่ 90B AABA

ดังนั้นเมื่อเงื่อนไขของคุณกับตัวแปรอื่นมันเกิดขึ้นแล้วว่าตอนนี้คน ๆ หนึ่งอยู่ในส่วนบนสุดของการแจกแจงแบบมีเงื่อนไขในขณะที่คนนั้นจะอยู่ในส่วนล่างของการแจกแจงแบบไม่มีเงื่อนไข - นี่คือสิ่งที่เปลี่ยนการตีความของสัมประสิทธิ์ . ทำไม?

คุณได้พูดไปแล้วว่าด้วย OLS เราสามารถไปได้จากโดยใช้กฎหมายของความคาดหวังซ้ำแล้วซ้ำอีกอย่างไรก็ตามนี่เป็นทรัพย์สินของผู้ดำเนินการความคาดหวังซึ่งไม่สามารถหาได้ ดังนั้นโดยทั่วไปที่ quantile ใด ๆ\สิ่งนี้สามารถแก้ไขได้โดยเริ่มจากการถดถอยเชิงควอนไทล์แบบมีเงื่อนไขก่อนแล้วจึงรวมตัวแปรการปรับสภาพเพื่อให้ได้มาซึ่งผลกระทบขอบ (ผลที่ไม่มีเงื่อนไข) ซึ่งคุณสามารถตีความได้เช่นเดียวกับ OLS ตัวอย่างของวิธีการนี้ให้บริการโดยพาวเวล (2014)Q τ ( y i | S i ) Q τ ( y i ) τE[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2) วิธีการตีความค่าสัมประสิทธิ์การถดถอยเชิงปริมาณ?
นี่เป็นส่วนที่ยุ่งยากและฉันไม่ได้อ้างว่ามีความรู้ทั้งหมดในโลกเกี่ยวกับเรื่องนี้ดังนั้นอาจมีบางคนที่มีคำอธิบายที่ดีกว่าสำหรับเรื่องนี้ ดังที่คุณได้เห็นอันดับของแต่ละคนในการกระจายรายได้อาจแตกต่างกันมากไม่ว่าคุณจะพิจารณาการกระจายแบบมีเงื่อนไขหรือไม่มีเงื่อนไข

สำหรับการถดถอยแบบควอไทล์แบบมีเงื่อนไข
เนื่องจากคุณไม่สามารถบอกได้ว่าบุคคลใดจะอยู่ในการกระจายผลก่อนและหลังการรักษาคุณสามารถสร้างข้อความเกี่ยวกับการกระจายโดยรวมได้เท่านั้น ตัวอย่างเช่นในตัวอย่างข้างต้น aอาจหมายถึงว่าปีการศึกษาเพิ่มเติมจะเพิ่มรายได้ใน 90 เปอร์เซ็นต์ของการกระจายรายได้แบบมีเงื่อนไข ได้รับมอบหมายให้ประชาชนเพิ่มอีกปีการศึกษา) นั่นเป็นเหตุผลที่การประมาณควอนตัมแบบมีเงื่อนไขหรือผลการรักษาแบบควอนไทด์แบบมีเงื่อนไขนั้นมักไม่ถือว่าเป็น "น่าสนใจ" โดยปกติเราต้องการทราบว่าการรักษามีผลกระทบต่อบุคคลของเราในมือไม่เพียง แต่การกระจายβ90=0.13

สำหรับการถดถอยเชิงปริมาณแบบไม่มีเงื่อนไขเงื่อนไข
เหล่านี้เป็นเหมือนค่าสัมประสิทธิ์ OLS ที่คุณใช้ในการตีความ ความยากลำบากที่นี่ไม่ใช่การตีความ แต่ทำอย่างไรจึงจะได้สัมประสิทธิ์เหล่านั้นซึ่งไม่ใช่เรื่องง่ายเสมอไป (การบูรณาการอาจไม่ได้ผลเช่นข้อมูลที่กระจัดกระจายมาก) วิธีอื่นในการหาค่าสัมประสิทธิ์การถดถอยเชิงปริมาณนั้นมีอยู่เช่นวิธีของ Firpo (2009) โดยใช้ฟังก์ชั่นอิทธิพลอีกครั้ง หนังสือโดย Angrist และ Pischke (2009) ที่กล่าวถึงในความคิดเห็นระบุว่าการลดลงของสัมประสิทธิ์การถดถอยเชิงปริมาณยังคงเป็นสาขาการวิจัยเชิงรุกในสาขาเศรษฐศาสตร์ - แม้ว่าเท่าที่ฉันรู้ว่าคนส่วนใหญ่ในปัจจุบันตั้งถิ่นฐานสำหรับวิธีการรวม (ตัวอย่างเช่นMelly and Santangelo (2015)ที่ใช้กับโมเดล Changes-in-Changes)

3) สัมประสิทธิ์การถดถอยแบบควอไทล์แบบมีเงื่อนไขลำเอียงหรือไม่? ไม่ (สมมติว่าคุณมีรูปแบบที่ระบุไว้อย่างถูกต้อง) พวกเขาเพียงวัดสิ่งที่แตกต่างที่คุณอาจจะหรืออาจไม่สนใจผลกระทบโดยประมาณต่อการกระจายมากกว่าบุคคลนั้นเป็นอย่างที่ฉันบอกว่าไม่น่าสนใจมาก - ส่วนใหญ่ ในการให้ตัวอย่างเคาน์เตอร์: พิจารณาผู้กำหนดนโยบายที่แนะนำการศึกษาภาคบังคับอีกหนึ่งปีและพวกเขาต้องการที่จะรู้ว่าสิ่งนี้ช่วยลดความไม่เท่าเทียมกันของรายได้ในประชากรหรือไม่

ด้านบนสุดทั้งสองแผงแสดงการเปลี่ยนตำแหน่งที่บริสุทธิ์โดยที่เป็นค่าคงที่สำหรับทุกควอไทล์นั่นคือเอฟเฟกต์การรักษาควอไทล์อย่างต่อเนื่องซึ่งหมายความว่าถ้าปีเพิ่มเติม การศึกษาเพิ่มรายได้ 8% จากการกระจายรายได้ทั้งหมด β 10 = β 90 = 0.8βτβ10=β90=0.8

เมื่อเอฟเฟกต์การรักษาแบบควอไทล์ไม่คงที่ (เช่นในแผงด้านล่างทั้งสอง) คุณยังมีเอฟเฟกต์แบบสเกลนอกเหนือจากเอฟเฟกต์ตำแหน่ง ในตัวอย่างนี้ด้านล่างของการกระจายรายได้เลื่อนขึ้นมากกว่าด้านบนดังนั้นค่า 90-10 (การวัดมาตรฐานของความไม่เท่าเทียมกันของรายได้) จึงลดลงในประชากร ป้อนคำอธิบายรูปภาพที่นี่

คุณไม่ทราบว่าบุคคลใดได้รับประโยชน์จากมันหรือเป็นส่วนหนึ่งของการกระจายผู้คนที่เริ่มต้นจากด้านล่าง (เพื่อตอบคำถามที่ว่าคุณต้องการสัมประสิทธิ์การถดถอยเชิงควอนตัมแบบไม่มีเงื่อนไข) บางทีนโยบายนี้อาจทำร้ายพวกเขาและทำให้พวกเขาอยู่ในระดับที่ต่ำกว่าเมื่อเทียบกับคนอื่น ๆ แต่ถ้าเป้าหมายคือการรู้ว่าการศึกษาภาคบังคับเพิ่มเติมอีกหนึ่งปีจะช่วยลดรายได้ที่กระจายออกไป ตัวอย่างของวิธีการดังกล่าวคือBrunello และคณะ (2009)

หากคุณยังคงสนใจในอคติของการถดถอยแบบควอไทล์เนื่องจากแหล่งที่มาของ endogeneity ดูที่Angrist et al (2006)ที่พวกเขาได้รับสูตรอคติตัวแปรที่ละเว้นสำหรับบริบทควอนตัม


1
ปัจจุบันมีการนำเทคนิคนี้ไปใช้หรือไม่?
แชนด์เลอ

1

นอกจากคำตอบที่ยอดเยี่ยมโดย @Andy คุณอาจต้องการตรวจสอบ:

Borah, BJ, & Basu, A. (2013) "การเน้นความแตกต่างระหว่างวิธีการถดถอยเชิงปริมาณแบบมีเงื่อนไขและไม่มีเงื่อนไขผ่านแอพพลิเคชั่นเพื่อประเมินความร่วมมือในการใช้ยา" เศรษฐศาสตร์สุขภาพ, 22 (9), 1052–1070 http://doi.org/10.1002/hec.2927

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.