จะเกิดอะไรขึ้นเมื่อฉันรวมตัวแปรกำลังสองลงในการถดถอย


20

ฉันเริ่มต้นด้วยการถดถอย OLS ของฉัน: โดยที่ D เป็นตัวแปรจำลองการประมาณการจะแตกต่างจากศูนย์ด้วยค่า p ต่ำ ฉัน preform การทดสอบ Ramsey RESET และพบว่าฉันมีการคลาดเคลื่อนของสมการฉันจึงรวมกำลังสอง x:

y=β0+β1x1+β2D+ε
y=β0+β1x1+β2x12+β3D+ε
  1. คำสองคำนี้อธิบายอะไร? (การเพิ่มขึ้นแบบไม่ใช่เชิงเส้นเป็น Y?)
  2. ด้วยการทำเช่นนี้การประมาณค่า D ของฉันจะไม่แตกต่างจากค่าศูนย์อีกต่อไปด้วยค่า p สูง ฉันจะตีความคำศัพท์ยกกำลังสองในสมการของฉัน (โดยทั่วไป) ได้อย่างไร

แก้ไข: การปรับปรุงคำถาม



1
เหตุผลที่น่าจะเป็น: และDดูเหมือนจะอธิบายความแปรปรวนเดียวกันในyx12Dy
steadyfish

3
สิ่งหนึ่งที่อาจช่วยได้คือการกำหนดจุดศูนย์กลางก่อนสร้างคำที่ยกกำลังสองของคุณ (ดูที่นี่ ) สำหรับการตีความคำศัพท์กำลังสองของคุณฉันขอยืนยันว่าเป็นการตีความที่ดีที่สุดβ 1 x 1 + β 2 x 2 1โดยรวม (ดูที่นี่ ) สิ่งหนึ่งคือการที่คุณอาจต้องปฏิสัมพันธ์ที่หมายถึงการเพิ่มβ 4 x 1 D + β 5 x 2 1 D x β1x1+β2x12 β4x1D+β5x12D
gung - Reinstate Monica

ฉันไม่คิดว่ามันซ้ำซ้อนกับคำถามนั้น วิธีการแก้ปัญหานั้นแตกต่างกัน (ตัวแปรตรงกลางทำงานที่นี่ แต่ไม่ใช่ตรงนั้นเว้นแต่ฉันเข้าใจผิด)
Peter Flom - Reinstate Monica

@ ปีเตอร์ฉันตีความคำถามนี้ว่าเป็นส่วนย่อยของ "ทำไมเมื่อฉันเพิ่มตัวแปรให้กับโมเดลของฉันการประมาณผลกระทบ / สำหรับการเปลี่ยนแปลงตัวแปรอื่น ๆ " ซึ่งแก้ไขในคำถามอื่น ในบรรดาคำตอบของคำถามนั้นคือ collinearity (ซึ่งฆ้องหมายถึงในคำตอบของเขาสำหรับคำถามนั้น ) / เนื้อหาทับซ้อนกันระหว่างตัวทำนาย (เช่นระหว่างDและ( x 1 , x 2 1 )ซึ่งฉันสงสัยว่าเป็นผู้กระทำผิดในกรณีนี้) . ตรรกะเดียวกันนี้ใช้ ฉันไม่แน่ใจว่าข้อโต้แย้งนั้นคืออะไร แต่ก็ไม่เป็นไรถ้าคุณและคนอื่นไม่เห็นด้วย ไชโย pD(x1,x12)
มาโคร

คำตอบ:


21

ก่อนอื่นตัวแปร dummy ถูกตีความว่าเป็นการเปลี่ยนแปลงของการสกัดกั้น นั่นคือค่าสัมประสิทธิ์ของคุณช่วยให้คุณมีความแตกต่างในการสกัดกั้นเมื่อD = 1คือเมื่อD = 1 , ตัดเป็นβ 0 + β 3 การตีความที่ไม่เปลี่ยนแปลงเมื่อมีการเพิ่มยืดx 1β3D=1D=1β0+β3x1

ทีนี้ประเด็นของการเพิ่มกำลังสองลงในซีรีย์คือคุณคิดว่าความสัมพันธ์นั้นหมดไปในบางจุด ดูสมการที่สองของคุณ

y=β0+β1x1+β2x12+β3D+ε

การรับผลตอบแทนWRT x1

δyδx1=β1+2β2x1

การแก้สมการนี้ให้จุดเปลี่ยนของความสัมพันธ์ ตามที่ผู้ใช้ 1393368 อธิบายแล้วนี่เป็นภาพสะท้อนของรูปตัว U ที่ตรงกันข้ามถ้าและในทางกลับกัน นำตัวอย่างต่อไปนี้:β1<0

y^=1.3+0.42x10.32x12+0.14D

อนุพันธ์ wrt คือx1

δyδx1=0.4220.32x1

การแก้หาให้คุณx1

δyδx1=0x10.66

นั่นคือจุดที่ความสัมพันธ์มีจุดเปลี่ยน คุณสามารถดูผลลัพธ์ของ Wolfram-Alphaสำหรับฟังก์ชั่นด้านบนเพื่อให้เห็นภาพของปัญหาของคุณ

จำไว้ว่าเมื่อตีความผลของ ceteris paribus ของการเปลี่ยนแปลงในกับyคุณต้องดูสมการ:x1y

Δy=(β1+2β2x1)Δx

นั่นคือคุณไม่สามารถแปลในการแยกเมื่อคุณเพิ่ม regressor Squared x 2 1 !β1x12

Dx1


สวัสดี หากคุณมีผู้ทำนายหลายคนคุณควรใช้อนุพันธ์บางส่วนหรืออนุพันธ์ทั้งหมด (ต่างกัน)?
skan

1
อนุพันธ์บางส่วนยังเป็นวิธีที่เหมาะสมในการไปที่นี่ การตีความของสัมประสิทธิ์ทั้งหมดคือceteris paribusกล่าวคือถือทุกอย่างคงที่ นั่นคือสิ่งที่คุณกำลังทำอยู่เมื่อคุณหาอนุพันธ์บางส่วน
altabq

ดูหน้า UCLA IDRE นี้เพื่อเติมเต็มคำตอบที่ยอดเยี่ยมของ @ altabq
Cyrille

19

ตัวอย่างที่ดีของการรวมกำลังสองของตัวแปรมาจากเศรษฐศาสตร์แรงงาน หากคุณถือว่าyเป็นค่าจ้าง (หรือบันทึกค่าจ้าง) และxตามอายุแล้วรวมx^2ถึงหมายความว่าคุณกำลังทดสอบความสัมพันธ์กำลังสองระหว่างอายุและรายได้ค่าจ้าง ค่าจ้างเพิ่มขึ้นตามอายุเมื่อผู้คนเริ่มมีประสบการณ์มากขึ้น แต่เมื่ออายุสูงขึ้นค่าจ้างก็เริ่มเพิ่มขึ้นในอัตราที่ลดลง (คนมีอายุมากขึ้นและพวกเขาจะไม่แข็งแรงในการทำงานเหมือนเมื่อก่อน) และในบางครั้งค่าจ้างก็ไม่เติบโต ถึงระดับค่าจ้างที่เหมาะสม) จากนั้นเริ่มลดลง (พวกเขาออกจากตำแหน่งและรายได้เริ่มลดลง) ดังนั้นความสัมพันธ์ระหว่างค่าแรงและอายุจึงกลับเป็นรูปตัวยู (เอฟเฟกต์วงจรชีวิต) โดยทั่วไปสำหรับตัวอย่างที่กล่าวถึงที่นี่ค่าสัมประสิทธิ์การageคาดว่าจะเป็นบวกและมากกว่าage^2ที่จะเป็นลบจุดที่นี่คือควรจะมีพื้นฐานทางทฤษฎี / เหตุผลเชิงประจักษ์สำหรับการรวมถึงตารางของตัวแปร ตัวแปรจำลองที่นี่สามารถคิดได้ว่าเป็นตัวแทนเพศของคนงาน นอกจากนี้คุณยังสามารถรวมระยะเวลาการโต้ตอบของเพศและอายุเพื่อตรวจสอบว่าความแตกต่างทางเพศแตกต่างกันไปตามอายุ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.