ประโยชน์ของทฤษฎีบท Frisch-Waugh


15

ฉันควรจะสอนทฤษฎีบท Frish Waugh ในสาขาเศรษฐศาสตร์ซึ่งฉันไม่ได้ศึกษา

ฉันเข้าใจคณิตศาสตร์ที่อยู่ข้างหลังและฉันก็หวังว่าความคิดนี้เช่นกัน "ค่าสัมประสิทธิ์ที่คุณได้รับสำหรับค่าสัมประสิทธิ์เฉพาะจากแบบจำลองเชิงเส้นหลายเส้นนั้นเท่ากับสัมประสิทธิ์ของตัวแบบการถดถอยอย่างง่ายถ้าคุณ" กำจัด "อิทธิพลของตัวถดถอยอื่น ๆ ดังนั้นแนวคิดทางทฤษฎีจึงเจ๋งมาก (ถ้าฉันเข้าใจผิดโดยสิ้นเชิงฉันยินดีต้อนรับการแก้ไข)

แต่มันมีประเพณีดั้งเดิม / การปฏิบัติบางอย่าง?

แก้ไข : ฉันยอมรับคำตอบแล้ว แต่ยังยินดีที่จะมีคำตอบใหม่ที่นำตัวอย่าง / แอปพลิเคชันอื่นมาใช้


4
จะเห็นได้ชัดว่าจะมีการเพิ่มแปลงตัวแปรหรือไม่
Silverfish

1
Dougherty's Introduction to Econometricsกล่าวถึงอีกตัวอย่างหนึ่งของการใช้ทฤษฎีบท Frisch-Waugh-Lovell ในวันแรก ๆ ของการวิเคราะห์เชิงเศรษฐมิติของอนุกรมเวลามันเป็นเรื่องธรรมดามากในแบบจำลองที่ตัวแปรมีแนวโน้มเวลาที่กำหนดขึ้นมาเพื่อทำลายพวกเขาทั้งหมดก่อนที่จะถดถอย แต่โดย FWL คุณจะได้รับค่าสัมประสิทธิ์เท่ากันโดยรวมแนวโน้มเวลาเป็น regressor และยิ่งไปกว่านี้จะให้ข้อผิดพลาดมาตรฐาน "ถูกต้อง" เนื่องจากมันยอมรับว่ามีการใช้ 1 df
Silverfish

1
โดเฮอร์ทีเตือนขั้นตอนดังนั้นในแง่ที่ว่ามันไม่ได้เป็นตัวอย่างที่ดีแม้ว่ามันจะเป็นคำแนะนำก็ตาม ตัวแปรทางเศรษฐกิจมักจะดูเหมือนจะแตกต่าง - นิ่งมากกว่าเทรนด์ - นิ่งดังนั้นการพยายามทำลายล้างแบบนี้ไม่ได้ผลและอาจส่งผลให้เกิดการปลอมแปลง
Silverfish

1
@Silverfish: FWL เป็นเทคนิคเกี่ยวกับพีชคณิตอย่างหมดจดดังนั้นประเด็นที่ว่าการสกัดแนวโน้มที่กำหนดขึ้นมานั้นเป็น "สิทธิ" หรือไม่หากสงสัยว่า DGP นั้นเป็นสิ่งสำคัญ แต่ imho ไม่เกี่ยวข้องกับ FWL ดังนั้นในกรณีดังกล่าว OPs คำถามเกี่ยวกับสองวิธีในการได้รับการประเมินจุด
Christoph Hanck

2
ฉันใช้ประโยชน์จากความสัมพันธ์นี้ในหลาย ๆ โพสต์เพื่อจุดประสงค์ด้านแนวคิดและเพื่อเป็นตัวอย่างที่น่าสนใจของปรากฏการณ์การถดถอย ดูอนึ่ง , stats.stackexchange.com/a/46508 , stats.stackexchange.com/a/113207และstats.stackexchange.com/a/71257
whuber

คำตอบ:


14

พิจารณาโมเดลข้อมูลเอฟเฟกต์แผงคงที่หรือที่เรียกว่าโมเดล Least Squares Dummy Variables (LSDV)

y = X β + D α + ϵ , D N T × N αbLSDVสามารถคำนวณได้โดยใช้ OLS โดยตรงกับรุ่น ที่คือเมทริกซ์ของ Dummies และเป็นตัวแทนของผลกระทบถาวรเฉพาะบุคคล

y=Xβ+Dα+ϵ,
DNT×Nα

อีกวิธีในการคำนวณคือการใช้สิ่งที่เรียกว่าภายในการแปลงเป็นแบบจำลองปกติเพื่อให้ได้รุ่นที่มีความหมายเช่น นี่ , เมทริกซ์ชงที่เหลือของการถดถอยในD M [ D ] Y = M [ D ] X β + M [ D ] ε M [ D ] = I - D ( D D ) - 1 D DbLSDV

M[D]y=M[D]Xβ+M[D]ϵ.
M[D]=ID(DD)1DD

ตามทฤษฎีบท Frisch-Waugh-Lovell ทั้งสองมีความเท่าเทียมกันตามที่ FWL บอกว่าคุณสามารถคำนวณค่าสัมประสิทธิ์การถดถอยของการถดถอย (ที่นี่ ) โดยβ^

  1. ถอยหลังใน regressors อื่น ๆ (ที่นี่, ), การบันทึกส่วนที่เหลือ (ที่นี่, เวลา -deanedหรือ , เพราะการถดถอยของค่าคงที่เพียงแค่ demeans ตัวแปร) แล้วyDyM[D]y
  2. ถอยหลังบนและบันทึกส่วนที่เหลือ , และXDM[D]X
  3. ถอยเหลือลงในแต่ละอื่น ๆบน XM[D]yM[D]X

รุ่นที่สองนั้นมีการใช้กันอย่างแพร่หลายมากขึ้นเนื่องจากชุดข้อมูลพาเนลทั่วไปอาจมีหน่วยของแผงหลายพันหน่วยดังนั้นวิธีแรกที่คุณจะต้องใช้การถดถอยกับ regressors นับพันซึ่งไม่ใช่ความคิดที่ดีในเชิงตัวเลขแม้แต่ทุกวันนี้ที่รวดเร็ว คอมพิวเตอร์ที่คำนวณค่าผกผันของจะมีราคาแพงมากในขณะที่การลดเวลาและและมีค่าใช้จ่ายเพียงเล็กน้อยN(D:X)(D:X)yX


ขอบคุณมากนี่เป็นคำตอบที่ฉันกำลังมองหาแม้ว่ามันจะค่อนข้างสูงสำหรับฉันที่จะใช้มัน ดังนั้นคำตอบของคุณก็ดีกับฉัน แต่ฉันจะมีความสุขถ้าฉันมีคนอื่นฉันควรจะยอมรับของคุณ?
Anthony Martin

หากมันช่วยได้ก็ควรทำเช่นนั้น แต่การยอมรับจะช่วยลดโอกาสในการได้รับคำตอบที่ดีกว่าดังนั้นคุณอาจต้องรอก่อนที่จะยอมรับคำตอบนี้ เงินรางวัลจะเพิ่มโอกาสในการได้รับคำตอบมากขึ้น - เนื่องจากมีผู้ใช้ไม่เพียงพอใน CV ที่ตอบคำถามตามจำนวนคำถามอย่างสม่ำเสมอแม้กระทั่งคำตอบเดียวก็อาจทำให้ผู้ใช้อื่น ๆ สรุปได้ว่าคำถามนั้นได้รับการจัดการแล้ว (ฉันโพสต์คำตอบที่เรียบง่ายกว่านี้ไว้ด้านล่าง)
Christoph Hanck

7

นี่เป็นเวอร์ชันที่เรียบง่ายของคำตอบแรกของฉันซึ่งฉันเชื่อว่ามีความเกี่ยวข้องน้อยกว่าในทางปฏิบัติ แต่อาจจะ "ขาย" เพื่อใช้ในห้องเรียนได้ง่ายขึ้น

การถดถอยและผลผลิตเหมือนกัน , K เรื่องนี้สามารถเห็นได้ดังนี้: เอาและด้วยเหตุนี้ ดังนั้น ดังนั้นค่าคงที่ของการถดถอยของตัวแปรในค่าคงที่

yi=β1+j=2Kβjxij+ϵi
yiy¯=j=2Kβj(xijx¯j)+ϵ~i
β^jj=2,,Kx1=1:=(1,,1)
M1=I1(11)11=I11n,
M1xj=xj1n11xj=xj1x¯j=:xjx¯j.
M1xjเป็นเพียงตัวแปร demeaned (ตรรกะเดียวกันของหลักสูตรใช้กับ )yi

4

นี่คืออีกทางอ้อมมากกว่า แต่ฉันเชื่อว่าน่าสนใจอย่างหนึ่งนั่นคือการเชื่อมต่อระหว่างวิธีการที่แตกต่างกันในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบอัตโนมัติบางส่วนของอนุกรมเวลาคงที่

คำจำกัดความ 1

พิจารณาการฉาย TH อัตบางส่วนเท่ากับเมตร

Y^tμ=α1(m)(Yt1μ)+α2(m)(Yt2μ)++αm(m)(Ytmμ)
mαm(m)

มันจึงทำให้อิทธิพลของ TH ล่าช้าใน \ emph {หลังจากควบคุม}1} คมชัดนี้ด้วยที่ให้ดิบ' `ความสัมพันธ์ของและ{TM}mYtYt1,,Ytm+1ρmYtYtm

เราจะหาอย่างไร จำไว้ว่าสมบัติพื้นฐานของการถดถอยของกับ regressorsคือสัมประสิทธิ์เป็นสิ่งที่ regressors และค่าคงที่นั้นไม่ได้ถูกแยกส่วน ในการถดถอยของประชากรเงื่อนไขนี้จะระบุไว้แล้วในแง่ของความสัมพันธ์ของประชากร จากนั้น: แก้หาเราพบว่าค่าสัมประสิทธิ์การฉายเชิงเส้น ประยุกต์ใช้ สูตรนี้เป็นและαj(m)ZtXt

E[Xt(ZtXtα(m))]=0
α(m)
α(m)=[E(XtXt)]1E[XtZt]
Zt=Ytμ
Xt=[(Yt1μ),(Yt2μ),,(Ytmμ)]
เรามี นอกจากนี้ ดังนั้น E(XtZt)=( γ 1
E(XtXt)=(γ0γ1γm1γ1γ0γm2γm1γm2γ0)
E(XtZt)=(γ1γm)
mα(m)
α(m)=(γ0γ1γm1γ1γ0γm2γm1γm2γ0)1(γ1γm)
TH สัมพันธ์บางส่วนแล้วเป็นองค์ประกอบสุดท้ายของเวกเตอร์{(m)}mα(m)

ดังนั้นเราเรียงลำดับการถดถอยหลายครั้งและหาค่าสัมประสิทธิ์หนึ่งที่น่าสนใจในขณะที่การควบคุมสำหรับคนอื่น ๆ

คำจำกัดความ 2

TH สัมพันธ์บางส่วนความสัมพันธ์ของข้อผิดพลาดการทำนายของคาดการณ์กับด้วยข้อผิดพลาดการคาดการณ์ของคาดการณ์ด้วย1}Y t + m Y t - 1 , , Y t - m + 1 Y t Y t - 1 , , Y t - m + 1mYt+mYt1,,Ytm+1YtYt1,,Ytm+1

ดังนั้นเราจึงจัดเรียงการควบคุมแรกสำหรับความล่าช้าระดับกลางแล้วคำนวณความสัมพันธ์ของส่วนที่เหลือ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.