เหตุใดจึงถูกต้องเพื่อทำให้เสียเวลาอนุกรมด้วยการถดถอย


14

มันอาจเป็นคำถามแปลก ๆ เลย แต่ในฐานะที่เป็นสามเณรในเรื่องที่ฉันสงสัยว่าทำไมเราถึงใช้การถดถอยเพื่อทำให้เป็นอนุกรมเวลาถ้าหนึ่งในสมมติฐานของการถดถอยคือข้อมูลที่ควรใช้ในขณะที่ข้อมูลที่ใช้ในการถดถอยนั้น ไม่ใช่ id


6
โดยทั่วไปไม่เป็นความจริงที่เราทำการสันนิษฐานว่า "ข้อมูล" คือ iid
Christoph Hanck

3
คุณหมายถึงอะไรอย่างแม่นยำโดยdetrend ?
Matthew Gunn

6
ฉันไม่มีเวลาที่จะเขียนคำตอบ / เอกสารที่ถูกต้อง แต่โดยทั่วไปความสัมพันธ์แบบอนุกรมนั้นไม่ได้มีอคติกับผลลัพธ์ของการถดถอยเชิงเส้น (มันเป็นการเปลี่ยนแปลงการคำนวณที่เหมาะสมของข้อผิดพลาดมาตรฐานช่วงความมั่นใจ ฯลฯ ) สิ่งนี้ทำให้วิธีการสองขั้นตอนแบบคลาสสิก (ไม่พอใจแล้ววิเคราะห์ความสัมพันธ์) ที่สมเหตุสมผล (เช่น googling บางส่วนของ "การถดถอยเชิงเส้นสัมพันธ์แบบอนุกรมที่ไม่มีอคตินำไปสู่fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Ben Bolker

2
บางทีอาจจะสำคัญกว่าประมาณการ OLS สัมประสิทธิ์มีแนวโน้มเชิงเส้นลู่คำสั่งทั้งหมดของขนาดเร็ว (ในอัตราที่ ) กับมูลค่าที่แท้จริงของมันกว่า regressors นิ่ง ( n - 1 / 2 ) ซึ่งหมายความว่าคุณ สามารถประเมินแนวโน้มอย่างสม่ำเสมอแม้ว่าคุณจะไม่สนใจตัวแปรนิ่ง สิ่งนี้ตรงกันข้ามกับการประเมินผลกระทบของตัวแปรคงที่หนึ่งต่อหนึ่งซึ่งคุณสูญเสียความมั่นคงถ้าคุณไม่ใช้ตัวแปร n-3/2n-1/2
Richard Hardy

คำตอบ:


15

คุณฉลาดในการรู้สึกว่าอาจมีความขัดแย้งระหว่างสมมติฐานดั้งเดิมของการถดถอยเชิงเส้นน้อยที่สุดแบบทั่วไปและการพึ่งพาอนุกรมซึ่งมักพบได้ในการตั้งค่าอนุกรมเวลา

พิจารณาอัสสัมชั 1.2 (Exogeneity เข้มงวด) ของฟูมิโอะฮายาชิของเศรษฐ

E[εผม|X]=0

นี่หมายถึง , ที่เหลือใด ๆϵ iคือ orthogonal กับ regressor ใด ๆx jE[εผมxJ]=0εผมxJเจดังที่ฮายาชิชี้ให้เห็นข้อสันนิษฐานนี้ถูกละเมิดในแบบจำลองการตอบโต้อัตโนมัติที่ง่ายที่สุด[1] พิจารณากระบวนการ AR (1):

Yเสื้อ=βYเสื้อ-1+εเสื้อ

เราเห็นได้ว่าจะเป็น regressor สำหรับy t + 1แต่ϵ tไม่ใช่ orthogonal ต่อy t (เช่นE [ ϵ t y t ] Yเสื้อYเสื้อ+1εเสื้อYเสื้อ )E[εเสื้อYเสื้อ]0

เนื่องจากข้อสันนิษฐานว่า exogeneity ที่เข้มงวดนั้นถูกละเมิดจึงไม่มีข้อโต้แย้งใด ๆ ที่ใช้ข้อสันนิษฐานนั้นที่สามารถนำไปใช้กับโมเดล AR (1) แบบง่ายนี้ได้!

ดังนั้นเรามีปัญหาที่ดื้อรั้น?

ไม่เราทำไม่ได้! การประมาณแบบจำลอง AR (1) ที่มีกำลังสองน้อยสุดสามัญนั้นเป็นพฤติกรรมมาตรฐานที่ถูกต้องทั้งหมด ทำไมมันยังคงโอเค?

ตัวอย่างที่มีขนาดใหญ่การโต้แย้งแบบซีมโทติคไม่ต้องการ exogeniety ที่เข้มงวด ข้อสันนิษฐานที่เพียงพอ (ที่สามารถนำมาใช้แทนความเป็นเอกภาพอย่างเข้มงวด) คือการถดถอยกำหนดไว้ล่วงหน้า regressors นั้นเป็น orthogonal ไปยังเทอมผิดพลาดที่เกิดขึ้นพร้อมกัน ดูฮายาชิบทที่ 2 สำหรับการโต้แย้งอย่างเต็มรูปแบบ

อ้างอิง

[1] Fumio Hayashi เศรษฐมิติ (2000), p. 35

[2] ibid., p. 134


6

วิธีการถดถอยประเภทกำลังสองน้อยที่สุดขั้นพื้นฐานไม่คิดว่าค่า y คือ iid พวกเขาคิดว่าส่วนที่เหลือ (เช่นค่า y ลบด้วยแนวโน้มที่แท้จริง) เป็น iid

วิธีการอื่น ๆ ของการถดถอยมีอยู่ซึ่งทำให้สมมติฐานแตกต่างกัน แต่นั่นอาจจะทำให้คำตอบนี้ยุ่งยากเกินไป


5
ข้อสันนิษฐานที่ผิดพลาดอย่างชัดเจน: ลองนึกถึงอนุกรมเวลาที่มีทั้งแนวโน้มเชิงเส้นและฤดูกาล ส่วนที่เหลือจากการถดถอยเชิงเส้นมีความสัมพันธ์อย่างชัดเจนจึงไม่ใช่ iid
DeltaIV

3

มันเป็นคำถามที่ดี! ปัญหาไม่ได้ถูกกล่าวถึงในหนังสืออนุกรมเวลาของฉัน (ฉันอาจต้องการหนังสือที่ดีกว่า :) ก่อนอื่นโปรดทราบว่าคุณไม่ได้ถูกบังคับให้ใช้การถดถอยเชิงเส้นเพื่อทำให้เป็นอนุกรมเวลาถ้าชุดมีแนวโน้มสุ่ม (หน่วยราก) )- คุณสามารถรับความแตกต่างแรกได้ แต่คุณต้องใช้การถดถอยเชิงเส้นหากซีรีส์มีแนวโน้มที่กำหนดขึ้น ในกรณีนี้มันเป็นความจริงที่ว่าส่วนที่เหลือไม่ได้เป็น iid อย่างที่คุณพูด แค่คิดถึงซีรีส์ที่มีแนวโน้มเชิงเส้นส่วนประกอบตามฤดูกาลส่วนประกอบวงจร ฯลฯ ทั้งหมดเข้าด้วยกัน - หลังจากการถดถอยเชิงเส้นค่าคงที่ทั้งหมดล้วน แต่เป็นอิสระ ประเด็นก็คือว่าคุณไม่ได้ใช้การถดถอยเชิงเส้นเพื่อทำนายหรือสร้างช่วงการทำนาย เป็นเพียงส่วนหนึ่งของขั้นตอนการอนุมานของคุณ: คุณยังต้องใช้วิธีการอื่นเพื่อให้ได้สิ่งตกค้างที่ไม่เกี่ยวข้อง ดังนั้นในขณะที่การถดถอยเชิงเส้นต่อ se ไม่ใช่ขั้นตอนการอนุมานที่ถูกต้อง (ไม่ใช่แบบจำลองทางสถิติที่ถูกต้อง) สำหรับอนุกรมเวลาส่วนใหญ่ขั้นตอนซึ่งรวมถึงการถดถอยเชิงเส้นเป็นหนึ่งในขั้นตอนของมันอาจเป็นแบบจำลองที่ถูกต้องหากแบบจำลองนั้นสอดคล้องกับกระบวนการสร้างข้อมูลสำหรับ อนุกรมเวลา


3
อย่าแยกความแตกต่างหากคุณมีแนวโน้มที่กำหนดขึ้นได้การแยกความแตกต่างนั้นเหมาะสมกับแนวโน้มแบบสุ่ม (รากหน่วย) หากคุณแยกความแตกต่างระหว่างซีรี่ส์โดยไม่มีรูทยูนิตคุณจะแนะนำข้อผิดพลาดเฉลี่ยเคลื่อนที่แบบรวมในโมเดลและนั่นเป็นสิ่งที่น่ารังเกียจ
Richard Hardy

1
ฉันคิดว่าคุณหมายถึงความแตกต่างไม่แตกต่าง
Hong Ooi

Yเสื้อ=β0+β1Yเสื้อ-1+εเสื้อ

1
@ HongOoi ใช่ฉันไม่ดีฉันหมายถึงความแตกต่างไม่ใช่ความแตกต่าง DeltaIV เป็นอนุกรมเวลาที่กล่าวว่ามีแนวโน้มสุ่มถ้าอนุกรมเวลาเป็นกระบวนการแบบรวม (= หน่วย - รูท) นี่เป็นคำศัพท์มาตรฐานในหน่วยการเรียนรู้รูทและการย่อตัว ฉันสงสัยว่ามันมีความหมายต่างกันในวรรณกรรมประเภทอื่นหรือไม่ ไม่ว่าในกรณีใด over-differencing (= การแตกต่างของอนุกรมเวลาที่ไม่มีรูทยูนิต) เป็นปรากฏการณ์ที่มีชื่อเสียงและควรหลีกเลี่ยง
Richard Hardy

@ RichardHardy ตกลงขอบคุณ ฉันจะพยายามทำเอกสารเกี่ยวกับคำนิยามของกระบวนการรวมและรูทยูนิต เป็นจุดเริ่มต้นคุณช่วยบอกฉันได้ไหมว่าซีรี่ส์ที่ฉันเสนอนั้นมีการบูรณาการหรือไม่? รากที่คุณอ้างถึงคือรากของพหุนามY=β0+อีเสื้อa1x1?
DeltaIV
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.