ความสัมพันธ์และความแตกต่างระหว่างอนุกรมเวลาและการถดถอย


12

อะไรคือความสัมพันธ์และความแตกต่างระหว่างอนุกรมเวลาและการถดถอย

สำหรับแบบจำลองและสมมติฐานมันถูกต้องหรือไม่ที่แบบจำลองการถดถอยถือว่าเป็นอิสระระหว่างตัวแปรเอาต์พุตสำหรับค่าต่าง ๆ ของตัวแปรอินพุตในขณะที่โมเดลอนุกรมเวลาไม่ ความแตกต่างอื่น ๆ คืออะไร?

สำหรับวิธีการจากเว็บไซต์โดย Darlington

มีวิธีการวิเคราะห์อนุกรมเวลาหลายวิธี แต่วิธีที่สองที่รู้จักกันดีคือวิธีการถดถอยและวิธี Box-Jenkins (1976) หรือ ARIMA (AutoRegressive Integrated Moving Average) เอกสารนี้แนะนำวิธีการถดถอย ฉันพิจารณาวิธีการถดถอยที่เหนือกว่า ARIMA อย่างมากด้วยเหตุผลสามประการ

ฉันไม่เข้าใจว่า "วิธีการถดถอย" สำหรับอนุกรมเวลาอยู่บนเว็บไซต์อย่างไรและมันแตกต่างจากวิธี Box-Jenkins หรือวิธี ARIMA อย่างไร ฉันขอขอบคุณถ้ามีคนให้ข้อมูลเชิงลึกกับคำถามเหล่านั้น

ขอบคุณและขอแสดงความนับถือ!


2
คำตอบและความคิดเห็นส่วนใหญ่ที่นี่มุ่งเน้นไปที่คำถามที่เฉพาะเจาะจงมากขึ้นในตอนท้าย นี่เป็นเพียงการตั้งค่าสถานะว่าการวิเคราะห์อนุกรมเวลาเป็นอะไรที่มากไปกว่า Box-Jenkins หรือ ARIMA เขตข้อมูลทั้งหมดของการวิเคราะห์อนุกรมเวลามีโฟกัสที่แตกต่างกัน (หรืออย่างน้อยทั่วไปมากขึ้น) แบบจำลองส่วนประกอบที่ไม่ได้ตรวจสอบเป็นเพียงหนึ่งในหลายตัวอย่าง
Nick Cox

คำตอบ:


17

ฉันคิดว่านี่เป็นคำถามที่ดีและสมควรได้รับคำตอบ ลิงก์ที่ให้ไว้นี้เขียนโดยนักจิตวิทยาที่อ้างว่าวิธีการชงที่บ้านเป็นวิธีที่ดีกว่าในการวิเคราะห์อนุกรมเวลามากกว่า Box-Jenkins ฉันหวังว่าความพยายามของฉันในการตอบจะช่วยให้ผู้อื่นที่มีความรู้เกี่ยวกับอนุกรมเวลามากขึ้นมีส่วนร่วม

จากการแนะนำตัวของเขาดูเหมือนว่าดาร์ลิงตันจะเป็นผู้ชนะในการปรับโมเดล AR ให้เหมาะสมโดยใช้กำลังสองน้อยที่สุด นั่นคือถ้าคุณต้องการให้พอดีกับโมเดล กับอนุกรมเวลาคุณก็สามารถถอยหลังชุดในซีรีย์ด้วย lag , lagและอื่น ๆ จนถึง lagโดยใช้การถดถอยแบบพหุคูณสามัญ สิ่งนี้ได้รับอนุญาตอย่างแน่นอน; ใน R มันเป็นตัวเลือกในฟังก์ชั่น ฉันทดสอบมันออกมาและมันก็มีแนวโน้มที่จะให้คำตอบที่คล้ายกันกับวิธีการเริ่มต้นสำหรับการติดตั้งแบบจำลอง AR ใน Rz t z t 1 2 k

zt=α1zt1++αkztk+εt
ztzt12kar

นอกจากนี้เขายังสนับสนุนการถดถอยในสิ่งต่าง ๆ เช่นหรือพลังของเพื่อค้นหาแนวโน้ม อีกครั้งนี้เป็นเรื่องดีอย่างแน่นอน หนังสือชุดเวลาจำนวนมากพูดถึงเรื่องนี้เช่น Shumway-Stoffer และ Cowpertwait-Metcalfe โดยทั่วไปแล้วการวิเคราะห์อนุกรมเวลาอาจดำเนินการตามบรรทัดต่อไปนี้: คุณจะพบแนวโน้มนำออกแล้วพอดีกับโมเดลที่เหลือ t tzttt

แต่ดูเหมือนว่าเขายังเรียกร้องให้มีการปรับตัวมากเกินไปและจากนั้นใช้การลดข้อผิดพลาดเฉลี่ยระหว่างซีรีย์ที่ติดตั้งและข้อมูลเพื่อเป็นหลักฐานว่าวิธีการของเขานั้นดีกว่า ตัวอย่างเช่น:

ฉันรู้สึกว่า correlograms ล้าสมัยไปแล้ว จุดประสงค์หลักของพวกเขาคือเพื่อให้พนักงานคาดเดาว่าแบบจำลองใดจะเหมาะสมกับข้อมูลได้ดีที่สุด แต่ความเร็วของคอมพิวเตอร์สมัยใหม่ (อย่างน้อยก็ในการถดถอยหากไม่ได้อยู่ในอนุกรมเวลาแบบอนุกรม) ช่วยให้คนงานสามารถใส่แบบจำลองต่างๆ แต่ละอันลงตัวตามที่วัดได้จากค่าคลาดเคลื่อนกำลังสองเฉลี่ย [ปัญหาของการใช้อักษรตัวพิมพ์ใหญ่เมื่อมีโอกาสไม่เกี่ยวข้องกับตัวเลือกนี้เนื่องจากทั้งสองวิธีนั้นมีความอ่อนไหวต่อปัญหานี้อย่างเท่าเทียมกัน]

นี่ไม่ใช่ความคิดที่ดีเพราะการทดสอบของแบบจำลองนั้นควรจะมีความสามารถในการคาดการณ์ได้ดีเพียงใดและไม่เหมาะกับข้อมูลที่มีอยู่ ในตัวอย่างทั้งสามของเขาเขาใช้ "ข้อผิดพลาดรากค่าเฉลี่ยกำลังสองปรับ" เป็นเกณฑ์ของเขาสำหรับคุณภาพของความพอดี แน่นอน over-fitting model จะทำให้การประมาณค่าผิดพลาดในตัวอย่างเล็กลงดังนั้นการอ้างว่าโมเดลของเขานั้น "ดีกว่า" เพราะพวกเขามี RMSE ที่น้อยกว่านั้นผิด

โดยสรุปเนื่องจากเขาใช้เกณฑ์ที่ไม่ถูกต้องในการประเมินว่าแบบจำลองนั้นดีเพียงใดเขาจึงได้ข้อสรุปที่ผิดเกี่ยวกับการถดถอยกับ ARIMA ฉันจะลองดูว่าถ้าเขาทดสอบความสามารถในการทำนายของโมเดลแทน ARIMA ก็จะออกมาด้านบน บางทีคนที่สามารถลองถ้าพวกเขามีการเข้าถึงหนังสือเขากล่าวถึงที่นี่

[เพิ่มเติม: สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวคิดเรื่องการถดถอยคุณอาจต้องการตรวจสอบหนังสือชุดเวลาที่เก่ากว่าซึ่งเขียนขึ้นก่อนที่ ARIMA จะได้รับความนิยมสูงสุด ตัวอย่างเช่น Kendall, Time-Series , 1973, บทที่ 11 มีทั้งบทเกี่ยวกับวิธีการนี้และเปรียบเทียบกับ ARIMA]


คำถามคือความแตกต่าง (โดยธรรมชาติ) คืออะไร?
hbaghishani

เท่าที่ฉันสามารถบอกผู้เขียนไม่เคยอธิบายวิธีการปรุงที่บ้านของเขาในการตีพิมพ์ peer-reviewed และการอ้างอิงถึงและจากวรรณกรรมทางสถิติปรากฏน้อยที่สุดและสิ่งพิมพ์หลักของเขาในหัวข้อระเบียบวิธีวันที่กลับไปยุค 70 พูดอย่างเคร่งครัดไม่มีสิ่งใด "พิสูจน์" สิ่งนี้ แต่ไม่มีเวลาหรือความเชี่ยวชาญเพียงพอที่จะประเมินข้อเรียกร้องของตัวเองฉันจะลังเลอย่างยิ่งที่จะใช้มัน
งานกาล่า

@hbaghishani ความแตกต่างที่สำคัญคือข้อมูลที่เกี่ยวข้องอัตโนมัติเช่นในแต่ละชุดบิดเบือนการตีความสหสัมพันธ์ นอกจากนี้การละเมิดแบบเกาส์เช่นค่าเฉลี่ยคงที่ของความผิดพลาดความแปรปรวนคงที่ตลอดเวลาพารามิเตอร์คงที่ในช่วงเวลาที่ต้องได้รับการพิจารณา / แก้ไข
IrishStat

@flounderer ผู้คนเขียนหนังสือเพื่อขายและเก็บเกี่ยวรางวัล บางครั้งพวกเขารวมถึงวิธีการสมัยที่ถูกสอนอย่างไม่ถูกต้องเพราะบางวันก่อนหน้านี้พวกเขาคิดว่าถูกต้อง เพื่อเพิ่มยอดขายผู้เผยแพร่มักจะต้องการ (จากประสบการณ์ส่วนตัวของฉัน) ล้าสมัย แต่ไม่ถูกต้องเพราะวิธีการเหล่านี้อยู่ในหลักสูตร
IrishStat

@IrishStat การสร้างแบบจำลองข้อมูลที่เกี่ยวข้องอัตโนมัติสามารถทำได้โดยตัวแบบการถดถอยแบบไดนามิก นอกจากนี้โมเดลอื่น ๆ เช่นโมเดลผสมสามารถใช้กับข้อมูลดังกล่าวได้ ดังนั้นฉันไม่คิดว่าคุณสมบัตินี้จะแตกต่างอย่างมีนัยสำคัญ
hbaghishani

7

ศ. E. Parzen อาจจะค่อนข้างอิจฉาที่เขาไม่ได้เสนอวิธีการที่เป็นนวัตกรรมใหม่ของ Box and Jenkins แนะนำวิธีการนี้ให้กระชับมากขึ้นและจากนั้นก็ก้าวลงมา มันล้มเหลวด้วยเหตุผลหลายประการ (หลายแห่งที่ Flounderer สรุปไว้เป็นอย่างดี) รวมถึงการไม่ระบุและแก้ไขพัลส์การเลื่อนระดับพัลส์ตามฤดูกาลและแนวโน้มเวลาท้องถิ่น นอกจากนี้ยังต้องพิจารณาการเปลี่ยนแปลงพารามิเตอร์ในช่วงเวลาหรือการเปลี่ยนแปลงในข้อผิดพลาดในช่วงเวลา

ฉันเขียนชิ้นส่วนที่คุณอาจสนใจมันเรียกว่า "Regression vs Box-Jenkins" และมีให้บริการจากhttp://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-ถดถอย-VS-กล่องเจนกินส์

หนึ่งความคิดเห็นเกี่ยวกับขั้นตอนของดาร์ลิงตันที่สะท้อนเวลาเวลา * เวลาเวลา * เวลา * เวลา * เป็นตัวทำนาย ในกรณีที่ไม่มีการตรวจจับสิ่งรบกวนที่นำไปสู่การแยกเอฟเฟกต์จากภายนอกออกไปมันค่อนข้างเป็นไปได้ (และไม่ถูกต้อง!) เพื่อสรุปสำหรับพลังที่สูงขึ้นของเวลา ระวังนักสถิติที่ไม่ทำการวิเคราะห์ทางสถิติเพราะคุณต้องระวังนักสถิติที่ทำการผ่าตัดสมอง ในความเป็นธรรมเราอาจเพิ่มระวังนักสถิติ / นักอนุกรมอนุกรมที่ไม่ใช่เวลาซึ่งพยายามทำการวิเคราะห์อนุกรมเวลาด้วยการฝึกอบรมที่ จำกัด ในการวิเคราะห์อนุกรมเวลา

ผู้โพสต์อื่น ๆ (โดยเฉพาะ whuber) ในรายการนี้ได้เตือนซ้ำ ๆ เกี่ยวกับการใช้ "วิธีการกระชับ" นี้ส่วนใหญ่อยู่ในสภาพแวดล้อมที่ไม่เปลี่ยนแปลง คำเตือนนี้ใช้กับโมเดลเชิงสาเหตุด้วย

หวังว่านี่จะช่วยได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.