การติดตั้งการถดถอยเชิงเส้นหลายเส้นใน R: เศษเหลือที่เกี่ยวข้องโดยอัตโนมัติ


11

ฉันพยายามประเมินการถดถอยเชิงเส้นแบบหลายค่าใน R ด้วยสมการดังนี้

regr <- lm(rate ~ constant + askings + questions + 0)

askings askings <- ts(...)และคำถามที่มีข้อมูลอนุกรมเวลารายไตรมาสสร้างด้วย

ปัญหาตอนนี้คือฉันได้รับส่วนที่เหลือโดยอัตโนมัติ ฉันรู้ว่าเป็นไปได้ที่จะปรับให้พอดีกับการถดถอยโดยใช้ฟังก์ชัน gls แต่ฉันไม่รู้วิธีระบุโครงสร้างข้อผิดพลาด AR หรือ ARMA ที่ถูกต้องซึ่งฉันต้องนำไปใช้ในฟังก์ชัน gls

ฉันจะลองประเมินอีกครั้งในตอนนี้ด้วย

gls(rate ~ constant + askings + questions + 0, correlation=corARMA(p=?,q=?))

แต่น่าเสียดายที่ฉันไม่ใช่ผู้เชี่ยวชาญ R หรือผู้เชี่ยวชาญทางสถิติโดยทั่วไปในการระบุ p และ q

ฉันจะพอใจถ้ามีคนให้คำแนะนำที่เป็นประโยชน์กับฉัน ขอบคุณล่วงหน้า!

โจ

คำตอบ:


8

ลอง

library(forecast)
fit <- auto.arima(rate, xreg=cbind(askings,questions))

นั่นจะพอดีกับโมเดลเชิงเส้นตามที่จะระบุโครงสร้าง ARMA โดยอัตโนมัติสำหรับข้อผิดพลาด มันใช้ MLE มากกว่า GLS แต่จะเทียบเท่ากับแบบไม่แสดงอาการ


สิ่งนี้มีประโยชน์มาก
Olga Mu

3

หากการคาดการณ์เป็นเป้าหมายของคุณคุณสามารถใส่โมเดลหลายแบบไว้เหนือพารามิเตอร์:

expand.grid(p = 1:P, q = 1:Q)

โดยที่PและQเป็นคำศัพท์ AR (p) และ MA (q) สูงสุดที่คุณต้องการรวมและเลือกรูปแบบการกระชับที่สุดตามที่ BIC กำหนด

auto.arima()ในการคาดการณ์แพ็กเกจจะช่วยในเรื่องนี้ แต่สามารถเขียนโค้ดได้อย่างง่ายดายด้วยมือโดยใช้expand.grid()และวนรอบและarima()ฟังก์ชั่นที่มาพร้อมกับ R

ด้านบนเป็นข้อต่อของส่วนที่gls()ไม่มีcorrelationโครงสร้าง

นอกจากนี้คุณยังสามารถทำสิ่งทั้งหมดด้วยมือโดยตรงgls()โดยเพียงแค่ปรับรุ่นจำนวนมากสำหรับการรวมกันของpและqในAIC()ฟังก์ชั่นที่สร้างขึ้น

คุณสามารถพล็อต ACF ( acf()) และACF ( ) บางส่วนpacf()ของส่วนที่เหลือจากตัวแบบเชิงเส้นโดยไม่มีโครงสร้างความสัมพันธ์และใช้เพื่อแนะนำลำดับของแบบจำลองที่ต้องการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.