คำถามติดแท็ก var

Vector Auto-Regression แบบจำลอง / วิธีอนุกรมเวลาหลายชุด VAR เป็นเรื่องปกติในเศรษฐมิติและอนุญาตให้อนุกรมเวลาแต่ละชุดสร้างแบบจำลองตามค่าก่อนหน้าของตัวมันเองและรวมถึงค่าก่อนหน้าของแต่ละอนุกรมพร้อมกัน ดังนั้นชุดนี้จึงได้รับสถานะที่เท่าเทียมกัน

5
อะไรคือข้อเสียของตัวแบบพื้นที่รัฐและตัวกรองคาลมานสำหรับการสร้างแบบจำลองอนุกรมเวลา?
จากคุณสมบัติที่ดีทั้งหมดของแบบจำลองพื้นที่รัฐและ KF ฉันสงสัยว่าอะไรคือข้อเสียของการสร้างแบบจำลองพื้นที่ของรัฐและการใช้ตัวกรองคาลมาน (หรือ EKF, UKF หรือตัวกรองอนุภาค) สำหรับการประเมิน? เอาเป็นว่าสมมุติฐานของวิธีการทั่วไปเช่นวิธี ARIMA, VAR หรือ ad-hoc / heuristic พวกเขายากที่จะสอบเทียบ? พวกเขาซับซ้อนและยากหรือไม่ที่จะเห็นว่าการเปลี่ยนแปลงโครงสร้างของแบบจำลองจะส่งผลกระทบต่อการทำนายอย่างไร หรือกล่าวอีกนัยหนึ่ง - ข้อดีของ ARIMA ทั่วไปคืออะไร VAR สำหรับรุ่นของรัฐ ฉันสามารถคิดได้เฉพาะข้อดีของแบบจำลองพื้นที่รัฐ: มันสามารถจัดการการแตกโครงสร้างการกะพารามิเตอร์ที่แปรผันตามเวลาของแบบจำลองบางแบบได้อย่างง่ายดายเพียงแค่ทำให้พารามิเตอร์เหล่านั้นเป็นสถานะแบบไดนามิกของแบบจำลองพื้นที่รัฐและตัวแบบจะปรับให้เข้ากับการเปลี่ยนแปลงใด ๆ ในพารามิเตอร์โดยอัตโนมัติ มันจัดการข้อมูลที่ขาดหายไปอย่างเป็นธรรมชาติเพียงแค่ทำขั้นตอนการเปลี่ยนแปลงของ KF และไม่ทำขั้นตอนการอัปเดต มันช่วยให้สามารถเปลี่ยนพารามิเตอร์ on-a-fly ของแบบจำลองพื้นที่ของรัฐเอง (โควาเรียสของเสียงและเมทริกซ์การเปลี่ยนผ่าน / การสังเกต) ดังนั้นหากการสังเกตปัจจุบันของคุณมาจากแหล่งที่แตกต่างกันเล็กน้อยกว่าอื่น ๆ - คุณสามารถรวม มีอะไรพิเศษไหม; การใช้คุณสมบัติด้านบนช่วยให้สามารถจัดการข้อมูลที่เว้นระยะไม่สม่ำเสมอได้ง่าย: เปลี่ยนโมเดลในแต่ละครั้งตามช่วงเวลาระหว่างการสังเกตหรือใช้ช่วงเวลาปกติและจัดการช่วงเวลาโดยไม่ต้องสังเกตว่าเป็นข้อมูลที่ขาดหายไป อนุญาตให้ใช้ข้อมูลจากแหล่งต่าง ๆ พร้อมกันในรูปแบบเดียวกันเพื่อประมาณปริมาณหนึ่งพื้นฐาน จะช่วยให้การสร้างแบบจำลองจากหลายinterpretableส่วนประกอบแบบไดนามิกสำรวจและประเมินพวกเขา; โมเดล ARIMA …

9
ทำไมต้องใช้โมเดลการแก้ไขข้อผิดพลาดเวกเตอร์
ฉันสับสนเกี่ยวกับรูปแบบการแก้ไขข้อผิดพลาดของเวกเตอร์ ( VECM ) พื้นหลังทางเทคนิค: VECMนำเสนอความเป็นไปได้ในการใช้Vector Autoregressive Model ( VAR ) กับอนุกรมเวลาหลายตัวแปรในตัว ในตำราเรียนพวกเขาตั้งชื่อปัญหาบางอย่างในการใช้VARกับอนุกรมเวลาแบบบูรณาการสิ่งสำคัญที่สุดคือการถดถอยแบบเผด็จการ กระบวนการประเมินVECMประกอบด้วยขั้นตอนสามขั้นตอนต่อไปนี้ซึ่งเป็นขั้นตอนที่สับสนสำหรับฉันขั้นตอนแรก: ข้อมูลจำเพาะและการประมาณค่าของโมเดลVARสำหรับอนุกรมเวลาหลายตัวแปรรวม คำนวณการทดสอบอัตราส่วนความน่าจะเป็นเพื่อกำหนดจำนวนความสัมพันธ์ของการมีส่วนร่วม หลังจากกำหนดจำนวน cointegrations ให้ประเมินVECM ในขั้นตอนแรกหนึ่งประมาณการแบบจำลองVAR ที่มีจำนวนของความล่าช้าที่เหมาะสม (ใช้ความดีปกติของเกณฑ์พอดี) และตรวจสอบว่าส่วนที่เหลือสอดคล้องกับสมมติฐานของแบบจำลองหรือไม่นั่นคือการไม่มีความสัมพันธ์แบบอนุกรมและความสัมพันธ์แบบ heteroscedasticity . ดังนั้นหนึ่งการตรวจสอบว่ารูปแบบVARอย่างเหมาะสมอธิบายอนุกรมเวลาหลายตัวแปรและหนึ่งดำเนินการเพื่อขั้นตอนต่อไปถ้ามันเป็นเท่านั้น และตอนนี้สำหรับคำถามของฉัน: ถ้าแบบจำลองVARอธิบายข้อมูลได้ดีทำไมฉันต้องใช้VECMเลย? หากเป้าหมายของฉันคือการสร้างการคาดการณ์มันไม่เพียงพอที่จะประเมินVARและตรวจสอบสมมติฐานและถ้าพวกเขาบรรลุเป้าหมายเพียงใช้โมเดลนี้

2
วิธีการพยากรณ์ VAR
ฉันกำลังสร้างแบบจำลอง VAR เพื่อคาดการณ์ราคาของสินทรัพย์และต้องการทราบว่าวิธีการของฉันดีขึ้นหรือไม่ไม่ว่าการทดสอบที่ฉันได้รวมไว้นั้นมีความเกี่ยวข้องหรือไม่และจำเป็นต้องมีอีกหรือไม่ ด้านล่างนี้เป็นกระบวนการปัจจุบันของฉันเพื่อตรวจสอบหาสาเหตุของเกรนเจอร์และคาดการณ์รูปแบบ VAR ที่เลือก require("forecast") require("vars") #Read Data da=read.table("VARdata.txt", header=T) dac <- c(2,3) # Select variables x=da[,dac] plot.ts(x) summary(x) #Run Augmented Dickey-Fuller tests to determine stationarity and differences to achieve stationarity. ndiffs(x[, "VAR1"], alpha = 0.05, test = c("adf")) ndiffs(x[, "VAR2"], alpha = 0.05, test = c("adf")) #Difference …
19 r  forecasting  modeling  var 

1
วิธีโง่อย่างน้อยที่สุดในการทำนายอนุกรมเวลาแบบหลายตัวแปรสั้น ๆ
ฉันจำเป็นต้องคาดการณ์ตัวแปร 4 ตัวต่อไปนี้สำหรับหน่วยเวลาที่ 29 ฉันมีข้อมูลประวัติศาสตร์ประมาณ 2 ปีโดยที่ 1 และ 14 และ 27 เป็นช่วงเวลาเดียวกันทั้งหมด (หรือช่วงเวลาของปี) ในท้ายที่สุดฉันทำสลายตัวสไตล์โออาซากา-Blinder ใน , W D , W คและพีWWWW dWdwdW คWคwcพีพีp time W wd wc p 1 4.920725 4.684342 4.065288 .5962985 2 4.956172 4.73998 4.092179 .6151785 3 4.85532 4.725982 4.002519 .6028712 4 4.754887 4.674568 3.988028 .5943888 5 …

1
อนุกรมเวลาหลายตัวแปรชีวภาพ: VAR และฤดูกาล
ฉันมีชุดข้อมูลอนุกรมเวลาหลายตัวแปรรวมถึงตัวแปรชีวภาพและสิ่งแวดล้อมที่มีปฏิสัมพันธ์ (รวมถึงตัวแปรภายนอกบางอย่าง) นอกจากฤดูกาลแล้วไม่มีข้อมูลในระยะยาวที่ชัดเจน จุดประสงค์ของฉันคือการดูว่าตัวแปรใดบ้างที่เกี่ยวข้องกัน การคาดการณ์นั้นไม่ได้ถูกมองหา เป็นเรื่องใหม่สำหรับการวิเคราะห์อนุกรมเวลาฉันอ่านการอ้างอิงหลายอย่าง เท่าที่ฉันเข้าใจโมเดล Vector Autoregressive (VAR) จะเหมาะสม แต่ฉันรู้สึกไม่สะดวกกับฤดูกาลและตัวอย่างส่วนใหญ่ที่ฉันพบในสาขาเศรษฐศาสตร์ที่เกี่ยวข้อง (บ่อยครั้งกับการวิเคราะห์อนุกรมเวลา ... ) โดยไม่มีฤดูกาล ฉันควรทำอย่างไรกับข้อมูลตามฤดูกาลของฉัน ฉันถือว่าพวกเขา deseasonalizing - ตัวอย่างเช่นใน R ฉันจะใช้decomposeแล้วใช้$trend + $randค่าเพื่อรับสัญญาณที่ปรากฏนิ่งสวย (ตามการตัดสินต่อacf) ผลลัพธ์ของแบบจำลอง VAR ทำให้ฉันสับสน (แบบจำลองแบบ 1-lag ถูกเลือกในขณะที่ฉันคาดหวังอย่างสังหรณ์ใจมากขึ้นและมีค่าสัมประสิทธิ์สำหรับการตอบโต้อัตโนมัติเท่านั้น ฉันกำลังทำอะไรผิดหรือฉันควรสรุปว่าตัวแปรของฉันไม่เกี่ยวข้อง (เป็นเส้นตรง) / โมเดลของฉันไม่ใช่คำถามที่ดี (คำถามย่อย: มี VAR ที่ไม่ใช่เชิงเส้นเทียบเท่าหรือไม่) [อีกวิธีหนึ่งฉันอ่านฉันอาจใช้ตัวแปรตามฤดูกาลได้แม้ว่าฉันจะไม่สามารถทราบได้ว่าจะนำไปใช้อย่างไร] คำแนะนำทีละขั้นตอนจะได้รับการชื่นชมอย่างมากเนื่องจากรายละเอียดสำหรับผู้ใช้ที่มีประสบการณ์อาจให้ข้อมูลกับฉัน (และตัวอย่างโค้ด R หรือลิงก์ไปยังตัวอย่างที่เป็นรูปธรรมยินดีต้อนรับแน่นอน)

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

2
วิธีสร้างแบบจำลองเดือนต่อเดือนผลกระทบในข้อมูลอนุกรมเวลารายวัน?
ฉันมีชุดข้อมูลรายวันสองชุด หนึ่งคือsign-upsและอื่น ๆterminationsของการสมัครสมาชิก ฉันต้องการทำนายหลังโดยใช้ข้อมูลที่มีอยู่ในตัวแปรทั้งสอง เมื่อมองดูกราฟของซีรี่ส์เหล่านี้เห็นได้ชัดว่าการเลิกจ้างมีความสัมพันธ์กับการลงชื่อสมัครเข้าใช้หลายรายการก่อนหน้านี้หลายเดือน นั่นคือการขัดขวางการลงชื่อสมัครใช้ในวันที่ 10 พฤษภาคมจะนำไปสู่การเพิ่มขึ้นของการยุติในวันที่ 10 มิถุนายน 10 กรกฎาคมและ 10 สิงหาคมเป็นต้นไปแม้ว่าผลจะหมดไป ฉันหวังว่าจะได้คำใบ้ว่าฉันควรใช้แบบจำลองรุ่นใดเพื่อแก้ปัญหาเฉพาะนี้ คำแนะนำใด ๆ ที่จะได้รับการชื่นชมมาก .. จนถึงตอนนี้ฉันกำลังคิดแบบจำลอง VAR แต่ฉันไม่แน่ใจว่าจะรวมเอฟเฟกต์รายเดือนอย่างไรให้ใช้คำสั่งล่าช้าสูงมากหรือเพิ่มองค์ประกอบตามฤดูกาลอย่างใด

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
เหตุใดโมเดล VAR ของฉันจึงทำงานได้ดีกว่ากับข้อมูลที่ไม่ใช่เครื่องเขียนมากกว่าข้อมูลที่อยู่กับที่?
ฉันใช้ไลบรารี่ VAR ของ Python ในการสร้างแบบจำลองข้อมูลอนุกรมเวลาการเงินและผลลัพธ์บางอย่างทำให้ฉันงงงวย ฉันรู้ว่าแบบจำลอง VAR ถือว่าข้อมูลอนุกรมเวลาอยู่กับที่ ฉันบังเอิญใส่ราคาล็อกที่ไม่คงที่สำหรับหลักทรัพย์สองชุดที่แตกต่างกันโดยไม่ตั้งใจและน่าประหลาดใจที่ค่าติดตั้งและการคาดการณ์ในตัวอย่างนั้นมีความแม่นยำมาก R2R2R^2 ในการพยากรณ์ในตัวอย่างคือ 99% และค่าเบี่ยงเบนมาตรฐานของซีรีส์ส่วนที่เหลือที่คาดการณ์อยู่ที่ประมาณ 10% ของค่าการคาดการณ์ อย่างไรก็ตามเมื่อฉันแตกต่างราคาบันทึกและปรับให้พอดีกับอนุกรมเวลานั้นกับรุ่น VAR ค่าติดตั้งและการคาดการณ์จะอยู่ไกลจากเครื่องหมายซึ่งอยู่ในระยะที่แคบโดยรอบค่าเฉลี่ย เป็นผลให้ส่วนที่เหลือทำการคาดการณ์งานได้ดีกว่าค่าที่ติดตั้งพร้อมกับส่วนเบี่ยงเบนมาตรฐานของส่วนที่เหลือที่คาดการณ์ 15X ที่ใหญ่กว่าชุดข้อมูลที่ติดตั้งแล้วเป็น. 007R2R2R^2 ค่าสำหรับชุดการคาดการณ์ ฉันตีความผิดกับสิ่งที่ติดอยู่กับรุ่น VAR หรือทำให้เกิดข้อผิดพลาดอื่น ๆ หรือไม่? เหตุใดอนุกรมเวลาที่ไม่หยุดนิ่งจะส่งผลให้การคาดการณ์มีความแม่นยำมากขึ้นกว่าอนุกรมที่อยู่กับที่โดยอ้างอิงจากข้อมูลพื้นฐานเดียวกัน ฉันทำงานได้ดีกับรุ่น ARMA จากคลังหลามเดียวกันและไม่เห็นอะไรเหมือนการสร้างแบบจำลองข้อมูลชุดเดียว

6
วิธีประมาณฟังก์ชั่นการตอบกลับอัตโนมัติของเวกเตอร์ & การตอบสนองต่อแรงกระตุ้นด้วยข้อมูลพาเนล
ฉันกำลังทำงานกับการประมาณเวกเตอร์การถดถอยอัตโนมัติ (VARs) และการประมาณค่าฟังก์ชันตอบสนองต่อแรงกระตุ้น (IRF) ตามข้อมูลพาเนลกับบุคคล 33 คนใน 77 ไตรมาส สถานการณ์ประเภทนี้ควรวิเคราะห์อย่างไร มีอัลกอริทึมอะไรอยู่สำหรับจุดประสงค์นี้ ฉันต้องการดำเนินการวิเคราะห์เหล่านี้ใน R ดังนั้นหากใครคุ้นเคยกับรหัส R หรือแพ็คเกจที่ออกแบบมาเพื่อจุดประสงค์นี้ที่พวกเขาสามารถแนะนำได้นั่นจะเป็นประโยชน์อย่างยิ่ง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.