คำถามติดแท็ก seasonality

ฤดูกาลหมายถึงความผันผวนที่เกิดขึ้นซ้ำ ๆ รอบ ๆ ค่าเฉลี่ยของอนุกรมเวลาในช่วงเวลาที่กำหนดโดยปกติจะเป็นปีปฏิทิน

6
วิธีใดที่สามารถใช้เพื่อตรวจสอบฤดูกาลในข้อมูล
ฉันต้องการตรวจสอบฤดูกาลตามข้อมูลที่ฉันได้รับ มีวิธีการบางอย่างที่ฉันพบเช่นพล็อตย่อยตามฤดูกาลและพล็อตออโต้คอร์เรชั่น แต่สิ่งที่ฉันไม่เข้าใจวิธีการอ่านกราฟทุกคนสามารถช่วยได้หรือไม่ อีกวิธีคือมีวิธีอื่นในการตรวจสอบฤดูกาลที่มีหรือไม่มีผลสุดท้ายในกราฟ?

4
นี่เป็นวิธีที่เหมาะสมในการทดสอบผลกระทบตามฤดูกาลในข้อมูลการนับการฆ่าตัวตายหรือไม่?
ฉันมีข้อมูลใบรับรองการเสียชีวิต 17 ปี (1995 ถึง 2011) ที่เกี่ยวข้องกับการฆ่าตัวตายของรัฐในสหรัฐอเมริกามีตำนานมากมายเกี่ยวกับการฆ่าตัวตายและเดือน / ฤดูกาลจำนวนมากที่ขัดแย้งกันและวรรณกรรมที่ฉัน ' ที่ผ่านมาฉันไม่เข้าใจวิธีการที่ใช้หรือความมั่นใจในผลลัพธ์ ดังนั้นฉันจึงออกเดินทางเพื่อดูว่าฉันสามารถตัดสินได้หรือไม่ว่าการฆ่าตัวตายมีแนวโน้มที่จะเกิดขึ้นมากหรือน้อยในเดือนใดก็ตามภายในชุดข้อมูลของฉัน การวิเคราะห์ทั้งหมดของฉันเสร็จสิ้นใน R จำนวนการฆ่าตัวตายทั้งหมดในข้อมูลคือ 13,909 หากคุณดูปีที่มีการฆ่าตัวตายน้อยที่สุดพวกเขาจะเกิดขึ้นใน 309/365 วัน (85%) หากคุณดูปีที่มีการฆ่าตัวตายมากที่สุดพวกเขาจะเกิดขึ้นใน 339/365 วัน (93%) ดังนั้นจึงมีจำนวนวันที่ยุติธรรมในแต่ละปีโดยไม่มีการฆ่าตัวตาย อย่างไรก็ตามเมื่อรวมกันตลอดทั้ง 17 ปีมีการฆ่าตัวตายในทุกวันของปีรวมถึงวันที่ 29 กุมภาพันธ์ (แม้ว่าจะเพียง 5 เมื่อเฉลี่ย 38) เพียงแค่เพิ่มจำนวนการฆ่าตัวตายในแต่ละวันของปีไม่ได้บ่งบอกถึงฤดูกาลที่ชัดเจน (ในสายตาของฉัน) เมื่อรวมกันในระดับรายเดือนการฆ่าตัวตายเฉลี่ยต่อเดือนมีตั้งแต่: (m = 65, sd = 7.4, ถึง m = 72, sd = 11.1) …

3
การวิเคราะห์อนุกรมเวลารายวัน
ฉันกำลังพยายามทำการวิเคราะห์อนุกรมเวลาและยังใหม่กับฟิลด์นี้ ฉันมีการนับเหตุการณ์ทุกวันตั้งแต่ปี 2549-2552 และฉันต้องการให้พอดีกับแบบจำลองอนุกรมเวลา นี่คือความก้าวหน้าที่ฉันได้ทำ: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) พล็อตผลที่ฉันได้รับคือ: เพื่อตรวจสอบว่ามีฤดูกาลและแนวโน้มในข้อมูลหรือไม่ฉันทำตามขั้นตอนที่กล่าวถึงในโพสต์นี้: ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) seasonal และในบล็อกของ Rob J Hyndman : library(fma) fit1 <- ets(x) fit2 <- ets(x,model="ANN") deviance <- 2*c(logLik(fit1) - logLik(fit2)) df <- attributes(logLik(fit1))$df - attributes(logLik(fit2))$df #P value 1-pchisq(deviance,df) ทั้งสองกรณีระบุว่าไม่มีฤดูกาล เมื่อฉันพล็อต ACF & PACF ของซีรีส์นี่คือสิ่งที่ฉันได้รับ: …

3
Auto.arima พร้อมข้อมูลรายวัน: วิธีจับฤดูกาลและช่วงเวลา
ฉันเหมาะสมกับโมเดล ARIMA ในซีรีย์เวลารายวัน ข้อมูลจะถูกรวบรวมทุกวันตั้งแต่ 02-01-2010 ถึง 30-07-2011 และเกี่ยวกับการขายหนังสือพิมพ์ เนื่องจากสามารถหารูปแบบการขายรายสัปดาห์ได้ (โดยปกติปริมาณการขายต่อวันโดยทั่วไปจะเหมือนกันทุกวันจันทร์ถึงศุกร์จากนั้นเพิ่มขึ้นในวันเสาร์และวันอาทิตย์) ฉันพยายามจับภาพ "ฤดูกาล" นี้ รับข้อมูลการขาย "ข้อมูล" ฉันสร้างอนุกรมเวลาดังนี้ salests<-ts(data,start=c(2010,1),frequency=365) จากนั้นฉันใช้ฟังก์ชั่น auto.arima (.) เพื่อเลือกรุ่น ARIMA ที่ดีที่สุดผ่านเกณฑ์ AIC ผลลัพธ์จะเป็นโมเดล ARIMA ที่ไม่ใช่ฤดูกาลเสมอ แต่ถ้าฉันลองใช้แบบจำลอง SARIMAs ด้วยไวยากรณ์ต่อไปนี้เป็นตัวอย่าง: sarima1<-arima(salests, order = c(2,1,2), seasonal = list(order = c(1, 0, 1), period = 7)) ฉันสามารถรับผลลัพธ์ที่ดีกว่า มีอะไรผิดปกติในข้อกำหนดคุณสมบัติคำสั่ง ts / arima หรือไม่ …

2
การเลือกวิธีการสลายตัวตามฤดูกาล
การปรับตามฤดูกาลเป็นขั้นตอนสำคัญในการประมวลผลข้อมูลล่วงหน้าเพื่อการวิจัยเพิ่มเติม อย่างไรก็ตามนักวิจัยมีตัวเลือกมากมายสำหรับการแยกย่อยของแนวโน้มตามฤดูกาล ที่พบมากที่สุด (ตัดสินโดยจำนวนของการอ้างอิงในวรรณคดีเชิงประจักษ์) คู่แข่งวิธีการสลายตัวตามฤดูกาล X-11 (12) -ARIMA, TRAMO / ที่นั่ง (ทั้งการดำเนินการในDemetra + ) และ 's STL การค้นหาเพื่อหลีกเลี่ยงการสุ่มเลือกระหว่างเทคนิคการสลายตัวที่กล่าวถึงข้างต้น (หรือวิธีการง่าย ๆ เช่นตัวแปรตัวแปรตามฤดูกาล) ฉันต้องการทราบกลยุทธ์พื้นฐานที่นำไปสู่การเลือกวิธีการสลายตัวตามฤดูกาลได้อย่างมีประสิทธิภาพRRR คำถามย่อยที่สำคัญหลายอย่าง (ยินดีต้อนรับลิงก์ไปยังการสนทนาด้วย) อาจเป็น: อะไรคือความเหมือนและความแตกต่างจุดแข็งและจุดอ่อนของวิธีการคืออะไร? มีกรณีพิเศษหรือไม่เมื่อวิธีการหนึ่งเป็นที่นิยมมากกว่าวิธีอื่น? คุณสามารถให้คำแนะนำทั่วไปกับสิ่งที่อยู่ในกล่องดำของวิธีการสลายตัวที่แตกต่างกันได้อย่างไร มีเทคนิคพิเศษในการเลือกพารามิเตอร์สำหรับวิธีการ (ฉันไม่พอใจกับค่าเริ่มต้นเสมอstlตัวอย่างเช่นมีพารามิเตอร์จำนวนมากที่ต้องจัดการกับบางครั้งฉันรู้สึกว่าฉันไม่รู้วิธีเลือกสิ่งเหล่านี้อย่างถูกวิธี) เป็นไปได้หรือไม่ที่จะแนะนำเกณฑ์บางอย่าง (สถิติ) ว่าอนุกรมเวลาได้รับการปรับตามฤดูกาลอย่างมีประสิทธิภาพ (การวิเคราะห์ความสัมพันธ์, ความหนาแน่นของสเปกตรัมหรือไม่? เกณฑ์ขนาดตัวอย่างขนาดเล็ก - ความทนทาน?)

1
ปัญหาในการกำหนดลำดับ ARIMA
นี่คือการโพสต์ยาวดังนั้นฉันหวังว่าคุณจะสามารถทนกับฉันและโปรดแก้ไขฉันในที่ที่ฉันผิด เป้าหมายของฉันคือการสร้างการคาดการณ์รายวันโดยใช้ข้อมูลย้อนหลัง 3 หรือ 4 สัปดาห์ ข้อมูลนี้เป็นข้อมูล 15 นาทีของภาระในท้องถิ่นของหนึ่งในสายหม้อแปลง ฉันมีปัญหาในการค้นหาลำดับโมเดลของกระบวนการ ARIMA ตามฤดูกาล พิจารณาอนุกรมเวลาความต้องการไฟฟ้า: ซีรี่ส์เวลาดั้งเดิม http://i.share.pho.to/80d86574_l.png เมื่อ 3 สัปดาห์แรกจะถูกนำมาเป็นส่วนย่อยและทำการแปลงแปลง follwing ACF / PACF ที่แตกต่างกัน: เซตย่อย http://i.share.pho.to/5c165aef_l.png ความแตกต่างแรก http://i.share.pho.to/b7300cc2_l.png ความแตกต่างของฤดูกาลและครั้งแรก http://i.share.pho.to/570c5397_l.png ดูเหมือนว่าซีรีส์นี้จะหยุดนิ่ง แต่ฤดูกาลอาจเป็นรายสัปดาห์ (ดูสัปดาห์ที่แตกต่างตามฤดูกาลและลำดับที่สอง [ที่นี่] http://share.pho.to/3owoqคุณคิดอย่างไร) A R IMA ( p , 1 , q) ( P, 1 , Q )96ARผมMA(พี,1,Q)(P,1,Q)96 ARIMA(p,1,q)(P,1,Q)_{96} …

1
เกณฑ์การตั้งค่า STL s.window width
ใช้Rเพื่อทำการแยกสลาย STL s.windowควบคุมความรวดเร็วขององค์ประกอบตามฤดูกาลที่สามารถเปลี่ยนแปลงได้ ค่าขนาดเล็กช่วยให้การเปลี่ยนแปลงรวดเร็วยิ่งขึ้น การตั้งค่าหน้าต่างตามฤดูกาลให้เป็นอนันต์เทียบเท่ากับการบังคับให้ส่วนประกอบตามฤดูกาลเป็นคาบ (กล่าวคือเหมือนกันทุกปี) คำถามของฉัน: ถ้าผมมีเวลาแบบรายเดือน (ที่มีความถี่เท่ากับ ) สิ่งที่เกณฑ์ควรจะใช้ชุด?121212s.window มีการเชื่อมโยงระหว่างความถี่นั้นกับอนุกรมเวลาหรือไม่

1
อนุกรมเวลาหลายตัวแปรชีวภาพ: VAR และฤดูกาล
ฉันมีชุดข้อมูลอนุกรมเวลาหลายตัวแปรรวมถึงตัวแปรชีวภาพและสิ่งแวดล้อมที่มีปฏิสัมพันธ์ (รวมถึงตัวแปรภายนอกบางอย่าง) นอกจากฤดูกาลแล้วไม่มีข้อมูลในระยะยาวที่ชัดเจน จุดประสงค์ของฉันคือการดูว่าตัวแปรใดบ้างที่เกี่ยวข้องกัน การคาดการณ์นั้นไม่ได้ถูกมองหา เป็นเรื่องใหม่สำหรับการวิเคราะห์อนุกรมเวลาฉันอ่านการอ้างอิงหลายอย่าง เท่าที่ฉันเข้าใจโมเดล Vector Autoregressive (VAR) จะเหมาะสม แต่ฉันรู้สึกไม่สะดวกกับฤดูกาลและตัวอย่างส่วนใหญ่ที่ฉันพบในสาขาเศรษฐศาสตร์ที่เกี่ยวข้อง (บ่อยครั้งกับการวิเคราะห์อนุกรมเวลา ... ) โดยไม่มีฤดูกาล ฉันควรทำอย่างไรกับข้อมูลตามฤดูกาลของฉัน ฉันถือว่าพวกเขา deseasonalizing - ตัวอย่างเช่นใน R ฉันจะใช้decomposeแล้วใช้$trend + $randค่าเพื่อรับสัญญาณที่ปรากฏนิ่งสวย (ตามการตัดสินต่อacf) ผลลัพธ์ของแบบจำลอง VAR ทำให้ฉันสับสน (แบบจำลองแบบ 1-lag ถูกเลือกในขณะที่ฉันคาดหวังอย่างสังหรณ์ใจมากขึ้นและมีค่าสัมประสิทธิ์สำหรับการตอบโต้อัตโนมัติเท่านั้น ฉันกำลังทำอะไรผิดหรือฉันควรสรุปว่าตัวแปรของฉันไม่เกี่ยวข้อง (เป็นเส้นตรง) / โมเดลของฉันไม่ใช่คำถามที่ดี (คำถามย่อย: มี VAR ที่ไม่ใช่เชิงเส้นเทียบเท่าหรือไม่) [อีกวิธีหนึ่งฉันอ่านฉันอาจใช้ตัวแปรตามฤดูกาลได้แม้ว่าฉันจะไม่สามารถทราบได้ว่าจะนำไปใช้อย่างไร] คำแนะนำทีละขั้นตอนจะได้รับการชื่นชมอย่างมากเนื่องจากรายละเอียดสำหรับผู้ใช้ที่มีประสบการณ์อาจให้ข้อมูลกับฉัน (และตัวอย่างโค้ด R หรือลิงก์ไปยังตัวอย่างที่เป็นรูปธรรมยินดีต้อนรับแน่นอน)

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
การพยากรณ์อนุกรมเวลารายชั่วโมงโดยมีรายวันรายสัปดาห์และรายปี
การแก้ไขที่สำคัญ: ฉันต้องการจะพูดขอบคุณมากสำหรับเดฟและนิคจนถึงตอนนี้สำหรับคำตอบของพวกเขา ข่าวดีก็คือฉันได้วนไปทำงาน (หลักการยืมมาจากโพสต์ของศ. Hydnman ในการพยากรณ์ชุด) ในการรวมการสืบค้นที่คงค้าง: a) ฉันจะเพิ่มจำนวนการทำซ้ำสูงสุดสำหรับ auto.arima ได้อย่างไร - ดูเหมือนว่ามีตัวแปรภายนอกจำนวนมาก auto.arima กำลังกดปุ่มการทำซ้ำสูงสุดก่อนที่จะมาบรรจบกับรุ่นสุดท้าย โปรดแก้ไขฉันหากฉันเข้าใจผิด b) หนึ่งคำตอบจาก Nick เน้นว่าการคาดคะเนของฉันสำหรับช่วงเวลารายชั่วโมงนั้นมาจากช่วงเวลารายชั่วโมงเท่านั้นและไม่ได้รับอิทธิพลจากเหตุการณ์ที่เกิดขึ้นก่อนหน้านี้ในวันนั้น สัญชาตญาณของฉันจากการจัดการกับข้อมูลนี้บอกฉันว่าสิ่งนี้ไม่ควรทำให้เกิดปัญหาสำคัญ แต่ฉันเปิดรับข้อเสนอแนะเกี่ยวกับวิธีจัดการกับสิ่งนี้ c) เดฟชี้ให้เห็นว่าฉันต้องการวิธีการที่ซับซ้อนกว่านี้ในการระบุเวลารอคอย / เวลาล่าช้าโดยรอบตัวแปรตัวทำนายของฉัน ใครบ้างมีประสบการณ์กับวิธีการเขียนโปรแกรมนี้ใน R? ฉันคาดหวังว่าจะมีข้อ จำกัด แต่ฉันต้องการใช้โครงการนี้ให้ไกลที่สุดเท่าที่จะทำได้และฉันไม่สงสัยเลยว่าสิ่งนี้จะต้องใช้กับผู้อื่นที่นี่เช่นกัน d) แบบสอบถามใหม่ แต่เกี่ยวข้องกับงานที่ทำโดยอัตโนมัติ - auto.arima พิจารณาผู้จดทะเบียนเมื่อเลือกคำสั่งซื้อหรือไม่ ฉันพยายามที่จะคาดการณ์การเข้าชมร้านค้า ฉันต้องการความสามารถในการบัญชีสำหรับวันหยุดที่เคลื่อนไหวปีอธิกสุรทินและกิจกรรมประปราย บนพื้นฐานนี้ฉันรวบรวมว่า ARIMAX เป็นทางออกที่ดีที่สุดของฉันโดยใช้ตัวแปรภายนอกเพื่อลองและจำลองแบบฤดูกาลตามฤดูกาลรวมถึงปัจจัยต่างๆดังกล่าวข้างต้น ข้อมูลจะถูกบันทึกตลอด 24 ชั่วโมงทุก ๆ ชั่วโมง นี่เป็นการพิสูจน์ว่าเป็นปัญหาเนื่องจากจำนวนศูนย์ในข้อมูลของฉันโดยเฉพาะอย่างยิ่งในช่วงเวลาของวันที่เห็นปริมาณการเข้าชมต่ำมากบางครั้งก็ไม่มีเลยเมื่อเปิดร้าน นอกจากนี้เวลาเปิดทำการค่อนข้างไม่แน่นอน นอกจากนี้เวลาในการคำนวณยังมีขนาดใหญ่มากเมื่อทำการคาดการณ์ว่าเป็นอนุกรมเวลาที่สมบูรณ์หนึ่งชุดที่มีข้อมูลย้อนหลัง …

2
ทำไมฟังก์ชั่น stl จึงมีความแปรผันตามฤดูกาลอย่างมีนัยสำคัญด้วยข้อมูลแบบสุ่ม
ฉันพล็อตด้วยรหัสต่อไปนี้พร้อมฟังก์ชั่น stl (การสลายตามฤดูกาลของ Time Series by Loess): plot(stl(ts(rnorm(144), frequency=12), s.window="periodic")) มันแสดงให้เห็นถึงการเปลี่ยนแปลงตามฤดูกาลที่สำคัญกับข้อมูลสุ่มที่ใส่ไว้ในโค้ดด้านบน (ฟังก์ชัน rnorm) รูปแบบ Signficant จะเห็นทุกครั้งที่มีการเรียกใช้แม้ว่ารูปแบบจะแตกต่างกัน สองรูปแบบดังกล่าวจะแสดงด้านล่าง: เราจะพึ่งพาฟังก์ชั่น stl ในข้อมูลบางอย่างได้อย่างไรเมื่อมันแสดงการเปลี่ยนแปลงตามฤดูกาล ความแปรปรวนตามฤดูกาลนี้จำเป็นต้องเห็นในมุมมองของพารามิเตอร์อื่นหรือไม่? ขอบคุณสำหรับความเข้าใจของคุณ รหัสถูกนำมาจากหน้านี้: นี่เป็นวิธีที่เหมาะสมในการทดสอบผลกระทบตามฤดูกาลในข้อมูลการนับการฆ่าตัวตายหรือไม่?

2
เหตุใดเราจึงควรลบฤดูกาลออกจากอนุกรมเวลา
ขณะทำงานกับอนุกรมเวลาบางครั้งเราตรวจจับและลบฤดูกาลตามการวิเคราะห์สเปกตรัม ฉันเป็นผู้เริ่มต้นที่แท้จริงในซีรีย์ไทม์และฉันก็สับสนว่าทำไมคนเราต้องการที่จะลบฤดูกาลออกจากซีรีย์ดั้งเดิม ไม่ได้ลบฤดูกาลที่บิดเบือนข้อมูลต้นฉบับหรือไม่ เราได้ประโยชน์อะไรบ้างจากการสร้างอนุกรมเวลาโดยการลบฤดูกาล

2
การคำนวณดัชนีตามฤดูกาลสำหรับฤดูกาลที่ซับซ้อน
ฉันต้องการคาดการณ์รายการค้าปลีก (สัปดาห์) โดยใช้การปรับให้เรียบแบบเอ็กซ์โปเนนเชียล ตอนนี้ฉันติดอยู่กับวิธีการคำนวณจัดเก็บและใช้ดัชนี sesonality ปัญหาคือตัวอย่างทั้งหมดที่ฉันพบพบว่าเป็นฤดูกาลที่เรียบง่าย ในกรณีของฉันฉันมีปัญหาดังต่อไปนี้: 1. ฤดูกาลไม่เกิดขึ้นในสัปดาห์เดียวกันทุกปี: พวกเขาสามารถเคลื่อนย้ายได้ มาร์ดิกราส์เข้าพรรษาอีสเตอร์และอีกไม่กี่คน 2. มีฤดูกาลที่เปลี่ยนแปลงไปตามปี ตัวอย่างเช่นมีเทศกาลวันหยุดประจำชาติ ขึ้นอยู่กับว่าวันหยุดใกล้กับวันหยุดสุดสัปดาห์ลูกค้าจะหรือไม่ออกจากเมือง มันเหมือนกับว่ามีสองฤดูกาล: หนึ่งที่ลูกค้าออกจากเมืองและที่ที่พวกเขาไม่ออกจากเมือง 3. บางครั้งสอง (หรือ 3) ฤดูกาลเกิดขึ้นในเวลาเดียวกัน ตัวอย่างเช่นเรามีฤดู "Mardi-Gras" ที่เกิดขึ้นในเวลาเดียวกับฤดูวาเลนไทน์ 4. บางครั้งฤดูกาลเปลี่ยนแปลงในระยะเวลา ตัวอย่างเช่น "เทศกาลวันฮาโลวีน" เริ่มขึ้นเมื่อต้นปี คริสต์มาสก็เป็นอีกตัวอย่างหนึ่งที่ดูเหมือนว่าทุกปีเราเริ่มต้นเร็ว ๆ นี้เพื่อพกพาผลิตภัณฑ์ สำหรับฉันดูเหมือนว่าฉันต้องหาวิธีในการตั้งค่า "โปรไฟล์ตามฤดูกาล" ซึ่งตอนนั้นขึ้นอยู่กับสถานการณ์เฉพาะจะถูกเพิ่มเข้ามาเพื่อให้ได้ดัชนีตามฤดูกาลที่ถูกต้อง มันสมเหตุสมผลไหม ไม่มีใครรู้ว่าฉันสามารถหาข้อมูลที่เป็นประโยชน์เกี่ยวกับวิธีการทำเช่นนี้ได้ที่ไหน? ขอบคุณ Edgard

2
วิธีสร้างแบบจำลองเดือนต่อเดือนผลกระทบในข้อมูลอนุกรมเวลารายวัน?
ฉันมีชุดข้อมูลรายวันสองชุด หนึ่งคือsign-upsและอื่น ๆterminationsของการสมัครสมาชิก ฉันต้องการทำนายหลังโดยใช้ข้อมูลที่มีอยู่ในตัวแปรทั้งสอง เมื่อมองดูกราฟของซีรี่ส์เหล่านี้เห็นได้ชัดว่าการเลิกจ้างมีความสัมพันธ์กับการลงชื่อสมัครเข้าใช้หลายรายการก่อนหน้านี้หลายเดือน นั่นคือการขัดขวางการลงชื่อสมัครใช้ในวันที่ 10 พฤษภาคมจะนำไปสู่การเพิ่มขึ้นของการยุติในวันที่ 10 มิถุนายน 10 กรกฎาคมและ 10 สิงหาคมเป็นต้นไปแม้ว่าผลจะหมดไป ฉันหวังว่าจะได้คำใบ้ว่าฉันควรใช้แบบจำลองรุ่นใดเพื่อแก้ปัญหาเฉพาะนี้ คำแนะนำใด ๆ ที่จะได้รับการชื่นชมมาก .. จนถึงตอนนี้ฉันกำลังคิดแบบจำลอง VAR แต่ฉันไม่แน่ใจว่าจะรวมเอฟเฟกต์รายเดือนอย่างไรให้ใช้คำสั่งล่าช้าสูงมากหรือเพิ่มองค์ประกอบตามฤดูกาลอย่างใด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.