การพยากรณ์อนุกรมเวลารายชั่วโมงโดยมีรายวันรายสัปดาห์และรายปี


12

การแก้ไขที่สำคัญ: ฉันต้องการจะพูดขอบคุณมากสำหรับเดฟและนิคจนถึงตอนนี้สำหรับคำตอบของพวกเขา ข่าวดีก็คือฉันได้วนไปทำงาน (หลักการยืมมาจากโพสต์ของศ. Hydnman ในการพยากรณ์ชุด) ในการรวมการสืบค้นที่คงค้าง:

a) ฉันจะเพิ่มจำนวนการทำซ้ำสูงสุดสำหรับ auto.arima ได้อย่างไร - ดูเหมือนว่ามีตัวแปรภายนอกจำนวนมาก auto.arima กำลังกดปุ่มการทำซ้ำสูงสุดก่อนที่จะมาบรรจบกับรุ่นสุดท้าย โปรดแก้ไขฉันหากฉันเข้าใจผิด

b) หนึ่งคำตอบจาก Nick เน้นว่าการคาดคะเนของฉันสำหรับช่วงเวลารายชั่วโมงนั้นมาจากช่วงเวลารายชั่วโมงเท่านั้นและไม่ได้รับอิทธิพลจากเหตุการณ์ที่เกิดขึ้นก่อนหน้านี้ในวันนั้น สัญชาตญาณของฉันจากการจัดการกับข้อมูลนี้บอกฉันว่าสิ่งนี้ไม่ควรทำให้เกิดปัญหาสำคัญ แต่ฉันเปิดรับข้อเสนอแนะเกี่ยวกับวิธีจัดการกับสิ่งนี้

c) เดฟชี้ให้เห็นว่าฉันต้องการวิธีการที่ซับซ้อนกว่านี้ในการระบุเวลารอคอย / เวลาล่าช้าโดยรอบตัวแปรตัวทำนายของฉัน ใครบ้างมีประสบการณ์กับวิธีการเขียนโปรแกรมนี้ใน R? ฉันคาดหวังว่าจะมีข้อ จำกัด แต่ฉันต้องการใช้โครงการนี้ให้ไกลที่สุดเท่าที่จะทำได้และฉันไม่สงสัยเลยว่าสิ่งนี้จะต้องใช้กับผู้อื่นที่นี่เช่นกัน

d) แบบสอบถามใหม่ แต่เกี่ยวข้องกับงานที่ทำโดยอัตโนมัติ - auto.arima พิจารณาผู้จดทะเบียนเมื่อเลือกคำสั่งซื้อหรือไม่

ฉันพยายามที่จะคาดการณ์การเข้าชมร้านค้า ฉันต้องการความสามารถในการบัญชีสำหรับวันหยุดที่เคลื่อนไหวปีอธิกสุรทินและกิจกรรมประปราย บนพื้นฐานนี้ฉันรวบรวมว่า ARIMAX เป็นทางออกที่ดีที่สุดของฉันโดยใช้ตัวแปรภายนอกเพื่อลองและจำลองแบบฤดูกาลตามฤดูกาลรวมถึงปัจจัยต่างๆดังกล่าวข้างต้น

ข้อมูลจะถูกบันทึกตลอด 24 ชั่วโมงทุก ๆ ชั่วโมง นี่เป็นการพิสูจน์ว่าเป็นปัญหาเนื่องจากจำนวนศูนย์ในข้อมูลของฉันโดยเฉพาะอย่างยิ่งในช่วงเวลาของวันที่เห็นปริมาณการเข้าชมต่ำมากบางครั้งก็ไม่มีเลยเมื่อเปิดร้าน นอกจากนี้เวลาเปิดทำการค่อนข้างไม่แน่นอน

นอกจากนี้เวลาในการคำนวณยังมีขนาดใหญ่มากเมื่อทำการคาดการณ์ว่าเป็นอนุกรมเวลาที่สมบูรณ์หนึ่งชุดที่มีข้อมูลย้อนหลัง 3 ปี + ฉันคิดว่ามันจะทำให้เร็วขึ้นโดยการคำนวณแต่ละชั่วโมงของวันเป็นอนุกรมเวลาที่แยกจากกันและเมื่อทดสอบสิ่งนี้ในชั่วโมงที่ยุ่งมากของวันดูเหมือนว่าจะให้ความแม่นยำสูงกว่า แต่พิสูจน์อีกครั้งว่าเป็นปัญหาของชั่วโมงแรก ไม่ได้รับการเข้าชมอย่างสม่ำเสมอ ฉันเชื่อว่ากระบวนการนี้จะได้รับประโยชน์จากการใช้ auto.arima แต่ดูเหมือนว่าจะไม่สามารถมาบรรจบกับโมเดลก่อนที่จะถึงจำนวนสูงสุดของการทำซ้ำ (ดังนั้นการใช้แบบพอดีกับตัวเองและข้อ Maxit)

ฉันพยายามจัดการข้อมูล 'ขาดหายไป' โดยการสร้างตัวแปรภายนอกสำหรับเมื่อมีการเยี่ยมชม = 0 อีกครั้งสิ่งนี้ใช้งานได้ดีสำหรับช่วงเวลาที่ยุ่งมากของวันเมื่อมีเวลาเพียงครั้งเดียวที่ไม่มีการเข้าชมคือเมื่อร้านถูกปิดในวันนั้น ในกรณีเหล่านี้ตัวแปรภายนอกประสบความสำเร็จดูเหมือนว่าจะจัดการสิ่งนี้สำหรับการคาดการณ์ล่วงหน้าและไม่รวมถึงผลกระทบของวันก่อนหน้านี้ที่ถูกปิด อย่างไรก็ตามฉันไม่แน่ใจว่าจะใช้หลักการนี้อย่างไรในการคาดการณ์ชั่วโมงที่เงียบกว่าซึ่งเป็นร้านค้าที่เปิด แต่ไม่ได้รับการเข้าชมทุกครั้ง

ด้วยความช่วยเหลือของโพสต์โดยศาสตราจารย์ Hyndman เกี่ยวกับการพยากรณ์แบบเป็นชุดใน R ฉันพยายามตั้งวงวนการพยากรณ์ 24 ชุด แต่ดูเหมือนว่าจะไม่คาดการณ์ตั้งแต่ 1 ทุ่มเป็นต้นไปและไม่สามารถหาสาเหตุได้ ฉันได้รับ "ข้อผิดพลาดในการเพิ่มประสิทธิภาพ (init [mask], armafn, method = optim.method, hessian = TRUE,: ค่าที่ไม่แตกต่างกันแน่นอนไม่ จำกัด [1]" แต่เนื่องจากชุดทั้งหมดมีความยาวเท่ากันและฉันใช้เป็นหลัก เมทริกซ์เดียวกันฉันไม่เข้าใจว่าทำไมมันถึงเกิดขึ้นนี่หมายความว่าเมทริกซ์นั้นไม่ได้อยู่ในอันดับเต็มเลยฉันจะหลีกเลี่ยงสิ่งนี้ในวิธีนี้ได้อย่างไร

https://www.dropbox.com/s/26ov3xp4ayig4ws/Data.zip

date()

#Read input files
INPUT <- read.csv("Input.csv")
XREGFDATA <- read.csv("xreg.csv")

#Subset time series data from the input file
TS <- ts(INPUT[,2:25], f=7)


fcast <- matrix(0, nrow=nrow(XREGFDATA),ncol=ncol(TS))

#Create matrix of exogenous variables for forecasting.
xregf <- (cbind(Weekday=model.matrix(~as.factor(XREGFDATA$WEEKDAY)),
                    Month=model.matrix(~as.factor(XREGFDATA$MONTH)),
                Week=model.matrix(~as.factor(XREGFDATA$WEEK)),
                    Nodata=XREGFDATA$NoData,
                NewYearsDay=XREGFDATA$NewYearsDay,
                    GoodFriday=XREGFDATA$GoodFriday,
                EasterWeekend=XREGFDATA$EasterWeekend,
                    EasterMonday=XREGFDATA$EasterMonday,
                MayDay=XREGFDATA$MayDay,
                    SpringBH=XREGFDATA$SpringBH,
                SummerBH=XREGFDATA$SummerBH,
                    Christmas=XREGFDATA$Christmas,
                BoxingDay=XREGFDATA$BoxingDay))
#Remove intercepts
xregf <- xregf[,c(-1,-8,-20)]

NoFcast <- 0

for(i in 1:24) {

  if(max(INPUT[,i+1])>0) {

  #The exogenous variables used to fit are the same for all series except for the
  #'Nodata' variable. This is to handle missing data for each series
   xreg <- (cbind(Weekday=model.matrix(~as.factor(INPUT$WEEKDAY)),
                     Month=model.matrix(~as.factor(INPUT$MONTH)),
                 Week=model.matrix(~as.factor(INPUT$WEEK)),
                     Nodata=ifelse(INPUT[,i+1] < 1,1,0),
                     NewYearsDay=INPUT$NewYearsDay,
                 GoodFriday=INPUT$GoodFriday,
                     EasterWeekend=INPUT$EasterWeekend,
                 EasterMonday=INPUT$EasterMonday,
                     MayDay=INPUT$MayDay,
                 SpringBH=INPUT$SpringBH,
                     SummerBH=INPUT$SummerBH,
                 Christmas=INPUT$Christmas,
                     BoxingDay=INPUT$BoxingDay))
  xreg <- xreg[,c(-1,-8,-20)]

  ARIMAXfit <- Arima(TS[,i], 
                     order=c(0,1,8), seasonal=c(0,1,0),
                     include.drift=TRUE,
                     xreg=xreg,
                     lambda=BoxCox.lambda(TS[,i])
                     ,optim.control = list(maxit=1500), method="ML")  


  fcast[,i] <- forecast(ARIMAXfit, xreg=xregf)$mean

 } else{
  NoFcast <- NoFcast +1
 }
}

#Save the forecasts to .csv
write(t(fcast),file="fcasts.csv",sep=",",ncol=ncol(fcast))


date()

ฉันขอขอบคุณคำวิจารณ์ที่สร้างสรรค์อย่างเต็มที่เกี่ยวกับวิธีการที่ฉันทำเกี่ยวกับเรื่องนี้และความช่วยเหลือใด ๆ ในการทำให้สคริปต์นี้ทำงาน ฉันทราบว่ามีซอฟต์แวร์อื่นที่ใช้ได้ แต่ฉัน จำกัด การใช้ R และ / หรือ SPSS อย่างเคร่งครัดที่นี่ ...

นอกจากนี้ฉันยังใหม่กับฟอรัมเหล่านี้ - ฉันพยายามอธิบายอย่างเต็มที่ให้มากที่สุดแสดงให้เห็นถึงงานวิจัยก่อนหน้านี้ที่ฉันได้ทำไปและยังเป็นตัวอย่างที่ทำซ้ำได้; ฉันหวังว่านี่จะเพียงพอ แต่โปรดแจ้งให้เราทราบหากมีสิ่งอื่นที่ฉันสามารถให้บริการเพื่อปรับปรุงเมื่อโพสต์ของฉัน

แก้ไข: Nick แนะนำให้ฉันใช้ผลรวมรายวันก่อน ฉันควรเพิ่มว่าฉันได้ทดสอบสิ่งนี้แล้วและตัวแปรภายนอกสร้างการคาดการณ์ที่จับภาพรายวันรายสัปดาห์และรายปี นี่เป็นหนึ่งในเหตุผลอื่นที่ฉันคิดว่าจะคาดการณ์ในแต่ละชั่วโมงว่าเป็นซีรีย์ที่แยกจากกันตามที่นิคพูดถึงการคาดการณ์ของฉันในเวลา 16.00 น. ในวันใดก็ตามจะไม่ได้รับอิทธิพลจากชั่วโมงก่อนหน้าในวันนั้น

แก้ไข: 09/08/13 ปัญหาเกี่ยวกับการวนซ้ำนั้นเป็นเพียงการทำตามคำสั่งซื้อดั้งเดิมที่ฉันใช้ในการทดสอบ ฉันควรจะเห็นสิ่งนี้เร็วกว่านี้และเร่งด่วนมากขึ้นเกี่ยวกับการพยายาม auto.arima เพื่อทำงานกับข้อมูลนี้ - ดูจุด a & d) ด้านบน


นอกจากนี้ฉันพยายามใช้ฟูเรียร์เพื่อดูแลฤดูกาล แต่กลับข้อผิดพลาดเดียวกัน "ข้อผิดพลาดในการเพิ่มประสิทธิภาพ (init [หน้ากาก], armafn, method = optim.method, hessian = TRUE,: ค่าที่ไม่แตกต่างกันแน่นอน จำกัด [1]" แม้ว่าจะใช้เป็นเมทริกซ์ด้วยตัวเองโดยไม่มีตัวแปรภายนอกอื่น ๆ โปรดมีคนช่วยฉันอธิบายเหตุผลว่าทำไมถึงเป็นเช่นนั้น
krcooke

คุณสามารถอัปโหลดข้อมูลอีกครั้งได้ไหม
MyHeadHurts

คำตอบ:


4

น่าเสียดายที่ภารกิจของคุณต้องล้มเหลวเนื่องจากคุณถูก จำกัด ที่ R และ SPSS คุณต้องระบุโครงสร้างความสัมพันธ์ของโอกาสในการขายและล่าช้าสำหรับแต่ละเหตุการณ์ / วันหยุด / ตัวแปรภายนอกที่อาจเข้ามาเล่น คุณต้องตรวจสอบแนวโน้มเวลาที่เป็นไปได้ซึ่ง SPSS ไม่สามารถทำได้ คุณจำเป็นต้องรวม Daily Trends / Predictions เข้ากับการพยากรณ์รายชั่วโมงแต่ละครั้งเพื่อที่จะให้การพยากรณ์รวม คุณต้องคำนึงถึงการเปลี่ยนแปลงพารามิเตอร์และการเปลี่ยนแปลงผลต่าง หวังว่านี่จะช่วยได้ เราได้สร้างแบบจำลองของข้อมูลประเภทนี้มานานหลายปีในลักษณะอัตโนมัติโดยขึ้นอยู่กับการควบคุมที่ผู้ใช้ระบุ

แก้ไข: OP ขอให้ฉันนำเสนอการวิเคราะห์ทั่วไปที่นี่ ฉันใช้เวลาหนึ่งชั่วโมงถ้ายุ่งมากขึ้นและพัฒนาแบบจำลองรายวัน ในการวิเคราะห์ที่สมบูรณ์ตลอด 24 ชั่วโมงจะได้รับการพัฒนาและยังเป็นแบบจำลองรายวันเพื่อที่จะกระทบยอดการพยากรณ์ ป้อนคำอธิบายรูปภาพที่นี่ต่อไปนี้เป็นรายชื่อบางส่วนของรูปแบบ นอกเหนือจากการถดถอยอย่างมีนัยสำคัญ (หมายเหตุโครงสร้างที่แท้จริงและความล่าช้าได้ถูกละเว้น) มีตัวบ่งชี้ที่สะท้อนถึงฤดูกาลการเปลี่ยนแปลงระดับผลกระทบรายวันการเปลี่ยนแปลงผลกระทบรายวันและค่าผิดปกติที่ไม่สอดคล้องกับประวัติศาสตร์ ป้อนคำอธิบายรูปภาพที่นี่สถิติรูปแบบเป็น พล็อตของการคาดการณ์สำหรับ 360 ป้อนคำอธิบายรูปภาพที่นี่วันต่อไปคือการแสดงที่นี่ กราฟที่เกิดขึ้นจริง / พอดี / พยากรณ์พยากรณ์สรุปผลลัพธ์อย่างเป็นระเบียบป้อนคำอธิบายรูปภาพที่นี่. เมื่อต้องเผชิญกับปัญหาที่ซับซ้อนอย่างมาก (เช่นนี้!) เราต้องแสดงให้เห็นถึงความกล้าหาญประสบการณ์และคอมพิวเตอร์ช่วยในการผลิตจำนวนมาก เพียงแค่แนะนำการจัดการของคุณว่าปัญหาสามารถแก้ไขได้ แต่ไม่จำเป็นต้องใช้เครื่องมือดั้งเดิม ฉันหวังว่าสิ่งนี้จะช่วยให้คุณมีกำลังใจในความพยายามของคุณต่อไปเนื่องจากความคิดเห็นก่อนหน้าของคุณเป็นมืออาชีพมากมุ่งไปที่การเพิ่มพูนและการเรียนรู้ส่วนบุคคล ฉันจะเพิ่มที่จำเป็นต้องรู้ค่าที่คาดหวังของการวิเคราะห์นี้และใช้เป็นแนวทางเมื่อพิจารณาซอฟต์แวร์เพิ่มเติม บางทีคุณอาจต้องการเสียงที่ดังกว่าเพื่อช่วยชี้นำ "ผู้กำกับ" ของคุณไปสู่ทางออกที่เป็นไปได้สำหรับงานที่ท้าทายนี้

หลังจากตรวจสอบผลรวมรายวันและแบบจำลอง 24 ชั่วโมงทุกรุ่นฉันจะสะท้อนให้เห็นอย่างแน่นอนว่าจำนวนการเข้าชมนั้นลดลงอย่างมาก! การวิเคราะห์ประเภทนี้โดยผู้ซื้อที่คาดหวังจะแนะนำให้ซื้อที่ไม่ใช่ในขณะที่ผู้ขายควรที่จะทวีคูณความพยายามของพวกเขาในการขายธุรกิจตามการคาดการณ์เชิงลบนี้มาก


สวัสดีเดฟขอบคุณมากที่สละเวลาอ่านคำถามของฉันและตอบกลับ ฉันเข้าใจว่าซอฟต์แวร์ของคุณไปเหนือกว่าทางเลือกอื่น ๆ แต่น่าเสียดายที่ไม่ใช่ตัวเลือกสำหรับฉันในขณะนี้ การรู้ความสามารถของ R มีคำแนะนำใดบ้างที่คุณสามารถเสนอให้ฉันปรับปรุงสิ่งที่ฉันทำไปแล้ว ขอแสดงความนับถือ
krcooke

@krcooke คุณสามารถตรวจสอบความสัมพันธ์ข้ามระหว่างการเข้าชมและโอกาสในการขาย / ล่าช้ารอบ ๆ แต่ละ regressors ของคุณเพื่อระบุการตอบสนองที่เหมาะสมฉันเห็นด้วยกับ Nick โดยสมบูรณ์ว่า Regressors บางคนอาจมีประโยชน์สำหรับบางชั่วโมง แต่ไม่ใช่สำหรับคนอื่น ๆ คุณอาจทำแบบจำลองแต่ละชั่วโมงแยกกันตรวจสอบค่าผิดปกติ 4 ชนิด (Pulse, Level Shift, Pulse ตามฤดูกาลและแนวโน้มเวลา) ไม่สามารถใช้ได้ใน SAS เมื่อคุณมีสาเหตุและอาจไม่พร้อมใช้งานใน SPSS ฉันได้ดาวน์โหลดข้อมูลของคุณแล้วและจะใช้ AUTOBOX . เรามักจะมองหา "ข้อมูลที่ยากลำบาก" เช่นเดียวกับคุณเพื่อทำให้การวิเคราะห์ของเราแข็งแกร่งขึ้น
IrishStat

สวัสดีเดฟฉันจะเห็นสิ่งที่ฉันสามารถทำโดยรอบการวิเคราะห์ของ regressors ฉันรู้สึกว่า regressors ที่ฉันใช้นั้นเป็น 'มาตรฐาน' และมีแนวโน้มที่จะส่งผลกระทบต่อร้านค้าดังกล่าวทั้งหมด ฉันใช้วันหยุดสุดสัปดาห์ธนาคารกาญจนาภิเษกเป็นตัวอย่างในความคิดเห็นของ Nick; นี่น่าจะได้ประโยชน์จากการใช้ regressors แต่ตอนนี้ฉันยังไม่ได้รวม และฉันสนใจมากที่จะดูว่าคุณสามารถทำอะไรกับข้อมูล! ขอบคุณอีกครั้ง.
krcooke

7
" โชคไม่ดีที่ภารกิจของคุณกำลังจะล้มเหลวเนื่องจากคุณถูก จำกัด ไว้ที่ R และ SPSS " - ความคิดเห็นนี้น่าเสียดายมากเกินไป ใดภาษาทัวริงสมบูรณ์สามารถใช้ขั้นตอนวิธีการใด ๆ ที่เขียนในอื่น ๆ ถึงแม้ว่ามันจะเป็นเพียงโปรแกรมได้ในรหัสเครื่องโดยสวิทช์พลิกและจะดำเนินการทั้งหมดในเลโก้ ไม่มีการคำนวณที่สามารถนำไปใช้ในสิ่งที่ไม่สามารถทำได้ในอีก ถ้าคุณไม่ได้อ้างคุณสมบัติที่น่าอัศจรรย์สำหรับ AUTOBOX ฉันเชื่อว่าคุณอาจหมายถึงการพูดอะไรบางอย่างเช่น "มีอยู่แล้วในฟังก์ชั่นการกระจายวานิลลา" เป็นความแตกต่าง
Glen_b -Reinstate Monica

@Glen_b สิ่งที่ฉันอาจจะพูดได้ก็คือพลังยิงในการแจกวานิลลาที่คุณใช้นั้นไม่เพียงพอที่จะแก้ปัญหาในมือได้เว้นแต่คุณจะมีเวลามากในการเขียนขั้นตอนใหม่
IrishStat

10

นี่ไม่ใช่ความคิดเห็นแบบรวมกลุ่ม แต่จะยาวเกินไปสำหรับรูปแบบนั้น ฉันไม่ได้เป็นมือสมัครเล่นเกินเวลา แต่ฉันมีคำแนะนำง่ายๆ

  1. คุณอาจอยู่ภายใต้คำสั่งซื้อที่นี่ แต่ฉันคิดว่าสิ่งนี้ต้องการความคมชัดมากขึ้นในแง่ของสิ่งที่คุณคาดหวังว่าจะบรรลุและสิ่งที่สำคัญที่สุดสำหรับคุณ การเข้าชมที่คาดการณ์นั้นเป็นเป้าหมายที่คลุมเครือ ตัวอย่างเช่นสมมติว่าเป็นเวลา 16.00 น. และคุณต้องการคาดการณ์การเข้าชมหนึ่งชั่วโมงล่วงหน้า คุณต้องการซูเปอร์โมเดลที่รวมเอาซีรีย์ก่อนหน้าทั้งหมดหรือไม่ สิ่งนี้ต้องมาจากการพิจารณาถึงเป้าหมายเชิงปฏิบัติและ / หรือทางวิทยาศาสตร์ที่แท้จริงซึ่งอาจกำหนดโดยหัวหน้าของคุณหรือลูกค้าหรืออาจเป็นของคุณเองในฐานะนักวิจัย ฉันสงสัยว่ามีความเป็นไปได้ที่รูปแบบที่แตกต่างกันจะต้องใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน

  2. การแยกซีรีส์รายชั่วโมงออกมาดูเหมือนว่าจะถูกผลักดันโดยแนวคิดของการตัดการคำนวณโดยไม่คำนึงถึงความรู้สึกของมัน ดังนั้นความหมายก็คือคุณไม่ได้ (จะไม่) ใช้ข้อมูลจากวันนี้ก่อนหน้านี้ในการทำนายสิ่งที่เกิดขึ้นในเวลา 16.00 น. เพียงสังเกตก่อน 16.00 น. เท่านั้น ดูเหมือนว่าสำหรับฉันที่ต้องการการพูดคุยมากมาย

  3. เห็นได้ชัดว่าคุณเป็นผู้เรียนในอนุกรมเวลา (และฉันกำลังทำให้ตัวเองเสมอ) แต่ไม่มีผู้เรียนควรเริ่มต้นด้วยปัญหาใหญ่นี้ จริงๆ! คุณมีข้อมูลจำนวนมากคุณมีระยะเวลาหลายเกล็ดคุณมีความผิดปกติของเวลาทำการและวันหยุดคุณมีตัวแปรภายนอก: คุณได้เลือกปัญหาที่ยากมาก (สิ่งที่เกี่ยวกับแนวโน้มเช่นกัน) เป็นเรื่องง่ายที่จะพูด แต่ก็เห็นได้ชัดว่าผ่านคุณ: คุณอาจต้องทำงานในรุ่นที่ง่ายมากของปัญหาก่อนและรับความรู้สึกสำหรับวิธีการพอดีแบบง่าย การขว้างทุกอย่างไปยังแบบจำลองที่ซับซ้อนขนาดใหญ่นั้นเห็นได้ชัดว่าไม่ได้ทำงานได้ดีและสิ่งที่ดูเหมือนจะง่ายกว่านั้นก็เป็นเรื่องง่าย


สวัสดีนิค 1- แน่นอนฉันอยู่ภายใต้คำสั่ง! เป้าหมายคือการพยายามสร้างแบบจำลองเพื่อไม่ให้มีแนวโน้มที่จะคาดการณ์มากเกินไป (ส่งผลให้สูญเสียเวลาทำงานของพนักงาน) หรือคาดการณ์ไม่ถึง (เพื่อให้พนักงานไม่ได้ทำงานเกินกำลัง) 2- ฉันได้พิจารณาสิ่งนี้แล้ว แต่จะขุดให้ลึกลงไปเพื่อทำความเข้าใจกับสิ่งที่ฉันได้ / เสียไป การคาดการณ์เมื่อซีรีส์หนึ่งดูเหมือนจะคล้ายกับ 'โมเดลซุปเปอร์' ตามที่คุณวางไว้ 3- ฉันรู้ว่านี่เป็นเรื่องยากมากและตอนนี้ฉันก็เจาะน้ำหนักตัวได้มากกว่า แต่ตอนนี้ฉันเปิดกว้างสำหรับวิธีแก้ปัญหาที่ง่ายกว่าซึ่งจะใช้ได้กับฉันที่นี่ด้วย ขอบคุณมากสำหรับความคิดของคุณนิค
krcooke

ในแง่ของการแก้ปัญหาที่ง่ายกว่านั้นฉันไม่สามารถใช้เทคนิคการทำให้เรียบแบบเอกซ์โพเนนเชียลในลักษณะที่ช่วงเวลาวันหยุดสุดสัปดาห์ปีที่ผ่านมาทำให้ปีนี้ (ช่วงเวลาเดียวกัน) เกินกว่าที่คาดการณ์ไว้ เนื่องจากประเภทของค่าผิดปกติที่เกี่ยวข้องฉันรู้สึกเหมือนฉันต้องใช้ตัวแปรภายนอก คุณมีความคิดอื่น ๆ ที่ฉันสามารถสำรวจได้หรือไม่?
krcooke

ทั้งหมดที่ฉันสามารถพูดคือสิ่งที่ฉันจะทำถ้าฉันอยู่ภายใต้คำสั่งและมีข้อมูลที่คุณให้ที่นี่ สัญชาตญาณของฉันคือการรวมเข้ากับผลรวมรายวันและทำงานกับสิ่งเหล่านั้นก่อน นั่นยากพอ มันง่ายมากที่จะมีความสำคัญที่นี่ ....
นิคค็อกซ์

สวัสดี Nick ความผิดของฉันฉันควรจะระบุไว้แล้วว่าฉันได้ลองแล้ว ด้วยผลรวมรายวันผลปรากฏว่าสมเหตุสมผล การเป็นคำสำคัญอย่างสมเหตุสมผลเนื่องจากทั้งคุณและเดฟได้กล่าวไว้มีสิ่งที่ต้องพิจารณาอีกมากที่นี่ หากเป็นที่สนใจฉันสามารถเรียกใช้ข้อมูลรายวันอีกครั้งและแสดงให้เห็นว่าเป็นข้อมูลที่จับฤดูกาลตามฤดูกาลรายสัปดาห์รายเดือนและรายปี นั่นคือเหตุผลที่ฉันคิดว่าจะคาดการณ์ทุก ๆ ชั่วโมงว่าเป็นซีรีย์รายวัน
krcooke

หนึ่งในปัญหาที่ฉันมีตามที่กล่าวไว้ในโพสต์แรกคือ auto.arima ได้รับการทำซ้ำสูงสุดก่อนที่จะมาบรรจบกันซึ่งเป็นสาเหตุที่ฉันใช้พารามิเตอร์ทั่วไปกับ Arima () คำแนะนำเกี่ยวกับวิธีที่ฉันสามารถเอาชนะสิ่งนี้จะได้รับการชื่นชมอย่างมาก!
krcooke
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.