คำถามติดแท็ก forecasting

การทำนายเหตุการณ์ในอนาคต มันเป็นกรณีพิเศษของ [การทำนาย] ในบริบทของ [อนุกรมเวลา]

3
ข้อมูลอนุกรมเวลาพยากรณ์พร้อมตัวแปรภายนอก
ขณะนี้ฉันกำลังทำงานในโครงการเพื่อคาดการณ์ข้อมูลอนุกรมเวลา (ข้อมูลรายเดือน) ฉันใช้ R เพื่อทำการพยากรณ์ ฉันมีตัวแปรอิสระ 1 ตัว (y) และตัวแปรอิสระ 3 ตัว (x1, x2, x3) ตัวแปร y มีการสังเกต 73 ครั้งและตัวแปรอีก 3 ตัว (alos 73) ตั้งแต่เดือนมกราคม 2009 ถึงมกราคม 2015 ฉันได้ตรวจสอบความสัมพันธ์และค่า p และมันสำคัญมากที่จะนำมาเป็นแบบจำลอง คำถามของฉันคือ: ฉันจะทำให้การคาดการณ์ที่ดีโดยใช้ตัวแปรอิสระทั้งหมดได้อย่างไร ฉันไม่มีค่าในอนาคตสำหรับตัวแปรเหล่านี้ สมมติว่าฉันต้องการทำนายตัวแปร y ของฉันใน 2 ปี (ในปี 2560) ฉันจะทำสิ่งนี้ได้อย่างไร ฉันลองรหัสต่อไปนี้: model = arima(y, order(0,2,0), xreg = externaldata) …

1
แบบจำลองเชิงเส้นทั่วไปเทียบกับแบบจำลอง Timseries สำหรับการพยากรณ์
อะไรคือความแตกต่างในการใช้แบบจำลองเชิงเส้นทั่วไปเช่นการกำหนดความเกี่ยวข้องอัตโนมัติ (ARD) และการถดถอยแบบริดจ์กับแบบจำลองอนุกรมเวลาเช่น Box-Jenkins (ARIMA) หรือการทำให้เรียบแบบเอกซ์โพเนนเชียลสำหรับการคาดการณ์ มีกฎของหัวแม่มือในการใช้ GLM และเมื่อใช้ Time Series หรือไม่

2
แบบจำลองอนุกรมเวลาสำหรับการคาดการณ์เปอร์เซ็นต์ที่ผูกมัดด้วย (0,1) คืออะไร
สิ่งนี้จะต้องเกิดขึ้น --- การคาดการณ์ของสิ่งต่าง ๆ ที่ติดอยู่ระหว่าง 0 ถึง 1 ในซีรีส์ของฉันฉันสงสัยว่าองค์ประกอบการถดถอยอัตโนมัติและยังเป็นองค์ประกอบการคืนค่าเฉลี่ยดังนั้นฉันต้องการสิ่งที่ฉันสามารถตีความเหมือน ARIMA --- แต่ฉันไม่ต้องการให้มันยิงออกไปถึง 1,000% ในอนาคต . คุณเพิ่งใช้โมเดล ARIMA เป็นพารามิเตอร์ในการถดถอยโลจิสติกส์เพื่อ จำกัด ผลลัพธ์ระหว่าง 0 และ 1 หรือไม่ หรือฉันได้เรียนรู้ที่นี่ว่าการถดถอยเบต้าเหมาะสำหรับข้อมูล (0,1) มากกว่า ฉันจะใช้สิ่งนี้กับอนุกรมเวลาได้อย่างไร มีแพ็คเกจ R หรือฟังก์ชัน Matlab ที่เหมาะสมและคาดการณ์ได้ง่ายหรือไม่?

3
การพยากรณ์หลายช่วงเวลาด้วยการเรียนรู้ของเครื่อง
เมื่อเร็ว ๆ นี้ฉันได้ทบทวนความรู้เกี่ยวกับอนุกรมเวลาของฉันและรู้ว่าการเรียนรู้ด้วยเครื่องส่วนใหญ่ให้การคาดการณ์ล่วงหน้าเพียงขั้นตอนเดียว ด้วยการคาดการณ์ล่วงหน้าหนึ่งขั้นฉันหมายถึงการคาดการณ์ที่เช่นถ้าเรามีข้อมูลรายชั่วโมงให้ใช้ข้อมูลตั้งแต่ 10.00 น. ถึง 11.00 น. และ 11.00 น. สำหรับ 12.00 น. เป็นต้น วิธีการเรียนรู้ของเครื่องสามารถสร้างการคาดการณ์ล่วงหน้าล่วงหน้าได้หรือไม่? ด้วยการคาดการณ์ h-step-ahead ฉันหมายถึงเช่นสมมติว่าข้อมูลรายชั่วโมงเราใช้ข้อมูลจาก 10:00 ในการคาดการณ์ล่วงหน้า 7 ขั้นตอนเพื่อรับการประมาณการสำหรับ 11,12,13,14,15,16,17 ' o นาฬิกา ตัวอย่างรูป: เกี่ยวข้องกับคำถามหลักของฉันฉันสงสัยว่า: อะไรคือสาเหตุที่ฉันไม่เห็นใครก็ตามที่ใช้การเรียนรู้ของเครื่องเพื่อทำการพยากรณ์ล่วงหน้าแบบ h-step หากมีวิธีการที่ใช้การเรียนรู้ของเครื่องมันแม่นยำมากกว่าหรือน้อยกว่า ARIMA หรือไม่?

1
เงื่อนไขสำหรับพฤติกรรมแบบวงกลมของแบบจำลอง ARIMA
ฉันพยายามสร้างแบบจำลองและคาดการณ์ชุดเวลาที่เป็นวงจรแทนที่จะเป็นฤดูกาล (เช่นมีรูปแบบคล้ายฤดูกาล แต่ไม่ใช่ในช่วงเวลาคงที่) สิ่งนี้ควรเป็นไปได้ที่จะใช้โมเดล ARIMA ตามที่กล่าวไว้ในส่วนที่ 8.5 ของการพยากรณ์: หลักการและการปฏิบัติ : ค่าของมีความสำคัญหากข้อมูลแสดงรอบ เพื่อให้ได้การคาดการณ์แบบวนรอบจำเป็นต้องมีพร้อมกับเงื่อนไขเพิ่มเติมบางอย่างเกี่ยวกับพารามิเตอร์ สำหรับ AR (2) รูปแบบพฤติกรรมที่เกิดขึ้นหากเป็นวงกลม&lt;0pppp≥2p≥2p\geq 2ϕ21+4ϕ2&lt;0ϕ12+4ϕ2&lt;0\phi^2_1+4\phi_2<0 เงื่อนไขเพิ่มเติมเหล่านี้เกี่ยวกับพารามิเตอร์ในกรณีทั่วไปของ ARIMA (p, d, q) คืออะไร ฉันไม่สามารถพบพวกเขาได้ทุกที่

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
การย่อยสลายความแปรปรวนแบบอคติ: คำที่คาดการณ์ข้อผิดพลาดกำลังสองน้อยกว่าข้อผิดพลาดลดลง
Hastie และคณะ "องค์ประกอบของการเรียนรู้ทางสถิติ" (2009) พิจารณากระบวนการสร้างข้อมูล กับและvarepsilon}Y= f( X) + εY=f(X)+ε Y = f(X) + \varepsilon E (ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var ( ε ) =σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} พวกเขานำเสนอการสลายตัวอคติ - แปรปรวนต่อไปนี้ของข้อผิดพลาดคาดการณ์กำลังสองที่จุด (หน้า 223 สูตร 7.9): ในของฉัน งานของตัวเองฉันไม่ได้ระบุแต่รับการคาดการณ์แบบสุ่มแทน (ถ้าเกี่ยวข้อง) คำถาม:ฉันกำลังมองหาคำว่า หรือแม่นยำยิ่งขึ้น x0x0x_0ข้อผิดพลาด(x0)= E ( [ y-ฉ^(x0)]2|X=x0)= ...=σ2ε+อคติ2(ฉ^(x0) ) + Var (ฉ^(x0) )= ข้อผิดพลาดลดลง +อคติ2+ แปรปรวนErr(x0)=E([y−f^(x0)]2|X=x0)=…=σε2+Bias2(f^(x0))+Var(f^(x0))=Irreducible error+Bias2+Variance.\begin{aligned} \text{Err}(x_0) &= …

4
ฉันจะแก้ไขปัญหาการทำนายแบบไบนารีนี้ได้อย่างไร
ฉันมีชุดข้อมูลที่มีรูปแบบต่อไปนี้ มีมะเร็งผลไบนารี / ไม่มีมะเร็ง แพทย์ทุกคนในชุดข้อมูลได้เห็นผู้ป่วยทุกรายและตัดสินอย่างอิสระว่าผู้ป่วยเป็นมะเร็งหรือไม่ จากนั้นแพทย์จะให้ระดับความเชื่อมั่นของพวกเขาจาก 5 ที่การวินิจฉัยของพวกเขาถูกต้องและระดับความมั่นใจจะปรากฏในวงเล็บ ฉันได้ลองหลายวิธีเพื่อให้ได้การคาดการณ์ที่ดีจากชุดข้อมูลนี้ มันใช้งานได้ดีสำหรับฉันโดยเฉลี่ยทั่วทั้งหมอโดยไม่สนใจระดับความมั่นใจ ในตารางด้านบนที่มีการวินิจฉัยที่ถูกต้องสำหรับผู้ป่วย 1 และผู้ป่วย 2 แม้ว่าจะมีการกล่าวอย่างไม่ถูกต้องว่าผู้ป่วย 3 เป็นมะเร็งตั้งแต่ 2-1 คนส่วนใหญ่แพทย์คิดว่าผู้ป่วย 3 เป็นมะเร็ง ฉันยังลองวิธีที่เราสุ่มตัวอย่างหมอสองคนและถ้าพวกเขาไม่เห็นด้วยกันการลงคะแนนการตัดสินใจจะขึ้นอยู่กับว่าหมอคนไหนมีความมั่นใจมากขึ้น วิธีการนี้ประหยัดได้โดยที่เราไม่ต้องปรึกษาแพทย์จำนวนมาก แต่มันก็ช่วยเพิ่มอัตราความผิดพลาดได้อีกเล็กน้อย ฉันลองวิธีการที่เกี่ยวข้องซึ่งเราสุ่มเลือกหมอสองคนและถ้าพวกเขาไม่เห็นด้วยกันเราสุ่มเลือกอีกสองคน หากการวินิจฉัยอย่างใดอย่างหนึ่งข้างหน้าอย่างน้อยสองคะแนนโหวตแล้วเราจะแก้ไขสิ่งที่เป็นประโยชน์ในการวินิจฉัยว่า ถ้าไม่เราจะสุ่มตัวอย่างแพทย์เพิ่มขึ้นเรื่อย ๆ วิธีนี้ค่อนข้างประหยัดและไม่ทำผิดพลาดมากเกินไป ฉันไม่สามารถรู้สึกได้ว่าฉันขาดวิธีการที่ซับซ้อนกว่านี้ในการทำสิ่งต่าง ๆ ตัวอย่างเช่นฉันสงสัยว่ามีวิธีใดบ้างที่ฉันสามารถแบ่งชุดข้อมูลออกเป็นชุดฝึกอบรมและชุดทดสอบและหาวิธีที่เหมาะสมที่สุดในการรวมการวินิจฉัยและดูว่าน้ำหนักเหล่านั้นทำงานบนชุดทดสอบอย่างไร ความเป็นไปได้อย่างหนึ่งคือวิธีการบางอย่างที่ทำให้ฉันมีน้ำหนักตัวลดลงที่ทำผิดพลาดในชุดทดลองและอาจมีการวินิจฉัยที่มีความมั่นใจสูง (ความเชื่อมั่นมีความสัมพันธ์กับความถูกต้องในชุดข้อมูลนี้) ฉันมีชุดข้อมูลหลายชุดที่ตรงกับคำอธิบายทั่วไปนี้ดังนั้นขนาดของกลุ่มตัวอย่างจึงแตกต่างกันไปและชุดข้อมูลทั้งหมดไม่เกี่ยวข้องกับแพทย์ / ผู้ป่วย อย่างไรก็ตามในชุดข้อมูลนี้มีแพทย์ 40 คนที่แต่ละคนเห็นผู้ป่วย 108 คน แก้ไข: นี่คือลิงค์ไปยังน้ำหนักบางส่วนที่เป็นผลมาจากการอ่านคำตอบของ @ jeremy-miles ของฉัน ผลลัพธ์ที่ไม่ได้ถ่วงน้ำหนักอยู่ในคอลัมน์แรก จริงๆแล้วในชุดข้อมูลนี้ค่าความเชื่อมั่นสูงสุดคือ 4 …

1
เหตุใดโมเดล VAR ของฉันจึงทำงานได้ดีกว่ากับข้อมูลที่ไม่ใช่เครื่องเขียนมากกว่าข้อมูลที่อยู่กับที่?
ฉันใช้ไลบรารี่ VAR ของ Python ในการสร้างแบบจำลองข้อมูลอนุกรมเวลาการเงินและผลลัพธ์บางอย่างทำให้ฉันงงงวย ฉันรู้ว่าแบบจำลอง VAR ถือว่าข้อมูลอนุกรมเวลาอยู่กับที่ ฉันบังเอิญใส่ราคาล็อกที่ไม่คงที่สำหรับหลักทรัพย์สองชุดที่แตกต่างกันโดยไม่ตั้งใจและน่าประหลาดใจที่ค่าติดตั้งและการคาดการณ์ในตัวอย่างนั้นมีความแม่นยำมาก R2R2R^2 ในการพยากรณ์ในตัวอย่างคือ 99% และค่าเบี่ยงเบนมาตรฐานของซีรีส์ส่วนที่เหลือที่คาดการณ์อยู่ที่ประมาณ 10% ของค่าการคาดการณ์ อย่างไรก็ตามเมื่อฉันแตกต่างราคาบันทึกและปรับให้พอดีกับอนุกรมเวลานั้นกับรุ่น VAR ค่าติดตั้งและการคาดการณ์จะอยู่ไกลจากเครื่องหมายซึ่งอยู่ในระยะที่แคบโดยรอบค่าเฉลี่ย เป็นผลให้ส่วนที่เหลือทำการคาดการณ์งานได้ดีกว่าค่าที่ติดตั้งพร้อมกับส่วนเบี่ยงเบนมาตรฐานของส่วนที่เหลือที่คาดการณ์ 15X ที่ใหญ่กว่าชุดข้อมูลที่ติดตั้งแล้วเป็น. 007R2R2R^2 ค่าสำหรับชุดการคาดการณ์ ฉันตีความผิดกับสิ่งที่ติดอยู่กับรุ่น VAR หรือทำให้เกิดข้อผิดพลาดอื่น ๆ หรือไม่? เหตุใดอนุกรมเวลาที่ไม่หยุดนิ่งจะส่งผลให้การคาดการณ์มีความแม่นยำมากขึ้นกว่าอนุกรมที่อยู่กับที่โดยอ้างอิงจากข้อมูลพื้นฐานเดียวกัน ฉันทำงานได้ดีกับรุ่น ARMA จากคลังหลามเดียวกันและไม่เห็นอะไรเหมือนการสร้างแบบจำลองข้อมูลชุดเดียว

2
วิธีตีความและพยากรณ์โดยใช้แพ็คเกจ tsoutliers และ auto.arima
ฉันได้รับข้อมูลรายเดือนตั้งแต่ปี 1993 ถึงปี 2558 และต้องการคาดการณ์ข้อมูลเหล่านี้ ฉันใช้แพ็คเกจ tsoutliers เพื่อตรวจหาค่าผิดปกติ แต่ฉันไม่รู้ว่าฉันจะคาดการณ์ข้อมูลชุดของฉันได้อย่างไร นี่คือรหัสของฉัน: product.outlier&lt;-tso(product,types=c("AO","LS","TC")) plot(product.outlier) นี่คือผลลัพธ์ของฉันจากแพ็คเกจ tsoutliers ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 LS185 TC186 TC193 TC200 0.1700 0.4316 0.6166 0.5793 -0.5127 0.5422 0.5138 0.9264 3.0762 0.5688 -0.4775 -0.4386 s.e. 0.0768 0.1109 0.1105 0.1106 0.1021 0.1120 0.1119 0.1567 0.1918 …

3
ฟังก์ชันถ่ายโอนในแบบจำลองการพยากรณ์ - การตีความ
ฉันถูกครอบครองโดยการสร้างแบบจำลองของ ARIMA ซึ่งเสริมด้วยตัวแปรภายนอกสำหรับวัตถุประสงค์ในการสร้างแบบจำลองการส่งเสริมการขายและฉันมีเวลาอธิบายให้ผู้ใช้ทางธุรกิจยาก ในบางกรณีแพคเกจซอฟต์แวร์จะสิ้นสุดลงด้วยฟังก์ชั่นการถ่ายโอนอย่างง่ายเช่นพารามิเตอร์ * ตัวแปรภายนอก ในกรณีนี้การตีความเป็นเรื่องง่ายเช่นกิจกรรมส่งเสริมการขาย X (แสดงโดยตัวแปรไบนารีภายนอก) ส่งผลต่อตัวแปรตาม (เช่นความต้องการ) ด้วยจำนวน Y ดังนั้นในแง่ธุรกิจเราสามารถพูดได้ว่ากิจกรรมส่งเสริมการขาย X ส่งผลให้ความต้องการหน่วย Y เพิ่มขึ้น บางครั้งฟังก์ชันถ่ายโอนมีความซับซ้อนมากขึ้นเช่นการแบ่งส่วนของพหุนาม * ตัวแปรภายนอก สิ่งที่ฉันสามารถทำได้คือการแบ่งส่วนของพหุนามเพื่อหาค่าสัมประสิทธิ์การถดถอยแบบไดนามิกทั้งหมดและกล่าวว่าเช่นกิจกรรมส่งเสริมการขายไม่เพียง แต่ส่งผลต่อความต้องการในช่วงเวลาที่เกิดขึ้น แต่ยังอยู่ในช่วงเวลาในอนาคต แต่เนื่องจากซอฟต์แวร์ฟังก์ชันถ่ายโอนเอาต์พุตเป็นส่วนหนึ่งของผู้ใช้ทางธุรกิจที่มีหลายชื่อไม่สามารถตีความได้อย่างง่ายดาย มีอะไรบ้างที่เราสามารถพูดได้เกี่ยวกับฟังก์ชั่นการถ่ายโอนที่ซับซ้อนโดยไม่ต้องทำการหาร? พารามิเตอร์ของรุ่นที่เกี่ยวข้องและฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องมีดังนี้: ค่าคงที่ = 4200, AR (1), ค่าสัมประสิทธิ์กิจกรรมส่งเสริมการขาย 30, Num1 = -15, Num2 = 1.62, Den1 = 0.25 ดังนั้นฉันเดาว่าถ้าเราทำกิจกรรมส่งเสริมการขายในช่วงเวลานี้ระดับความต้องการจะเพิ่มขึ้น 30 หน่วย นอกจากนี้เนื่องจากมีฟังก์ชันถ่ายโอน (การแบ่งส่วนของพหุนาม) กิจกรรมส่งเสริมการขายจะมีผลกระทบไม่เพียง แต่กับช่วงเวลาปัจจุบันเท่านั้น …

4
การคำนวณความแม่นยำในการพยากรณ์
เรากำลังใช้ STL (การนำไปใช้ R) สำหรับการคาดการณ์ข้อมูลอนุกรมเวลา ทุกวันเราเรียกใช้การคาดการณ์รายวัน เราต้องการเปรียบเทียบค่าพยากรณ์กับค่าจริงและระบุค่าเบี่ยงเบนเฉลี่ย ตัวอย่างเช่นเรารันการคาดการณ์ในวันพรุ่งนี้และได้รับคะแนนการพยากรณ์เราต้องการเปรียบเทียบคะแนนการคาดการณ์เหล่านี้กับข้อมูลจริงที่เราจะได้รับในวันพรุ่งนี้ ฉันทราบว่าการคาดการณ์ค่าและข้อมูลจริงอาจไม่ตรงกับเวลาส่วนใหญ่นั่นคือเหตุผลหนึ่งที่เราต้องการติดตามว่าเรามีความแม่นยำมากแค่ไหนในแต่ละวัน ตอนนี้เราพยายามระบุว่าวิธีใดที่ดีที่สุดในการแก้ปัญหานี้ ตัวชี้ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม ฉันดูที่การวัดคำถามความแม่นยำในการคาดการณ์แต่ดูเหมือนว่าจะเกี่ยวข้องกับการเปรียบเทียบแบบจำลองมากกว่าการคำนวณความแม่นยำด้วยค่าจริง ฉันดูการใช้งานฟังก์ชันความแม่นยำใน Rแต่สับสนกับสองคำถาม: 1) มันจะทำงานกับข้อมูลจริงเทียบกับข้อมูลการคาดการณ์หรือไม่เพราะการสอนส่วนใหญ่พูดว่า "ข้อมูลการทดสอบ" กับ "ข้อมูลการคาดการณ์" 2) ดูเหมือนว่าฟังก์ชั่นความแม่นยำที่ออกมานั้นมีอาร์เรย์ของค่ามากกว่า% ของการเบี่ยงเบน

1
แนวคิดที่ไม่ซ้ำ (?) สำหรับการคาดการณ์ยอดขาย
ฉันกำลังพัฒนาโมเดลเพื่อทำนายยอดขายรวมของผลิตภัณฑ์ ฉันมีข้อมูลการจองประมาณปีครึ่งดังนั้นฉันสามารถทำการวิเคราะห์อนุกรมเวลาได้ อย่างไรก็ตามฉันยังมีข้อมูลจำนวนมากเกี่ยวกับ 'โอกาส' (การขายที่เป็นไปได้) ที่ปิดหรือสูญหาย 'โอกาส' จะถูกดำเนินการไปตามขั้นตอนต่างๆของไปป์ไลน์จนกว่าจะปิดหรือสูญหาย พวกเขายังมีข้อมูลที่เกี่ยวข้องเกี่ยวกับผู้ซื้อที่คาดหวังพนักงานขายประวัติปฏิสัมพันธ์อุตสาหกรรมขนาดการจองโดยประมาณเป็นต้น เป้าหมายของฉันคือการทำนายการจองทั้งหมดในที่สุด แต่ฉันต้องการข้อมูลทั้งหมดเกี่ยวกับ 'โอกาส' ปัจจุบันซึ่งเป็น 'สาเหตุที่แท้จริง' ของการจอง หนึ่งความคิดที่ฉันมีคือการใช้สองรุ่นที่แตกต่างกันดังนี้: ใช้ 'โอกาส' ทางประวัติศาสตร์เพื่อสร้างแบบจำลองที่ทำนายการจองที่เกิดขึ้นจาก 'โอกาส' ของแต่ละบุคคล (ฉันอาจใช้ฟอเรสต์แบบสุ่มหรือแม้แต่การถดถอยเชิงเส้นแบบเก่าธรรมดาสำหรับขั้นตอนนี้) ใช้แบบจำลองจาก 1 เพื่อทำนายการจอง 'โอกาส' โดยประมาณทั้งหมดในขณะนี้จากนั้นรวมการประมาณการเหล่านั้นตามเดือน 'โอกาส' ที่ถูกสร้างขึ้น ใช้โมเดลอนุกรมเวลา (อาจเป็น ARIMA) โดยใช้ข้อมูลอนุกรมเวลาย้อนหลังรายเดือน 1.5 ปีและทำนาย (โดยใช้โมเดลจาก 1) การจองทั้งหมดสำหรับ 'โอกาส' ทั้งหมดที่สร้างขึ้นในเดือนนั้น ได้รับจะมีความล่าช้าในโอกาสเหล่านั้นที่เปลี่ยนไปเป็นการจองจริง แต่โมเดลอนุกรมเวลาควรสามารถจัดการกับความล่าช้าได้ เสียงนี้เป็นอย่างไร ฉันได้อ่านหนังสือตามเวลาและทำนายยอดขายเป็นจำนวนมากและจากสิ่งที่ฉันสามารถบอกได้ว่านี่เป็นวิธีที่ไม่เหมือนใคร ดังนั้นฉันขอขอบคุณข้อเสนอแนะใด ๆ จริงๆ!

2
พยากรณ์ ARIMA กับฤดูกาลและแนวโน้มผลลัพธ์แปลก
ขณะที่ฉันกำลังก้าวสู่การพยากรณ์ด้วยโมเดล ARIMA ฉันพยายามเข้าใจว่าฉันสามารถปรับปรุงการคาดการณ์ตามแบบของ ARIMA ให้สอดคล้องกับฤดูกาลและดริฟท์ได้อย่างไร ข้อมูลของฉันเป็นอนุกรมเวลาต่อไปนี้ (มากกว่า 3 ปีที่มีแนวโน้มที่ชัดเจนขึ้นและฤดูกาลที่มองเห็นได้ซึ่งดูเหมือนว่าจะไม่สนับสนุนโดยระบบอัตโนมัติที่ความล่าช้า 12, 24, 36 ??) &gt; bal2sum3years.ts Jan Feb Mar Apr May Jun Jul Aug 2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 …

2
คุณใช้การยกกำลังเลขชี้กำลังแบบง่ายใน R ได้อย่างไร?
ฉันเป็นผู้เริ่มต้นใน R คุณช่วยอธิบายวิธีใช้ ses ในแพ็คเกจพยากรณ์ของ R forecast ได้ไหม ฉันต้องการเลือกจำนวนของจุดเริ่มต้นและค่าคงที่แบบเรียบ d &lt;- c(3,4,41,10,9,86,56,20,18,36,24,59,82,51,31,29,13,7,26,19,20,103,141,145,24,99,40,51,72,58,94,78,11,15,17,53,44,34,12,15,32,14,15,26,75,110,56,43,19,17,33,26,40,42,18,24,69,18,18,25,86,106,104,35,43,12,4,20,16,8) ผมมี 70 คาบ, ผมอยากใช้ 40 คาบสำหรับค่าเริ่มต้นและ 30 สำหรับตัวอย่างที่ไม่อยู่ ses(d, h=30, level=c(80,95), fan=FALSE,initial=c("simple"), alpha=.1) ถูกต้องหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.