คำถามติดแท็ก forecasting

การทำนายเหตุการณ์ในอนาคต มันเป็นกรณีพิเศษของ [การทำนาย] ในบริบทของ [อนุกรมเวลา]

5
วิธีสร้างแบบจำลองราคา
ฉันถามคำถามนี้ในเว็บไซต์ matemathics stackexchange และแนะนำให้ถามที่นี่ ฉันกำลังทำงานในโครงการงานอดิเรกและต้องการความช่วยเหลือเกี่ยวกับปัญหาต่อไปนี้ บริบทนิดหน่อย สมมติว่ามีชุดของรายการพร้อมคำอธิบายคุณสมบัติและราคา ลองนึกภาพรายการรถยนต์และราคา รถยนต์ทุกคันมีรายการคุณสมบัติเช่นขนาดเครื่องยนต์สีพลังม้ารุ่นปี ฯลฯ สำหรับแต่ละยี่ห้อมีดังนี้: Ford: V8, green, manual, 200hp, 2007, $200 V6, red, automatic, 140hp, 2010, $300 V6, blue, manual, 140hp, 2005, $100 ... ยิ่งไปกว่านั้นรายการรถยนต์ที่มีราคาจะถูกเผยแพร่พร้อมช่วงเวลาหนึ่งซึ่งหมายความว่าเราสามารถเข้าถึงข้อมูลราคาในอดีตได้ อาจไม่รวมถึงรถยนต์คันเดียวกันทุกประการ ปัญหา ฉันต้องการที่จะเข้าใจวิธีการกำหนดราคาสำหรับรถใด ๆ ตามข้อมูลฐานนี้ที่สำคัญที่สุดคือรถยนต์ที่ไม่ได้อยู่ในรายการเริ่มต้น Ford, v6, red, automatic, 130hp, 2009 สำหรับรถด้านบนมันเกือบจะเหมือนกันกับหนึ่งในรายการเพียงเล็กน้อยแตกต่างกันในพลังม้าและปี ราคานี้สิ่งที่จำเป็น? สิ่งที่ฉันกำลังมองหาคือสิ่งที่ใช้งานได้จริงและเรียบง่าย แต่ฉันอยากจะได้ยินเกี่ยวกับวิธีการที่ซับซ้อนมากขึ้นในการสร้างแบบจำลองเช่นนี้ สิ่งที่ฉันได้ลอง นี่คือสิ่งที่ฉันกำลังทดลองด้วย: 1) …

3
การพิจารณาว่าเว็บไซต์ทำงานอยู่หรือไม่โดยใช้การเข้าชมรายวัน
บริบท: ฉันมีกลุ่มเว็บไซต์ที่ฉันบันทึกจำนวนการเข้าชมรายวัน: W0 = { 30, 34, 28, 30, 16, 13, 8, 4, 0, 5, 2, 2, 1, 2, .. } W1 = { 1, 3, 21, 12, 10, 20, 15, 43, 22, 25, .. } W2 = { 0, 0, 4, 2, 2, 5, 3, 30, 50, 30, 30, …

4
ตัวแบบทำนายผล: สถิติไม่สามารถเอาชนะการเรียนรู้ของเครื่องได้? [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ขณะนี้ฉันกำลังติดตามโปรแกรมหลักที่เน้นเรื่องสถิติ / เศรษฐมิติ ในอาจารย์ของฉันนักเรียนทุกคนต้องทำวิจัย 3 เดือน สัปดาห์ที่แล้วทุกกลุ่มต้องนำเสนองานวิจัยของพวกเขากับนักศึกษาปริญญาโทคนอื่น ๆ เกือบทุกกลุ่มมีการสร้างแบบจำลองทางสถิติและแบบจำลองการเรียนรู้ของเครื่องสำหรับหัวข้อการวิจัยและการคาดการณ์นอกเวลาตัวอย่างทุกครั้งจะมาพูดคุยเกี่ยวกับแบบจำลองการเรียนรู้ของเครื่องอย่างง่าย ๆ เอาชนะแบบจำลองทางสถิติที่ซับซ้อนมาก เดือน ไม่ว่าแบบจำลองทางสถิติของทุกคนจะดีแค่ไหนป่าสุ่มที่เรียบง่ายก็มีข้อผิดพลาดน้อยกว่าตัวอย่างมาก ฉันสงสัยว่านี่เป็นข้อสังเกตที่ยอมรับกันโดยทั่วไปหรือไม่? ถ้ามันมาจากการพยากรณ์นอกตัวอย่างไม่มีวิธีใดที่จะเอาชนะรูปแบบป่าเรียบง่ายหรือรูปแบบการไล่ระดับสีที่รุนแรง ทั้งสองวิธีนี้ง่ายมากที่จะใช้งานโดยใช้แพ็คเกจ R ในขณะที่โมเดลสถิติทั้งหมดที่ทุกคนสร้างขึ้นนั้นต้องการทักษะความรู้และความพยายามในการประเมินค่อนข้างมาก คุณคิดอย่างไรกับเรื่องนี้? ประโยชน์เพียงอย่างเดียวของตัวแบบเชิงสถิติ / เศรษฐมิติที่คุณได้รับการตีความคืออะไร? หรือโมเดลของเราไม่ดีพอที่พวกเขาล้มเหลวที่จะมีประสิทธิภาพสูงกว่าการทำนายป่าแบบสุ่มอย่างง่ายหรือไม่? มีเอกสารใดบ้างที่ตอบปัญหานี้?

1
การจัดการกับข้อมูลที่ขาดหายไปในรูปแบบการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล
ดูเหมือนจะไม่มีวิธีมาตรฐานในการจัดการกับข้อมูลที่ขาดหายไปในบริบทของตระกูลแบบจำลองการยกกำลังแบบเอ็กซ์โพเนนเชียล โดยเฉพาะอย่างยิ่งการนำ R ไปใช้นั้นเรียกว่าetsในแพ็คเกจพยากรณ์ดูเหมือนว่าจะใช้องค์ประกอบที่ยาวที่สุดโดยไม่มีข้อมูลหายไปและหนังสือ "การพยากรณ์ด้วยการทำให้เรียบแบบเอ็กซ์โปเนนเชียล" โดย Hyndman et al ดูเหมือนจะไม่พูดคุยเกี่ยวกับข้อมูลที่หายไปเลย ฉันต้องการเพิ่มอีกเล็กน้อยหากผู้ใช้ของฉันขอให้ฉันอย่างชัดเจน (และหากข้อมูลที่หายไปไม่ได้เกิดขึ้นใกล้กันเกินไปหรือในหลายช่วงเวลาที่ห่างกันหนึ่งฤดูกาล) โดยเฉพาะสิ่งที่ฉันมีในใจคือ ระหว่างการจำลองเมื่อใดก็ตามที่ฉันจะพบค่าที่หายไปผมจะทดแทนการคาดการณ์จุดปัจจุบันสำหรับเพื่อให้0 ตัวอย่างเช่นนี้ทำให้จุดข้อมูลไม่ได้รับการพิจารณาสำหรับกระบวนการปรับพารามิเตอร์ให้เหมาะสมYเสื้อYเสื้อy_tY~เสื้อY~เสื้อ\tilde y_tYเสื้อYเสื้อy_tεเสื้อ= 0εเสื้อ=0\varepsilon_t = 0 เมื่อฉันมีเหตุผลที่เหมาะสมสำหรับพารามิเตอร์ฉันสามารถประมาณค่าเบี่ยงเบนมาตรฐานของข้อผิดพลาด (สันนิษฐานว่าเป็นเรื่องปกติด้วยค่าเฉลี่ย ) และตรวจสอบว่าการใช้ค่าสำหรับสร้างขึ้นจากการกระจายนั้นไม่ลดความน่าจะเป็นด้วยปัจจัยใหญ่ ฉันจะใช้ค่าดังกล่าวสำหรับการคาดการณ์ (โดยใช้การจำลอง) เช่นกัน000εเสื้อεเสื้อ\epsilon_t มีข้อผิดพลาดที่รู้จักกับวิธีนี้หรือไม่?

1
วิธีการคำนวณข้อผิดพลาดการคาดการณ์ (ช่วงความมั่นใจ) สำหรับช่วงเวลาต่อเนื่อง?
ฉันมักจะต้องคาดการณ์ระยะเวลาในอนาคตในชุดข้อมูลรายเดือน สูตรพร้อมที่จะคำนวณช่วงความเชื่อมั่นที่อัลฟาสำหรับช่วงเวลาต่อไปในอนุกรมเวลา แต่สิ่งนี้ไม่รวมถึงวิธีการปฏิบัติในช่วงที่สองและที่สามเป็นต้น ฉันมองเห็นด้วยสายตาว่าหากการคาดการณ์ใด ๆ ถูกสร้างกราฟด้วยช่วงความเชื่อมั่นสูงและต่ำโดยทั่วไปช่วงเวลาเหล่านั้นควรเพิ่มขึ้นหรือลดลงเมื่อเทียบกับการคาดคะเนเฉลี่ยเนื่องจากความไม่แน่นอนคือแรงสะสม สมมติว่าฉันมียอดขายต่อหน่วยของเมษายน = 10 พฤษภาคม = 8 มิถุนายน = 11 กรกฎาคม = 13 และไม่มีบริบทอื่น ๆ เช่นข้อมูลตามฤดูกาลหรือข้อมูลประชากร เราจำเป็นต้องคาดการณ์ (แม้ว่าจะเป็นคนตาบอด) สิงหาคม, กันยายน, ตุลาคม คุณจะใช้วิธีใด และที่สำคัญที่นี่คุณจะวัดความเชื่อมั่นในเดือนกันยายนและตุลาคมได้อย่างไร ขออภัยที่อาจเป็นคำถามง่าย ๆ สำหรับผู้เชี่ยวชาญบางคน - ฉันขุดมาไกลเพื่อหาคำตอบที่ชัดเจนและฉันแน่ใจว่านี่เป็นสิ่งที่มือสมัครเล่นทุกคนอย่างที่ฉันชอบที่จะเข้าใจ

2
ขั้นตอนและวิธีวิเคราะห์ Timeseries โดยใช้ R
ฉันกำลังทำงานในโครงการขนาดเล็กที่เราพยายามคาดการณ์ราคาสินค้า (น้ำมันอลูมิเนียมดีบุก ฯลฯ ) ในอีก 6 เดือนข้างหน้า ฉันมีตัวแปรดังกล่าว 12 ตัวที่จะทำนายและฉันมีข้อมูลตั้งแต่ เม.ย. 2551 - พ.ค. 2556 ฉันจะทำนายอย่างไรดี? ฉันทำสิ่งต่อไปนี้แล้ว: นำเข้าข้อมูลเป็นชุดข้อมูล Timeseries ฤดูกาลทั้งหมดของตัวแปรมีแนวโน้มที่จะแปรผันตามเทรนด์ดังนั้นฉันจะเป็นแบบจำลองแบบคูณ ฉันนำ log ของตัวแปรมาแปลงเป็นสารเติมแต่ง สำหรับแต่ละตัวแปรที่ย่อยสลายข้อมูลโดยใช้ STL ฉันวางแผนที่จะใช้การทำให้เรียบแบบเลขชี้กำลังของโฮลท์วินเทอร์ ARIMA และโครงข่ายใยประสาทเทียมในการคาดการณ์ ฉันแบ่งข้อมูลเป็นการฝึกอบรมและทดสอบ (80, 20) วางแผนที่จะเลือกรุ่นที่มีแม่, MPE, MAPE และ MASE น้อยลง ฉันทำถูกไหม? อีกคำถามหนึ่งที่ฉันเคยมีก่อนที่จะส่งต่อไปยัง ARIMA หรือโครงข่ายประสาทฉันควรทำให้ข้อมูลราบรื่นหรือไม่? ถ้าใช่ใช้อะไร? ข้อมูลแสดงทั้งฤดูกาลและแนวโน้ม แก้ไข: การแนบพล็อตชุดข้อมูลและข้อมูล Year <- c(2008, 2008, 2008, …

4
มีการระบุรูปแบบโดย auto.arima () อย่างชัดเจนไหม?
ฉันพยายามเรียนรู้และนำแบบจำลอง ARIMA มาใช้ ฉันได้อ่านข้อความยอดเยี่ยมเกี่ยวกับ ARIMA โดย Pankratz - การพยากรณ์ด้วย Univariate Box - โมเดลเจนกินส์: แนวคิดและคดีต่างๆ ในข้อความที่ผู้เขียนเน้นเป็นพิเศษในการเลือกรูปแบบ ARIMA ผมเริ่มเล่นกับauto.arima()ฟังก์ชั่นในRแพคเกจการคาดการณ์ นี่คือสิ่งที่ผมทำผมจำลอง ARIMA auto.arima()และนำไปใช้แล้ว ด้านล่างเป็น 2 ตัวอย่าง อย่างที่คุณเห็นในตัวอย่างทั้งสองauto.arima()ระบุรูปแบบที่ชัดเจนว่าหลายคนอาจมองว่าไม่ใช้คำพูด โดยเฉพาะอย่างยิ่งในตัวอย่างที่ 2 ซึ่งauto.arima()ระบุ ARIMA (3,0,3) เมื่อจริง ๆ แล้ว ARIMA (1,0,1) น่าจะเพียงพอแล้ว ด้านล่างเป็นคำถามของฉัน ฉันขอขอบคุณข้อเสนอแนะและคำแนะนำใด ๆ มีคำแนะนำใดบ้างในการใช้ / แก้ไขโมเดลที่ระบุโดยใช้อัลกอริทึมอัตโนมัติเช่นauto.arima()? มีหลุมใดที่ใช้เพียง AIC (ซึ่งเป็นสิ่งที่ฉันคิดว่าauto.arima()ใช้) เพื่อระบุรูปแบบ? อัลกอริทึมอัตโนมัติที่สร้างขึ้นนั้นสามารถใช้จองหรือไม่? โดยวิธีที่ฉันใช้auto.arima()เป็นเพียงตัวอย่าง สิ่งนี้จะนำไปใช้กับอัลกอริทึมอัตโนมัติใด ๆ ด้านล่างคือตัวอย่าง …

1
การคำนวณข้อผิดพลาดการคาดการณ์ด้วยการตรวจสอบความถูกต้องข้ามเวลา
ฉันมีแบบจำลองการพยากรณ์สำหรับอนุกรมเวลาและฉันต้องการคำนวณข้อผิดพลาดการทำนายนอกตัวอย่าง ในขณะนี้กลยุทธ์ที่ฉันติดตามคือสิ่งที่แนะนำในบล็อกของ Rob Hyndman (ใกล้ด้านล่างของหน้า) ซึ่งเป็นไปตามนี้ (สมมติว่าเป็นอนุกรมเวลาและชุดฝึกอบรมขนาด )y1,…,yny1,…,yny_1,\dots,y_nkkk ปรับโมเดลให้พอดีกับข้อมูลyt,…,yt+k−1yt,…,yt+k−1y_t,\dots,y_{t+k-1}และให้y^t+ky^t+k\hat{y}_{t+k}เป็นตัวพยากรณ์สำหรับการสังเกตการณ์ครั้งต่อไป คำนวณผิดพลาดการคาดการณ์เป็นet=y^t+k−yt+ket=y^t+k−yt+ke_{t} = \hat{y}_{t+k} - y_{t+k}K} ทำซ้ำสำหรับt=1,…,n−kt=1,…,n−kt=1,\dots,n-k คำนวณข้อผิดพลาดกำลังสองเฉลี่ยเป็นMSE=1n−k∑n−kt=1e2tMSE=1n−k∑t=1n−ket2\textrm{MSE}=\frac{1}{n-k}\sum_{t=1}^{n-k} e_t^2 คำถามของฉันคือฉันต้องกังวลเกี่ยวกับสหสัมพันธ์เนื่องจากชุดการฝึกอบรมที่ทับซ้อนกันของฉัน โดยเฉพาะอย่างยิ่งบอกว่าฉันต้องการคาดการณ์ไม่เพียง แต่ค่าถัดไป แต่ค่าmถัดไปmmmดังนั้นฉันจึงมีการคาดการณ์y^t+k,…,y^t+k+m−1y^t+k,…,y^t+k+m−1\hat{y}_{t+k},\dots,\hat{y}_{t+k+m-1}และข้อผิดพลาดet,1,…,et,met,1,…,et,me_{t,1},\dots,e_{t,m}และฉันต้องการสร้างโครงสร้างคำของข้อผิดพลาดในการทำนาย ฉันจะยังคงหมุนหน้าต่างของชุดฝึกซ้อมไปข้างหน้าทีละ 1 ครั้งหรือฉันควรหมุนไปข้างหน้าด้วยmmm ? คำตอบของคำถามเหล่านี้จะเปลี่ยนไปอย่างไรหากมีการตอบรับอัตโนมัติอย่างมีนัยสำคัญในซีรีส์ที่ฉันคาดการณ์ (อาจเป็นกระบวนการหน่วยความจำที่ยาวนานนั่นคือฟังก์ชั่น autocorrelation สลายตัวเป็นกฎพลังงานแทนที่จะอธิบายแทน) ฉันขอขอบคุณคำอธิบายทั้งที่นี่หรือลิงก์ไปยังที่ซึ่งฉันสามารถค้นหาผลลัพธ์ทางทฤษฎีเกี่ยวกับช่วงความมั่นใจรอบ MSE (หรือมาตรการข้อผิดพลาดอื่น ๆ )

2
การวิเคราะห์เชิงสำรวจของข้อผิดพลาดการพยากรณ์เชิงพื้นที่
ข้อมูล:ฉันทำงานเมื่อเร็ว ๆ นี้ในการวิเคราะห์คุณสมบัติสุ่มของเขตข้อมูลเชิงพื้นที่ของข้อผิดพลาดการคาดการณ์การผลิตพลังงานลม อย่างเป็นทางการอาจกล่าวได้ว่าเป็นกระบวนการ จัดทำดัชนีสองครั้งในเวลา (ด้วยและ ) และหนึ่งครั้งในอวกาศ ( ) โดยที่เป็นจำนวนของการมองไปข้างหน้าครั้ง (เท่ากับบางสิ่งรอบตัว , สุ่มตัวอย่างอย่างสม่ำเสมอ),คือจำนวน "เวลาคาดการณ์" (เช่นเวลาที่มีการออกการคาดการณ์ประมาณ 30,000 ในกรณีของฉันสุ่มตัวอย่างเป็นประจำ) และ thpH24Tn( ϵพีt + h | เสื้อ)t = 1 … , T;h = 1 , … , H,p = p1, … , pn(ϵt+h|tp)t=1…,T;h=1,…,H,p=p1,…,pn \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}เสื้อttชั่วโมงhhพีppHHH242424TTTnnnเป็นจำนวนตำแหน่งเชิงพื้นที่ (ไม่ gridded ประมาณ 300 …

2
ใช้การวิเคราะห์อนุกรมเวลาเพื่อวิเคราะห์ / ทำนายพฤติกรรมรุนแรง
นี่เป็นคำถามที่ค่อนข้างสั่นคลอน แต่ฉันมีความสนใจอย่างจริงจังในคำตอบ ฉันทำงานในโรงพยาบาลจิตเวชและมีข้อมูลสามปีเก็บทุกวันทั่ววอร์ดเกี่ยวกับระดับความรุนแรงในวอร์ดนั้น เห็นได้ชัดว่ารูปแบบที่เหมาะกับข้อมูลเหล่านี้คือรูปแบบอนุกรมเวลา ฉันต้องทำคะแนนให้แตกต่างกันเพื่อให้เป็นปกติมากขึ้น ฉันพอดีกับโมเดล ARMA กับข้อมูลที่แตกต่างกันและแบบที่ดีที่สุดที่ฉันคิดว่าเป็นโมเดลที่มีความต่างระดับหนึ่งและลำดับอัตโนมัติสัมพันธ์แรกที่ล่าช้า 2 คำถามของฉันคืออะไรฉันสามารถใช้แบบจำลองนี้เพื่ออะไร อนุกรมเวลาดูเหมือนว่ามีประโยชน์เสมอในตำราเรียนเมื่อมันเกี่ยวกับประชากรกระต่ายและราคาน้ำมัน แต่ตอนนี้ฉันได้ทำของตัวเองผลลัพธ์ดูเหมือนเป็นนามธรรมจนทึบแสงอย่างสมบูรณ์ คะแนนที่แตกต่างนั้นมีความสัมพันธ์ซึ่งกันและกันที่ lag 2 แต่ฉันไม่สามารถแนะนำให้ทุกคนตื่นตัวได้ในสองวันหลังจากเกิดเหตุการณ์ร้ายแรงในทุกกรณี หรือฉัน

1
คุณสามารถเปรียบเทียบค่า AIC ได้หรือไม่หากโมเดลนั้นใช้ชุดข้อมูลเดียวกัน
ฉันกำลังทำการพยากรณ์ใน R โดยใช้แพ็คเกจการพยากรณ์ของ Rob Hyndman กระดาษที่อยู่ในแพคเกจที่สามารถพบได้ที่นี่ ในกระดาษหลังจากอธิบายอัลกอริทึมการพยากรณ์อัตโนมัติผู้เขียนใช้อัลกอริทึมในชุดข้อมูลเดียวกัน อย่างไรก็ตามหลังจากการประเมินทั้งการทำให้เรียบแบบเอ็กซ์โปเนนเชียลและแบบจำลอง ARIMA พวกเขาสร้างข้อความที่ฉันไม่เข้าใจ (หน้า 17): โปรดทราบว่าเกณฑ์ข้อมูลไม่สามารถเปรียบเทียบกันได้ ฉันคิดว่าข้อดีของการใช้ AIC สำหรับการเลือกแบบจำลองคือเราสามารถเปรียบเทียบค่า AIC จากแบบจำลองที่แตกต่างกันได้ตราบใดที่มีการประมาณโดยใช้ชุดข้อมูลเดียวกัน สิ่งนี้ไม่ถูกต้องหรือ เรื่องนี้เป็นเรื่องที่น่าสนใจเป็นพิเศษสำหรับฉันในขณะที่ฉันกำลังวางแผนในการรวมการคาดการณ์จากคลาสรุ่นต่างๆ (เช่นการทำให้เรียบแบบเอกซ์โพเนนเชียลและ ARIMA) โดยใช้ที่เรียกว่าน้ำหนัก Akaike (ดู Burnham and Anderson, 2002) อ้างอิง Burnham, KP, & Anderson, DR (2002) การเลือกรูปแบบและการอนุมานหลายรูปแบบ: วิธีการเชิงทฤษฎีและสารสนเทศ Springer Verlag

3
แบบจำลองอนุกรมเวลาทั้งหมด
ฉันต้องทำการพยากรณ์อนุกรมเวลาโดยอัตโนมัติและฉันไม่ทราบล่วงหน้าเกี่ยวกับคุณลักษณะของซีรี่ส์เหล่านั้น (ฤดูกาล, แนวโน้ม, เสียง, ฯลฯ ) เป้าหมายของฉันคือไม่ได้แบบที่ดีที่สุดเท่าที่จะเป็นไปได้สำหรับแต่ละซีรี่ย์ แต่เพื่อหลีกเลี่ยงโมเดลที่แย่มาก กล่าวอีกนัยหนึ่งการได้รับข้อผิดพลาดเล็ก ๆ น้อย ๆ ทุกครั้งไม่ใช่ปัญหา แต่จะได้รับข้อผิดพลาดใหญ่ ๆ เป็นครั้งคราว ฉันคิดว่าฉันสามารถทำสิ่งนี้ได้โดยการรวมโมเดลที่คำนวณด้วยเทคนิคที่แตกต่างกัน นั่นคือแม้ว่า ARIMA จะเป็นวิธีที่ดีที่สุดสำหรับซีรีส์หนึ่ง แต่มันอาจจะไม่ดีที่สุดสำหรับซีรีย์อื่น เช่นเดียวกับการปรับให้เรียบแบบเอกซ์โพเนนเชียล อย่างไรก็ตามถ้าฉันรวมโมเดลหนึ่งจากแต่ละเทคนิคแม้ว่าหนึ่งโมเดลจะไม่ดีนัก แต่อีกรุ่นจะนำค่าประมาณมาใกล้เคียงกับมูลค่าที่แท้จริงมากขึ้น เป็นที่ทราบกันดีว่า ARIMA ใช้งานได้ดีกว่าสำหรับซีรีย์ที่มีพฤติกรรมดีในระยะยาวในขณะที่การปรับให้เรียบแบบเอ็กซ์โปเนนเชียลนั้นดูโดดเด่นด้วยซีรีย์ที่มีเสียงรบกวนระยะสั้น ความคิดของฉันคือการรวมโมเดลที่สร้างจากทั้งสองเทคนิคเพื่อให้ได้การคาดการณ์ที่มีประสิทธิภาพยิ่งขึ้น อาจมีหลายวิธีในการรวมโมเดลเหล่านั้น หากนี่เป็นวิธีการที่ดีฉันจะรวมมันอย่างไร ค่าเฉลี่ยของการคาดการณ์อย่างง่ายคือตัวเลือก แต่บางทีฉันอาจได้การคาดการณ์ที่ดีกว่าถ้าฉันให้น้ำหนักค่าเฉลี่ยตามแบบวัดความดีของแบบจำลอง อะไรคือการรักษาความแปรปรวนเมื่อรวมตัวแบบ?

1
วิธีการบัญชีสำหรับผลกระทบของวันหยุดในการคาดการณ์
ฉันมีซีรีย์เวลารายวันที่สามารถคาดการณ์ได้ค่อนข้างมีฤดูกาลทุกสัปดาห์ ฉันสามารถหาคำทำนายที่ค่อนข้างแม่นยำ (ยืนยันโดยการตรวจสอบข้าม) เมื่อไม่มีวันหยุด อย่างไรก็ตามเมื่อมีวันหยุดฉันมีปัญหาดังต่อไปนี้: ฉันได้รับตัวเลขที่ไม่เป็นศูนย์สำหรับวันหยุดในการคาดการณ์ของฉันแม้ว่าวันหยุดประวัติศาสตร์ทั้งหมดจะเป็น 0 นี่ไม่ใช่ประเด็นหลักจริงๆ ปัญหาคือ ... เนื่องจากการประมวลผลที่ไม่ได้เกิดขึ้นในวันหยุด "หกล้นเกิน" ไปจนถึงวันถัดจากวันหยุดตัวแปรดัมมี่ที่เรียบง่ายไม่ได้ตัดมันเนื่องจากค่าผิดปกติเหล่านี้ดูเหมือนจะเป็นนวัตกรรมระยะสั้น หากไม่มีฤดูกาลประจำสัปดาห์ฉันอาจจะเกิดขึ้นกับการประมาณการสำหรับการกระจายข้อมูลที่ไม่ได้ประมวลผลในวันหยุดในช่วงห้าวันหรือมากกว่านั้นหลังจากวันหยุด (ดังที่แนะนำในวิธีทำคุณสร้างตัวแปรที่สะท้อนถึงโอกาสในการขาย ผลกระทบของปฏิทินในการวิเคราะห์อนุกรมเวลา? ) อย่างไรก็ตามการกระจายของ "การรั่วไหล" ขึ้นอยู่กับวันของสัปดาห์ที่เกิดขึ้นและไม่ว่าวันหยุดจะเป็นวันคริสต์มาสหรือวันขอบคุณพระเจ้าซึ่งคำสั่งซื้อจะถูกวางในอัตราที่ต่ำกว่าช่วงที่เหลือของปี ต่อไปนี้เป็นภาพรวมบางส่วนจากการตรวจสอบความถูกต้องไขว้ของฉันซึ่งแสดงผลลัพธ์ (สีน้ำเงิน) ที่คาดการณ์ไว้กับผลลัพธ์ที่แท้จริง (สีแดง) สำหรับวันหยุดที่ปรากฏในวันที่แตกต่างกันของสัปดาห์: ฉันยังกังวลว่าผลกระทบของคริสต์มาสจะขึ้นอยู่กับวันในสัปดาห์และฉันมีข้อมูลประวัติศาสตร์เพียงหกปีหรือมากกว่านั้น ไม่มีใครมีข้อเสนอแนะใด ๆ เกี่ยวกับวิธีจัดการกับค่าผิดปกติเชิงนวัตกรรมประเภทนี้ในบริบทของการพยากรณ์หรือไม่? (น่าเสียดายที่ฉันไม่สามารถแชร์ข้อมูลใด ๆ ได้)

1
ความแตกต่างระหว่างการคาดการณ์“ ในตัวอย่าง” และ“ หลอกออกจากตัวอย่าง”
มีความแตกต่างอย่างชัดเจนระหว่างการคาดการณ์ในตัวอย่างและการคาดการณ์ออกจากตัวอย่างหลอก ทั้งสองมีความหมายในบริบทของการประเมินและเปรียบเทียบแบบจำลองการพยากรณ์

4
การพยากรณ์อนุกรมเวลาไบนารี
ฉันมีซีรี่ย์เวลาแบบไบนารี่ด้วย 1 เมื่อรถไม่เคลื่อนที่และ 0 เมื่อรถเคลื่อนที่ ฉันต้องการพยากรณ์ล่วงหน้าเป็นเวลานานถึง 36 ชั่วโมงและทุกชั่วโมง วิธีแรกของฉันคือใช้ Naive Bayes โดยใช้ข้อมูลต่อไปนี้: t-24 (ทุกวันตามฤดูกาล), t-48 (ฤดูกาลประจำสัปดาห์), ชั่วโมงของวัน อย่างไรก็ตามผลลัพธ์ไม่ดีมาก คุณแนะนำบทความหรือซอฟต์แวร์ใดสำหรับปัญหานี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.