คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
วิธีตีความและพยากรณ์โดยใช้แพ็คเกจ tsoutliers และ auto.arima
ฉันได้รับข้อมูลรายเดือนตั้งแต่ปี 1993 ถึงปี 2558 และต้องการคาดการณ์ข้อมูลเหล่านี้ ฉันใช้แพ็คเกจ tsoutliers เพื่อตรวจหาค่าผิดปกติ แต่ฉันไม่รู้ว่าฉันจะคาดการณ์ข้อมูลชุดของฉันได้อย่างไร นี่คือรหัสของฉัน: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) นี่คือผลลัพธ์ของฉันจากแพ็คเกจ tsoutliers ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 LS185 TC186 TC193 TC200 0.1700 0.4316 0.6166 0.5793 -0.5127 0.5422 0.5138 0.9264 3.0762 0.5688 -0.4775 -0.4386 s.e. 0.0768 0.1109 0.1105 0.1106 0.1021 0.1120 0.1119 0.1567 0.1918 …

3
อนุกรมเวลาตามฤดูกาล
ฉันใช้decomposeฟังก์ชั่นRและคิดส่วนประกอบ 3 อย่างของอนุกรมเวลารายเดือนของฉัน (แนวโน้มฤดูกาลและการสุ่ม) ถ้าฉันพล็อตแผนภูมิหรือดูที่ตารางฉันสามารถเห็นได้อย่างชัดเจนว่าอนุกรมเวลาได้รับผลกระทบตามฤดูกาล อย่างไรก็ตามเมื่อฉันถอยหลังอนุกรมเวลาลงในตัวแปรจำลองตามฤดูกาล 11 ค่าสัมประสิทธิ์ทั้งหมดไม่มีนัยสำคัญทางสถิติซึ่งบอกว่าไม่มีฤดูกาล ฉันไม่เข้าใจว่าทำไมฉันถึงได้ผลลัพธ์ที่แตกต่างกันสองอย่าง สิ่งนี้เกิดขึ้นกับใคร? ฉันกำลังทำอะไรผิดหรือเปล่า? ฉันจะเพิ่มรายละเอียดที่เป็นประโยชน์ที่นี่ นี่คืออนุกรมเวลาของฉันและการเปลี่ยนแปลงรายเดือนที่สอดคล้องกัน ในแผนภูมิทั้งสองคุณสามารถเห็นว่ามีฤดูกาล (หรือนี่คือสิ่งที่ฉันต้องการประเมิน) โดยเฉพาะในแผนภูมิที่สอง (ซึ่งเป็นการเปลี่ยนแปลงรายเดือนของซีรี่ส์) ฉันสามารถเห็นรูปแบบที่เกิดซ้ำ (คะแนนสูงและคะแนนต่ำในเดือนเดียวกันของปี) ด้านล่างเป็นผลลัพธ์ของdecomposeฟังก์ชั่น ฉันขอขอบคุณที่ @RichardHardy กล่าวว่าฟังก์ชั่นไม่ได้ทดสอบว่ามีฤดูกาลจริงหรือไม่ แต่การสลายตัวดูเหมือนจะยืนยันสิ่งที่ฉันคิด อย่างไรก็ตามเมื่อฉันถอยหลังอนุกรมเวลาของตัวแปรตัวประกอบตามฤดูกาล 11 ตัว (มกราคมถึงพฤศจิกายนไม่รวมธันวาคม) ฉันพบสิ่งต่อไปนี้: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5144454056 372840549 13.798 <2e-16 *** Jan -616669492 527276161 -1.170 0.248 Feb -586884419 527276161 …

1
PCA กำลังทำอะไรกับข้อมูลที่เกี่ยวข้องอัตโนมัติ?
เพียงเพราะผู้สื่อข่าวบางคนตั้งคำถามที่น่าสนใจเกี่ยวกับวิธีการคำนวณความสัมพันธ์ฉันจึงเริ่มเล่นกับมันเกือบจะไม่มีความรู้เกี่ยวกับอนุกรมเวลาและความสัมพันธ์อัตโนมัติ ผู้สื่อข่าวจัดเรียงข้อมูลของเขา (จุดข้อมูลของอนุกรมเวลา) เลื่อนหนึ่งครั้งล่าช้าแต่ละครั้งนอกจากนี้เพื่อให้เขามีเมทริกซ์ของข้อมูล (เท่าที่ฉันเข้าใจเขา) ซึ่งแถวแรกเป็นข้อมูลต้นฉบับแถวที่สอง ข้อมูลเปลี่ยนเป็นหน่วยเวลาครั้งแถวถัดไปเป็นอีกหน่วยหนึ่งและอื่น ๆ ฉันรู้เรื่องนี้เพิ่มเติมโดยทากาวที่ปลายหางเพื่อสร้างชุดข้อมูล "วงกลม"32323232×3232×3232\times32111 จากนั้นเพียงเพื่อดูว่าอะไรจะออกมาฉันก็คำนวณเมทริกซ์สหสัมพันธ์และจากส่วนประกอบหลักนี้ น่าประหลาดใจที่ฉันได้ภาพของการสลายตัวของความถี่และ (อีกครั้งกับข้อมูลอื่น ๆ ) หนึ่งความถี่บอกว่าด้วยระยะเวลาหนึ่งในข้อมูลอยู่ในองค์ประกอบหลักแรกและที่มีสี่จุดอยู่ในพีซีเครื่องที่สองและอื่น ๆ (ฉันได้พีซี "ที่เกี่ยวข้อง" ที่มีค่าลักษณะเฉพาะ323232666>1>1>1) ครั้งแรกที่ฉันคิดว่าสิ่งนี้ขึ้นอยู่กับข้อมูลอินพุต แต่ตอนนี้ฉันคิดว่ามันเป็นระบบด้วยวิธีนี้โดยการสร้างชุดข้อมูลแบบพิเศษด้วยการเลื่อนแบบวงกลม (หรือที่เรียกว่าเมทริกซ์ "Toeplitz") การหมุนของ PC-solution เพื่อ varimax หรือเกณฑ์การหมุนอื่น ๆ นั้นให้ผลลัพธ์ที่แตกต่างกันเล็กน้อยและน่าสนใจ แต่โดยทั่วไปดูเหมือนจะให้การสลายตัวของความถี่ นี่คือลิงค์ไปยังรูปภาพที่ฉันทำจากชุดข้อมูลจุด; เส้นโค้งนั้นทำจากการโหลดของ factormatrix: หนึ่งโค้งการโหลดบนปัจจัยเดียว เส้นโค้งของ PC1 เครื่องแรกควรแสดงแอมพลิจูดสูงสุด (ประมาณเพราะมันมีผลรวมของการโหลดสูงสุด)323232 คำถาม: Q1: นี่เป็นคุณลักษณะจากการออกแบบหรือไม่ (ของ PCA ด้วยชุดข้อมูลประเภทนี้) Q2: วิธีนี้เป็นวิธีที่ใช้สำหรับการวิเคราะห์ความถี่ / ความยาวคลื่นอย่างจริงจังหรือไม่? …

3
ฟังก์ชันถ่ายโอนในแบบจำลองการพยากรณ์ - การตีความ
ฉันถูกครอบครองโดยการสร้างแบบจำลองของ ARIMA ซึ่งเสริมด้วยตัวแปรภายนอกสำหรับวัตถุประสงค์ในการสร้างแบบจำลองการส่งเสริมการขายและฉันมีเวลาอธิบายให้ผู้ใช้ทางธุรกิจยาก ในบางกรณีแพคเกจซอฟต์แวร์จะสิ้นสุดลงด้วยฟังก์ชั่นการถ่ายโอนอย่างง่ายเช่นพารามิเตอร์ * ตัวแปรภายนอก ในกรณีนี้การตีความเป็นเรื่องง่ายเช่นกิจกรรมส่งเสริมการขาย X (แสดงโดยตัวแปรไบนารีภายนอก) ส่งผลต่อตัวแปรตาม (เช่นความต้องการ) ด้วยจำนวน Y ดังนั้นในแง่ธุรกิจเราสามารถพูดได้ว่ากิจกรรมส่งเสริมการขาย X ส่งผลให้ความต้องการหน่วย Y เพิ่มขึ้น บางครั้งฟังก์ชันถ่ายโอนมีความซับซ้อนมากขึ้นเช่นการแบ่งส่วนของพหุนาม * ตัวแปรภายนอก สิ่งที่ฉันสามารถทำได้คือการแบ่งส่วนของพหุนามเพื่อหาค่าสัมประสิทธิ์การถดถอยแบบไดนามิกทั้งหมดและกล่าวว่าเช่นกิจกรรมส่งเสริมการขายไม่เพียง แต่ส่งผลต่อความต้องการในช่วงเวลาที่เกิดขึ้น แต่ยังอยู่ในช่วงเวลาในอนาคต แต่เนื่องจากซอฟต์แวร์ฟังก์ชันถ่ายโอนเอาต์พุตเป็นส่วนหนึ่งของผู้ใช้ทางธุรกิจที่มีหลายชื่อไม่สามารถตีความได้อย่างง่ายดาย มีอะไรบ้างที่เราสามารถพูดได้เกี่ยวกับฟังก์ชั่นการถ่ายโอนที่ซับซ้อนโดยไม่ต้องทำการหาร? พารามิเตอร์ของรุ่นที่เกี่ยวข้องและฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องมีดังนี้: ค่าคงที่ = 4200, AR (1), ค่าสัมประสิทธิ์กิจกรรมส่งเสริมการขาย 30, Num1 = -15, Num2 = 1.62, Den1 = 0.25 ดังนั้นฉันเดาว่าถ้าเราทำกิจกรรมส่งเสริมการขายในช่วงเวลานี้ระดับความต้องการจะเพิ่มขึ้น 30 หน่วย นอกจากนี้เนื่องจากมีฟังก์ชันถ่ายโอน (การแบ่งส่วนของพหุนาม) กิจกรรมส่งเสริมการขายจะมีผลกระทบไม่เพียง แต่กับช่วงเวลาปัจจุบันเท่านั้น …

3
ทดสอบเพื่อแยกความแตกต่างเป็นระยะจากข้อมูลเกือบเป็นระยะ
สมมติว่าฉันมีบางฟังก์ชั่นที่ไม่รู้จักโดเมนℝซึ่งผมทราบว่าจะปฏิบัติตามเงื่อนไขที่เหมาะสมบางอย่างเช่นความต่อเนื่อง ฉันรู้ค่าที่แน่นอนของf (เพราะข้อมูลมาจากการจำลอง) ที่จุดสุ่มตัวอย่างบางระยะเท่ากันt_i = t_0 + iΔtด้วยi∈ \ {1, …, n \}ซึ่งฉันคิดว่าเพียงพอที่จะจับภาพทั้งหมด ด้านที่เกี่ยวข้องของfเช่นฉันสามารถสรุปได้ว่ามี extremum ท้องถิ่นมากที่สุดหนึ่งแห่งfในระหว่างจุดสุ่มสองจุด ฉันกำลังมองหาการทดสอบที่บอกฉันว่าข้อมูลของฉันสอดคล้องกับfเป็นระยะอย่างแน่นอนหรือไม่นั่นคือ∃τ: f (t + τ) = f (t) \, ∀ \, tfffRℝℝfffti=t0+iΔtti=t0+iΔtt_i=t_0 + iΔti∈{1,…,n}i∈{1,…,n}i∈\{1,…,n\}fffffffff∃τ:f(t+τ)=f(t)∀t∃τ:f(t+τ)=f(t)∀t∃τ: f(t+τ)=f(t) \,∀\,tด้วยความยาวของช่วงเวลาที่สามารถสะท้อนกลับได้เช่นΔt&lt;τ&lt;n⋅ΔtΔt&lt;τ&lt;n·ΔtΔt < τ < n·Δt (แต่เป็นไปได้ว่าฉันสามารถสร้างข้อ จำกัด ที่แข็งแกร่งกว่านี้ได้ถ้าจำเป็น) จากมุมมองอื่นผมมีข้อมูลx0,…,xnx0,…,xn{x_0, …, x_n}และกำลังมองหาการทดสอบที่ตอบคำถามไม่ว่าจะเป็นฟังก์ชั่นเป็นระยะfff (เงื่อนไขดังกล่าวตอบสนอง) อยู่เช่นว่าf(ti)=xi∀if(ti)=xi∀if(t_i)=x_i ∀ i∀ฉัน จุดสำคัญคืออย่างน้อยfffใกล้เคียงกับช่วงเวลาอย่างมาก (อาจเป็นเช่นf(t):=sin(g(t)⋅t)f(t):=sin⁡(g(t)·t)f(t) := \sin(g(t)·t)หรือf(t):=g(t)⋅sin(t)f(t):=g(t)·sin⁡(t)f(t) …

4
การคำนวณความแม่นยำในการพยากรณ์
เรากำลังใช้ STL (การนำไปใช้ R) สำหรับการคาดการณ์ข้อมูลอนุกรมเวลา ทุกวันเราเรียกใช้การคาดการณ์รายวัน เราต้องการเปรียบเทียบค่าพยากรณ์กับค่าจริงและระบุค่าเบี่ยงเบนเฉลี่ย ตัวอย่างเช่นเรารันการคาดการณ์ในวันพรุ่งนี้และได้รับคะแนนการพยากรณ์เราต้องการเปรียบเทียบคะแนนการคาดการณ์เหล่านี้กับข้อมูลจริงที่เราจะได้รับในวันพรุ่งนี้ ฉันทราบว่าการคาดการณ์ค่าและข้อมูลจริงอาจไม่ตรงกับเวลาส่วนใหญ่นั่นคือเหตุผลหนึ่งที่เราต้องการติดตามว่าเรามีความแม่นยำมากแค่ไหนในแต่ละวัน ตอนนี้เราพยายามระบุว่าวิธีใดที่ดีที่สุดในการแก้ปัญหานี้ ตัวชี้ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม ฉันดูที่การวัดคำถามความแม่นยำในการคาดการณ์แต่ดูเหมือนว่าจะเกี่ยวข้องกับการเปรียบเทียบแบบจำลองมากกว่าการคำนวณความแม่นยำด้วยค่าจริง ฉันดูการใช้งานฟังก์ชันความแม่นยำใน Rแต่สับสนกับสองคำถาม: 1) มันจะทำงานกับข้อมูลจริงเทียบกับข้อมูลการคาดการณ์หรือไม่เพราะการสอนส่วนใหญ่พูดว่า "ข้อมูลการทดสอบ" กับ "ข้อมูลการคาดการณ์" 2) ดูเหมือนว่าฟังก์ชั่นความแม่นยำที่ออกมานั้นมีอาร์เรย์ของค่ามากกว่า% ของการเบี่ยงเบน

1
การสลายตัวของสารเติมแต่ง vs
คำถามของฉันเป็นคำถามง่าย ๆ แต่เป็นคำถามที่ทำให้ฉันได้รับจริง ๆ :) ฉันไม่รู้จริง ๆ ว่าจะประเมินได้อย่างไรว่าอนุกรมเวลาที่เฉพาะเจาะจงนั้นจะต้องสลายตัวโดยใช้วิธีการเติมหรือวิธีการสลายตัวแบบทวีคูณ ฉันรู้ว่ามีตัวชี้นำทางสายตาที่บอกพวกเขาแยกจากกัน แต่ฉันไม่เข้าใจ ยกตัวอย่างเช่นซีรี่ส์เวลานี้: คุณจะอธิบายมันอย่างไร ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ.

2
R ตรวจจับแนวโน้มการเพิ่ม / ลดลงของอนุกรมเวลา
ฉันมีซีรีย์เวลาจำนวนมากพร้อมช่วงเวลา: วันสัปดาห์หรือเดือน ด้วยstl()ฟังก์ชั่นหรือกับloess(x ~ y)ฉันสามารถดูแนวโน้มของซีรีส์เวลาโดยเฉพาะ ฉันต้องการตรวจสอบว่าแนวโน้มของอนุกรมเวลาเพิ่มขึ้นหรือลดลง ฉันจะจัดการสิ่งนั้นได้อย่างไร ฉันพยายามคำนวณสัมประสิทธิ์การถดถอยเชิงเส้นด้วยlm(x ~ y)และเล่นกับสัมประสิทธิ์ความชัน ( If |slope|&gt;2 and slope&gt;0 thenแนวโน้มเพิ่มขึ้นelse if |slope|&gt;2 and slope&lt;0- ลดลง) อาจมีวิธีอื่นและวิธีที่มีประสิทธิภาพกว่าสำหรับการตรวจจับแนวโน้ม? ขอบคุณ! ตัวอย่าง: ฉันมี,timeserie1 timeserie2ฉันต้องการอัลกอริทึมแบบง่ายที่จะบอกฉันว่าtimeserie2เป็นอัลกอริทึมที่เพิ่มขึ้นและในtimeserie1แนวโน้มไม่เพิ่มขึ้นหรือลดลง ฉันควรใช้เกณฑ์ใด timeserie1: 1774 1706 1288 1276 2350 1821 1712 1654 1680 1451 1275 2140 1747 1749 1770 1797 1485 1299 2330 1822 1627 1847 …
9 r  time-series  trend 

1
การติดตั้ง DLM สัมประสิทธิ์ตามเวลาที่ต่างกัน
ฉันต้องการให้พอดีกับ DLM ด้วยค่าสัมประสิทธิ์การแปรผันของเวลานั่นคือส่วนขยายของการถดถอยเชิงเส้นปกติ yt=θ1+θ2x2yt=θ1+θ2x2y_t = \theta_1 + \theta_2x_2. ฉันมีผู้ทำนาย (x2x2x_2) และตัวแปรตอบกลับ (ytyty_t) จับปลาประจำปีทางทะเลและในทะเลตามลำดับตั้งแต่ปี 1950 - 2011 ฉันต้องการให้โมเดลการถดถอย DLM ปฏิบัติตาม yt=θt,1+θt,2xtyt=θt,1+θt,2xty_t = \theta_{t,1} + \theta_{t,2}x_t สมการวิวัฒนาการของระบบอยู่ที่ไหน θt=Gtθt−1θt=Gtθt−1\theta_t = G_t \theta_{t-1} จากหน้า 43 ของโมเดลเชิงเส้นไดนามิกพร้อม R โดย Petris และคณะ บางรหัสที่นี่ fishdata &lt;- read.csv("http://dl.dropbox.com/s/4w0utkqdhqribl4/fishdata.csv", header=T) x &lt;- fishdata$marinefao y &lt;- fishdata$inlandfao lmodel &lt;- lm(y …

2
ข้อมูลอนุกรมเวลารวมจากแหล่งที่มีความละเอียดเชิงพื้นที่ / สเกลหลายตัว
ฉันมีภาพแรสเตอร์ดาวเทียมจำนวนมากจากเซ็นเซอร์ที่แตกต่างกัน จากสิ่งเหล่านี้ coarser มีความละเอียดทางโลกที่เหลือใช้มาก ตัวแก้ไขความละเอียดปานกลางมักจะมีวันที่ซื้อน้อย แต่ก็ยังมีข้อมูลบางส่วนอยู่ คนที่มีความละเอียดปลีกย่อยมีความคมชัดทางโลกต่ำมากซึ่งประกอบไปด้วยวันที่สังเกตจาก 2 ถึง 6 ในไม่เกินสองปี ฉันสงสัยว่าถ้าใครรู้ถึงความพยายามใด ๆ ในการศึกษาซีรีย์เวลาหลายขนาดประเภทนี้ในทางใดทางหนึ่ง? ฉันจะสนใจในการทำนายค่าในอนาคตที่ระดับปลีกย่อยโดยใช้ข้อมูลที่มีอยู่จาก coarser มันสมเหตุสมผลสำหรับฉันที่ข้อมูลจะต้องเกี่ยวข้อง (ใช่ภาพครอบคลุมภูมิภาคเดียวกัน) แต่ฉันไม่รู้ว่าจะเริ่มมีเพศสัมพันธ์ข้อมูลนี้ในรูปแบบการทำนาย

1
โมเดล Markov ที่ซ่อนอยู่สำหรับการทำนายเหตุการณ์
คำถาม : การตั้งค่าด้านล่างนี้ใช้งานได้ดีกับโมเดลซ่อนมาร์คอฟหรือไม่? ฉันมีชุดข้อมูลการ108,000สังเกต (ใช้เวลากว่า 100 วัน) และประมาณ2000เหตุการณ์ตลอดช่วงเวลาการสังเกตทั้งหมด ข้อมูลดูเหมือนว่ารูปด้านล่างที่ตัวแปรที่สังเกตสามารถใช้ค่าไม่ต่อเนื่อง 3 ค่าและคอลัมน์สีแดงเน้นเวลาเหตุการณ์เช่น 's:[ 1 , 2 , 3 ][1,2,3][1,2,3]เสื้อEเสื้อEt_E ดังที่แสดงด้วยสี่เหลี่ยมสีแดงในรูปฉันได้ตัด {ถึง } สำหรับแต่ละเหตุการณ์โดยปฏิบัติต่อสิ่งเหล่านี้อย่าง "หน้าต่างก่อนเหตุการณ์" ได้อย่างมีประสิทธิภาพเสื้อEเสื้อEt_Eเสื้อE- 5เสื้อE-5t_{E-5} การฝึกอบรม HMM:ฉันวางแผนที่จะฝึกอบรมโมเดล Markov ที่ซ่อนอยู่ (HMM) โดยอ้างอิงจาก "หน้าต่างก่อนเหตุการณ์ทั้งหมด" โดยใช้วิธีการสังเกตหลายฉากตามที่แนะนำในหน้า Pg 273 ของ Rabiner ของกระดาษ หวังว่านี่จะช่วยให้ฉันฝึก HMM ที่รวบรวมรูปแบบลำดับที่นำไปสู่เหตุการณ์ อืมทำนาย:แล้วฉันวางแผนที่จะใช้ HMM นี้เพื่อทำนาย ในวันที่ใหม่ที่จะเป็นเวกเตอร์หน้าต่างบานเลื่อนการปรับปรุงในเวลาจริงเพื่อให้มีการสังเกตระหว่างเวลาปัจจุบันและเป็นวันที่ไปl o g[ พี(Observations|HMM)]ล.โอก.[P(OขsอีRโวลต์aเสื้อผมโอns|HMM)]log[P(Observations|HMM)]ObservationsOขsอีRโวลต์aเสื้อผมโอnsObservationstเสื้อtt−5เสื้อ-5t-5 ฉันคาดว่าจะเห็นเพิ่มขึ้นสำหรับการที่มีลักษณะคล้ายกับ "หน้าต่างก่อนเหตุการณ์" …

1
การประเมินประสิทธิภาพการทำนายอนุกรมเวลา
ฉันมี Dynamic Naive Bayes Model ที่ได้รับการฝึกอบรมเกี่ยวกับตัวแปรทางโลกสองสามอย่าง ผลลัพธ์ของตัวแบบคือการทำนายP(Event) @ t+1โดยประมาณที่แต่ละtตัว พล็อตของP(Event)แทนที่จะtimeเป็นได้รับในรูปด้านล่าง ในรูปนี้เส้นสีดำแสดงถึงP(Event)แบบจำลองที่ทำนายไว้ เส้นสีแดงในแนวนอนหมายถึงความน่าจะเป็นสิ่งที่เกิดขึ้นก่อนเหตุการณ์; และเส้นแนวตั้งประเป็นตัวแทนเหตุการณ์ที่เกิดขึ้นห้าเหตุการณ์ในอนุกรมเวลา โดยหลักการแล้วฉันต้องการเห็นP(Event)จุดสูงสุดที่คาดการณ์ไว้ก่อนที่จะสังเกตเหตุการณ์ใด ๆ และอยู่ใกล้กับศูนย์เมื่อไม่มีโอกาสของเหตุการณ์ ฉันต้องการรายงานว่าแบบจำลองของฉัน (เส้นสีดำ) ทำงานได้ดีเพียงใดในการทำนายเหตุการณ์ที่เกิดขึ้น ผู้สมัครที่ชัดเจนที่จะเปรียบเทียบรูปแบบของฉันที่มีคือความน่าจะเป็นของเหตุการณ์ก่อน (เส้นสีแดง) ซึ่งหากใช้เป็น predictor- tจะทำนายค่าความน่าจะเป็นเหมือนกันสำหรับทุก อะไรคือสิ่งที่ดีที่สุดวิธีการอย่างเป็นทางการเพื่อให้บรรลุการเปรียบเทียบนี้? PS:ขณะนี้ฉันกำลังใช้การให้คะแนน (ใช้งานง่าย) ตามรหัสด้านล่างโดยที่คะแนนที่ต่ำกว่าโดยรวมบ่งบอกถึงประสิทธิภาพการทำนายที่ดีกว่า ฉันพบว่าจริง ๆ แล้วมันค่อนข้างยากที่จะเอาชนะก่อนด้วยการให้คะแนนนี้: # Get prediction performance model_score = 0; prior_score=0; for t in range(len(timeSeries)): if(timeSeries[t]== event): # event has happened cur_model_score …

2
พยากรณ์ ARIMA กับฤดูกาลและแนวโน้มผลลัพธ์แปลก
ขณะที่ฉันกำลังก้าวสู่การพยากรณ์ด้วยโมเดล ARIMA ฉันพยายามเข้าใจว่าฉันสามารถปรับปรุงการคาดการณ์ตามแบบของ ARIMA ให้สอดคล้องกับฤดูกาลและดริฟท์ได้อย่างไร ข้อมูลของฉันเป็นอนุกรมเวลาต่อไปนี้ (มากกว่า 3 ปีที่มีแนวโน้มที่ชัดเจนขึ้นและฤดูกาลที่มองเห็นได้ซึ่งดูเหมือนว่าจะไม่สนับสนุนโดยระบบอัตโนมัติที่ความล่าช้า 12, 24, 36 ??) &gt; bal2sum3years.ts Jan Feb Mar Apr May Jun Jul Aug 2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 …

1
การแปรปรวนเวลาแบบไดนามิกและการทำให้เป็นมาตรฐาน
ฉันใช้ Dynamic Time Warping เพื่อจับคู่ "เคียวรี" และเส้นโค้ง "เทมเพลต" และประสบความสำเร็จอย่างสมเหตุสมผล แต่ฉันมีคำถามพื้นฐาน: ฉันกำลังประเมิน "การจับคู่" โดยการประเมินว่าผลลัพธ์ DTW น้อยกว่าค่าเกณฑ์ที่ฉันคิดขึ้นเองหรือไม่ นี่เป็นวิธีทั่วไปในการพิจารณา "จับคู่" โดยใช้ DTW หรือไม่ ถ้าไม่ได้โปรดอธิบาย ... สมมติว่าคำตอบของ (1) คือ "ใช่" จากนั้นฉันสับสนเนื่องจากผลของ DTW ค่อนข้างอ่อนไหวต่อ a) ความแตกต่างของแอมพลิจูดของเส้นโค้งและ b) ความยาวของเวกเตอร์เคียวรีและความยาวของ " แม่แบบ "เวกเตอร์ ฉันใช้ฟังก์ชันขั้นตอนสมมาตรดังนั้นสำหรับ (b) ฉันกำลังทำให้ผลลัพธ์ DTW ของฉันเป็นปกติด้วยการหารด้วย M + N (ความกว้าง + ความสูงของเมทริกซ์ DTW) สิ่งนี้ดูเหมือนว่าจะค่อนข้างมีประสิทธิภาพ แต่ดูเหมือนว่ามันจะลงโทษการแข่งขัน …

3
ความแตกต่างทางแนวคิดระหว่าง heteroscedasticity และ non-stationarity
ฉันมีปัญหาในการแยกแยะความแตกต่างระหว่างแนวคิดเรื่องความไร้สติและความคงที่ ในขณะที่ฉันเข้าใจพวกเขา heteroscedasticity นั้นมีความแตกต่างกันในประชากรย่อยและผู้ที่ไม่อยู่กับที่ก็คือค่าเฉลี่ย / ความแปรปรวนที่เปลี่ยนแปลงตลอดเวลา หากสิ่งนี้เป็นความเข้าใจที่ถูกต้อง (แม้ว่าจะเป็นแบบง่ายๆ) การไม่อยู่นิ่ง ๆ เป็นเพียงกรณีเฉพาะของความแตกต่างระหว่างเวลาหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.