คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา


3
การประยุกต์ใช้ขั้นตอนวิธีการตรวจจับความผิดปกติของเวฟเล็ตตามอนุกรมเวลา
ฉันเริ่มทำงานผ่านทางบทเรียนการทำเหมืองข้อมูลทางสถิติโดย Andrew Moore (แนะนำเป็นอย่างยิ่งสำหรับคนอื่นที่เริ่มเข้ามาในสาขานี้) ฉันเริ่มต้นด้วยการอ่านPDF ที่น่าสนใจอย่างยิ่งนี้ในหัวข้อ "ภาพรวมเบื้องต้นของอัลกอริธึมการตรวจจับความผิดปกติตามอนุกรมเวลา"ซึ่งมัวร์ติดตามด้วยเทคนิคต่างๆที่ใช้ในการสร้างอัลกอริทึมในการตรวจหาการระบาดของโรค ครึ่งทางผ่านภาพนิ่งในหน้า 27 เขาแสดงรายการ "วิธีการอันทันสมัย" อื่น ๆ อีกจำนวนหนึ่งที่ใช้ในการตรวจจับการระบาด คนแรกที่ระบุไว้เป็นระลอกคลื่น Wikipeida อธิบายเวฟเล็ตเป็น การแกว่งของคลื่นคล้ายกับแอมพลิจูดที่เริ่มต้นที่ศูนย์เพิ่มและลดลงกลับเป็นศูนย์ โดยทั่วไปสามารถมองเห็นเป็น "การแกว่งสั้น ๆ " แต่ไม่ได้อธิบายถึงแอปพลิเคชันของพวกเขาต่อสถิติและการค้นหาโดย Google ของฉันให้ผลงานทางวิชาการสูงซึ่งถือว่ามีความรู้ว่าเวฟเล็ตเกี่ยวข้องกับสถิติหรือหนังสือเล่มเต็มในเรื่อง ฉันต้องการความเข้าใจขั้นพื้นฐานเกี่ยวกับวิธีการนำเวฟเล็ตมาใช้ในการตรวจจับความผิดปกติของอนุกรมเวลาซึ่งมัวร์แสดงให้เห็นถึงเทคนิคอื่น ๆ ในการสอนของเขา บางคนสามารถให้คำอธิบายเกี่ยวกับวิธีการตรวจจับโดยใช้งานเวฟเล็ตหรือลิงก์ไปยังบทความที่เข้าใจได้ในเรื่องนี้หรือไม่?

5
การค้นหาคำอธิบาย ARIMA บางประเภท
นี้อาจจะเป็นเรื่องยากที่จะหา แต่ฉันต้องการที่จะอ่านดีอธิบายตัวอย่าง ARIMAว่า ใช้คณิตศาสตร์น้อยที่สุด ขยายการอภิปรายนอกเหนือจากการสร้างแบบจำลองโดยใช้แบบจำลองนั้นเพื่อคาดการณ์กรณีเฉพาะ ใช้กราฟิกเช่นเดียวกับผลลัพธ์ที่เป็นตัวเลขเพื่อบอกลักษณะที่พอดีระหว่างค่าที่คาดการณ์และค่าจริง

2
การจัดกลุ่มเวกเตอร์อนุกรมเวลา R
ฉันมีอนุกรมเวลาและฉันต้องการเซตย่อยในขณะที่เก็บเป็นอนุกรมเวลารักษาจุดเริ่มต้นจุดจบและความถี่ ตัวอย่างเช่นสมมติว่าฉันมีอนุกรมเวลา: > qs <- ts(101:110, start=c(2009, 2), frequency=4) > qs Qtr1 Qtr2 Qtr3 Qtr4 2009 101 102 103 2010 104 105 106 107 2011 108 109 110 ตอนนี้ฉันจะเซตย่อย: > qs[time(qs) >= 2010 & time(qs) < 2011] [1] 104 105 106 107 โปรดสังเกตว่าฉันได้ผลลัพธ์ที่ถูกต้อง แต่ฉันสูญเสีย "wrappings" จากอนุกรมเวลา (เช่นเริ่มต้นสิ้นสุดความถี่) ฉันกำลังมองหาฟังก์ชั่นสำหรับสิ่งนี้ การไม่แบ่งเวลาอนุกรมเป็นสถานการณ์ทั่วไปใช่หรือไม่ เนื่องจากฉันยังไม่พบหนึ่งต่อไปนี้เป็นฟังก์ชันที่ฉันเขียน: …
25 r  time-series 

4
อัลกอริทึมสำหรับการตรวจจับความผิดปกติของอนุกรมเวลา
ฉันกำลังใช้ทวิตเตอร์ของ AnomalyDetection ใน R: https://github.com/twitter/AnomalyDetection อัลกอริทึมนี้ให้การตรวจจับความผิดปกติของอนุกรมเวลาสำหรับข้อมูลที่มีฤดูกาล คำถาม: มีอัลกอริธึมอื่น ๆ ที่คล้ายกันนี้หรือไม่ (การควบคุมตามฤดูกาลไม่สำคัญ) ฉันพยายามทำอัลกอริธึมอนุกรมเวลาให้ได้มากที่สุดเท่าที่จะเป็นไปได้ในข้อมูลของฉันเพื่อที่ฉันจะได้เลือกชุดที่ดีที่สุด

2
จะรวมคำศัพท์โต้ตอบใน GAM ได้อย่างไร
รหัสต่อไปนี้ประเมินความคล้ายคลึงกันระหว่างอนุกรมเวลาสองชุด: set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy = as.numeric(format(Date,format = "%j")), Tod = as.numeric(format(Date,format = "%H")), Temp = RandData, DecTime = rep(seq(1, length(RandData)/2) / (length(RandData)/2), 2)) require(mgcv) mod1 <- gam(Temp ~ Loc + s(Doy) + s(Doy,by …

3
ความสัมพันธ์ระหว่างอนุกรมเวลาสองชุด
วิธี / วิธีที่ง่ายที่สุดในการคำนวณความสัมพันธ์ระหว่างอนุกรมเวลาสองชุดที่มีขนาดเท่ากันคืออะไร ฉันคิดถึงการคูณและและเพิ่มการคูณ ดังนั้นถ้าเลขตัวเดียวนี้เป็นบวกเราสามารถบอกได้ว่าทั้งสองอนุกรมนั้นมีความสัมพันธ์กันหรือไม่? ฉันสามารถนึกถึงตัวอย่างบางส่วน แต่ที่อนุกรมเวลาที่เพิ่มขึ้นแบบทวีคูณเชิงเส้นจะไม่มีความสัมพันธ์กับแต่ละอื่น ๆ แต่การคำนวณข้างต้นจะรายงานว่ามีความสัมพันธ์กัน( y [ t ] - μ y )(x[t]−μx)(x[t]−μx)(x[t]-\mu_x)(y[t]−μy)(y[t]−μy)(y[t] - \mu_y) ความคิดใด ๆ

3
การวิเคราะห์อนุกรมเวลารายวัน
ฉันกำลังพยายามทำการวิเคราะห์อนุกรมเวลาและยังใหม่กับฟิลด์นี้ ฉันมีการนับเหตุการณ์ทุกวันตั้งแต่ปี 2549-2552 และฉันต้องการให้พอดีกับแบบจำลองอนุกรมเวลา นี่คือความก้าวหน้าที่ฉันได้ทำ: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) พล็อตผลที่ฉันได้รับคือ: เพื่อตรวจสอบว่ามีฤดูกาลและแนวโน้มในข้อมูลหรือไม่ฉันทำตามขั้นตอนที่กล่าวถึงในโพสต์นี้: ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) seasonal และในบล็อกของ Rob J Hyndman : library(fma) fit1 <- ets(x) fit2 <- ets(x,model="ANN") deviance <- 2*c(logLik(fit1) - logLik(fit2)) df <- attributes(logLik(fit1))$df - attributes(logLik(fit2))$df #P value 1-pchisq(deviance,df) ทั้งสองกรณีระบุว่าไม่มีฤดูกาล เมื่อฉันพล็อต ACF & PACF ของซีรีส์นี่คือสิ่งที่ฉันได้รับ: …

5
โมดูล Python สำหรับการวิเคราะห์จุดเปลี่ยน
ฉันกำลังมองหาโมดูล Python ที่ทำการวิเคราะห์จุดเปลี่ยนในอนุกรมเวลา มีอัลกอริทึมที่แตกต่างกันจำนวนหนึ่งและฉันต้องการสำรวจประสิทธิภาพของบางอันโดยไม่ต้องหมุนแต่ละอัลกอริทึม เป็นการดีที่ฉันต้องการโมดูลบางอย่างเช่นbcp (Bayesian Change Point) หรือแพ็คเกจstrucchangeใน R ฉันคาดว่าจะพบบางอย่างใน Scipy แต่ฉันไม่สามารถเปิดอะไรได้ ฉันประหลาดใจที่ไม่มีสิ่งอำนวยความสะดวกใน: statsmodels.tsa : เครื่องมือวิเคราะห์ทางสถิติอนุกรมเวลา scikits.timeseries : เครื่องมือการวิเคราะห์อนุกรมเวลาเพื่อขยาย scipy scipy.signal : เครื่องมือประมวลผลสัญญาณใน scipy มีโมดูลใดบ้างที่มีอัลกอริธึมตรวจจับการเปลี่ยนแปลงใน Python หรือไม่?

1
คำอธิบายของ Nate Silver ที่พูดถึงเหลือง
ในคำถามที่ฉันถามเมื่อเร็ว ๆ นี้ฉันได้รับการบอกว่ามันเป็นเรื่องใหญ่ "ไม่ห้าม" ในการคาดการณ์ด้วยเหลือง แต่ในบทความล่าสุดของ Nate Silver ใน FiveThirtyEight.comเขาได้พูดคุยกันโดยใช้คำทำนายการเลือกตั้ง เขากำลังพูดถึงลักษณะเฉพาะของการคาดการณ์ที่ก้าวร้าวและอนุรักษ์นิยมกับดินเหลือง แต่ฉันอยากรู้ว่าความถูกต้องของการคาดการณ์ในอนาคตจะเป็นอย่างไร ฉันยังสนใจในการสนทนานี้และมีทางเลือกอื่นที่อาจมีประโยชน์คล้ายกับเหลือง

1
คุณสมบัติของ PCA สำหรับการสังเกต
เรามักจะใช้ PCA เป็นเทคนิคการลดขนาดสำหรับข้อมูลที่กรณีจะถือว่าเป็น iid คำถาม:อะไรคือความแตกต่างทั่วไปในการใช้ PCA สำหรับข้อมูลที่ขึ้นกับข้อมูลที่ไม่ใช่ของ iid คุณสมบัติที่ดี / มีประโยชน์ของ PCA ที่เก็บไว้สำหรับข้อมูล iid นั้นถูกบุกรุก (หรือสูญหายทั้งหมด)? ตัวอย่างเช่นข้อมูลอาจเป็นอนุกรมเวลาหลายตัวแปรในกรณีที่ autocorrelation หรือ autorgressive heteroskedasticity ตามเงื่อนไข (ARCH) สามารถคาดหวังได้ มีคำถามที่เกี่ยวข้องหลายประการเกี่ยวกับการใช้ PCA กับข้อมูลอนุกรมเวลาซึ่งเคยมีการถามมาก่อนเช่น1 , 2 , 3 , 4แต่ฉันกำลังมองหาคำตอบทั่วไปและครอบคลุมมากขึ้น แก้ไข:ตามที่บันทึกไว้โดย @ttnphns ตัว PCA เองไม่ใช่การวิเคราะห์เชิงอนุมาน อย่างไรก็ตามหนึ่งอาจสนใจในการวางนัยทั่วไปของ PCA คือการเน้นไปที่ประชากรของ PCA ตัวอย่าง เช่นเขียนในNadler (2008) : สมมติว่าข้อมูลที่ได้รับเป็นตัวอย่าง จำกัด และสุ่มจากการแจกแจง (โดยทั่วไปไม่ทราบ) …

2
ผลที่ตามมาของการสร้างแบบจำลองกระบวนการที่ไม่หยุดนิ่งโดยใช้ ARMA?
ฉันเข้าใจว่าเราควรใช้ ARIMA สำหรับการสร้างแบบจำลองชุดเวลาที่ไม่หยุดนิ่ง นอกจากนี้ทุกสิ่งที่ฉันอ่านบอกว่า ARMA ควรใช้สำหรับอนุกรมเวลาที่อยู่กับที่เท่านั้น สิ่งที่ฉันพยายามจะทำความเข้าใจคืออะไรจะเกิดขึ้นในทางปฏิบัติเมื่อทำการแยกแยะแบบจำลองและสมมติว่าd = 0เป็นอนุกรมเวลาที่ไม่หยุดนิ่ง ตัวอย่างเช่น: controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44) ข้อมูลการควบคุมมีลักษณะดังนี้: [1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257 [6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225 [11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414 [16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267 [21] …

3
แบบจำลองการพยากรณ์แบบใดที่สามารถมองเห็นเป็นกรณีพิเศษของแบบจำลอง ARIMA
เช้านี้ฉันตื่นขึ้นมาด้วยความสงสัย (อาจเป็นเพราะข้อเท็จจริงที่ว่าเมื่อคืนฉันไม่ได้นอนมาก): เนื่องจากการตรวจสอบข้ามดูเหมือนจะเป็นรากฐานที่สำคัญของการพยากรณ์อนุกรมเวลาที่เหมาะสมแบบจำลองที่ฉันควรจะเป็น "ปกติ "ตรวจสอบข้ามกับ? ฉันมากับคนไม่กี่คน (ง่าย ๆ ) แต่ในไม่ช้าฉันก็รู้ว่าพวกเขาทั้งหมด แต่เป็นกรณีพิเศษของรุ่น ARIMA ดังนั้นตอนนี้ฉันก็สงสัยและนี่คือคำถามที่เกิดขึ้นจริงรูปแบบการพยากรณ์แบบใดที่ Box-Jenknins ได้รวมเข้าด้วยแล้ว ขอผมใช้วิธีนี้: Mean = ARIMA (0,0,0) ที่มีค่าคงที่ ไร้เดียงสา = ARIMA (0,1,0) Drift = ARIMA (0,1,0) ที่มีค่าคงที่ การยกกำลังอย่างง่ายแบบง่าย = ARIMA (0,1,1) การยกกำลังแบบเอ็กซ์โปเนนเชียลของโฮลท์ = ARIMA (0,2,2) Damped Holt's = ARIMA (0,1,2) สารเติมแต่งโฮลท์ - วินเทอร์: SARIMA (0,1, m + …

3
จะคำนวณ p-value ของพารามิเตอร์สำหรับ ARIMA model ใน R ได้อย่างไร?
เมื่อทำการวิจัยอนุกรมเวลาใน R ฉันพบว่าarima ให้เฉพาะค่าสัมประสิทธิ์และข้อผิดพลาดมาตรฐานของโมเดลที่ติดตั้ง อย่างไรก็ตามฉันต้องการได้รับ p-value ของสัมประสิทธิ์ ฉันไม่พบฟังก์ชันใด ๆ ที่ให้ความสำคัญของ coef ดังนั้นฉันต้องการคำนวณด้วยตัวเอง แต่ฉันไม่รู้ระดับความอิสระในการแจกแจงค่า t หรือ chisq ของสัมประสิทธิ์ ดังนั้นคำถามของฉันคือทำอย่างไรจึงจะได้ค่า p สำหรับสัมประสิทธิ์ของแบบจำลอง arima ที่พอดีใน R?


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.