คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

1
การพยากรณ์อนุกรมเวลาด้วยข้อมูลรายวัน: ARIMA พร้อม regressor
ฉันใช้ชุดข้อมูลการขายรายวันที่มีจุดข้อมูลรายวันประมาณ 2 ปี จากบทเรียนออนไลน์ / ตัวอย่างบางส่วนฉันพยายามระบุฤดูกาลในข้อมูล ดูเหมือนว่ามีรายสัปดาห์รายเดือนและอาจเป็นระยะ / ปีตามฤดูกาล ตัวอย่างเช่นมีวันจ่ายเงินโดยเฉพาะอย่างยิ่งในวันที่ 1 ของเดือนที่มีผลในสองสามวันในช่วงสัปดาห์ นอกจากนี้ยังมีเอฟเฟกต์วันหยุดบางอย่างซึ่งสามารถระบุได้อย่างชัดเจนโดยสังเกตจากการสังเกต เมื่อติดตั้งกับข้อสังเกตเหล่านี้ฉันได้ลองทำสิ่งต่อไปนี้: ARIMA (พร้อมArimaและauto.arimaจากแพคเกจ R- คาดการณ์) โดยใช้ regressor (และค่าเริ่มต้นอื่น ๆ ที่จำเป็นในการทำงาน) regressor ที่ฉันสร้างนั้นเป็นเมทริกซ์ที่มีค่า 0/1: ตัวแปร 11 เดือน (n-1) 12 ตัวแปรวันหยุด ไม่สามารถหาส่วนของวันจ่ายเงินได้ ... เนื่องจากมันมีผลกระทบที่ซับซ้อนกว่าที่ฉันคิดเล็กน้อย เอฟเฟกต์ payday ทำงานแตกต่างกันไปขึ้นอยู่กับวันทำงานของวันที่ 1 ของเดือน ฉันใช้ 7 (เช่นความถี่รายสัปดาห์) เพื่อทำโมเดลอนุกรมเวลา ฉันลองทดสอบ - คาดการณ์ครั้งละ 7 วัน ผลลัพธ์มีความสมเหตุสมผล: …

2
อนุกรมเวลาและการตรวจจับความผิดปกติ
ฉันต้องการติดตั้งอัลกอริทึมสำหรับตรวจจับความผิดปกติในอนุกรมเวลาและฉันวางแผนที่จะใช้การทำคลัสเตอร์สำหรับสิ่งนั้น เหตุใดฉันจึงควรใช้เมทริกซ์ระยะทางสำหรับการจัดกลุ่มและไม่ใช่ข้อมูลอนุกรมเวลา สำหรับการตรวจจับความผิดปกติฉันจะใช้การจัดกลุ่มตามความหนาแน่นอัลกอริธึมเป็น DBscan ดังนั้นกรณีนี้จะใช้ได้หรือไม่ มีเวอร์ชั่นออนไลน์สำหรับการสตรีมข้อมูลหรือไม่ ฉันต้องการตรวจจับความผิดปกติก่อนที่จะเกิดขึ้นดังนั้นการใช้อัลกอริธึมการตรวจจับแนวโน้ม (ARIMA) เป็นทางเลือกที่ดีหรือไม่?

4
ทดสอบความแตกต่างอย่างมีนัยสำคัญทางสถิติในอนุกรมเวลาหรือไม่
ฉันมีอนุกรมเวลาของราคาของหลักทรัพย์สองหลักทรัพย์คือ A และ B ในช่วงเวลาเดียวกันและเก็บตัวอย่างที่ความถี่เดียวกัน ฉันต้องการทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญทางสถิติในช่วงเวลาระหว่างราคาทั้งสองหรือไม่ (สมมติฐานว่างของฉันคือความแตกต่างนั้นเป็นโมฆะ) โดยเฉพาะฉันใช้ความแตกต่างของราคาเป็นตัวแทนเพื่อประสิทธิภาพของตลาด ลองนึกภาพ A และ B เป็นระบบรักษาความปลอดภัยและการสังเคราะห์ที่เทียบเท่ากัน (นั่นคือทั้งสองอ้างว่ากระแสเงินสดเท่ากันทั้งหมด) หากตลาดมีประสิทธิภาพทั้งคู่ควรมีราคาเท่ากัน (ยกเว้นค่าใช้จ่ายการทำธุรกรรมที่แตกต่างกัน ฯลฯ ) หรือผลต่างราคาเป็นศูนย์ นี่คือสิ่งที่ฉันต้องการทดสอบ วิธีที่ดีที่สุดที่จะทำคืออะไร? ฉันอาจใช้การทดสอบ t-test แบบสองด้านกับอนุกรมเวลา "ความแตกต่าง" เช่นในอนุกรมเวลา AB และทดสอบสำหรับ = 0 อย่างไรก็ตามฉันมีข้อสงสัยว่าอาจมีการทดสอบที่มีประสิทธิภาพมากกว่าซึ่งคำนึงถึงสิ่งต่าง ๆ เช่นข้อผิดพลาด homoskedastic ที่อาจเกิดขึ้นหรือการปรากฏตัวของค่าผิดปกติ โดยทั่วไปมีสิ่งที่ต้องระวังเมื่อทำงานกับราคาหลักทรัพย์หรือไม่μ0μ0\mu_0

6
วิธีการตรวจสอบการเปลี่ยนแปลงที่สำคัญในข้อมูลอนุกรมเวลาเนื่องจากการเปลี่ยนแปลง "นโยบาย"?
ฉันหวังว่านี่เป็นสถานที่ที่เหมาะสมในการโพสต์นี้ฉันคิดว่าการโพสต์ไว้ในคลางแคลง แต่ฉันคิดว่าพวกเขาแค่บอกว่าการศึกษานั้นผิดทางสถิติ ฉันอยากรู้เกี่ยวกับด้านพลิกของคำถามซึ่งเป็นวิธีการที่ถูกต้อง บนเว็บไซต์Quantified Selfผู้เขียนโพสต์ผลการทดลองของตัวชี้วัดผลลัพธ์ที่วัดได้ด้วยตนเองเมื่อเวลาผ่านไปและเปรียบเทียบก่อนและหลังหยุดดื่มกาแฟทันที ผลลัพธ์ได้รับการประเมินตามอัตวิสัยและผู้เขียนเชื่อว่าเขามีหลักฐานว่ามีการเปลี่ยนแปลงในอนุกรมเวลาและเกี่ยวข้องกับการเปลี่ยนแปลงในนโยบาย (ดื่มกาแฟ) สิ่งนี้ทำให้ฉันนึกถึงเป็นแบบจำลองของเศรษฐกิจ เรามีเพียงเศรษฐกิจเดียว (ที่เราใส่ใจในขณะนี้) ดังนั้นนักเศรษฐศาสตร์จึงมักทำการทดลองโดย n = 1 ข้อมูลมีความสัมพันธ์กันโดยอัตโนมัติเมื่อเวลาผ่านไปเนื่องจากเหตุผลนี้ นักเศรษฐศาสตร์โดยทั่วไปกำลังจับตามองเฟดพูดว่าขณะที่มันเริ่มนโยบายและพยายามที่จะตัดสินใจว่าอนุกรมเวลามีการเปลี่ยนแปลงหรือไม่ การทดสอบที่เหมาะสมคืออะไรเพื่อพิจารณาว่าอนุกรมเวลามีการเพิ่มขึ้นหรือลดลงตามข้อมูลหรือไม่ ฉันต้องการข้อมูลมากแค่ไหน มีเครื่องมืออะไรบ้าง? googling ครั้งแรกของฉันแนะนำรุ่นของ Markov Switching Time Series แต่ทักษะ googling ของฉันไม่ทำให้ฉันล้มเหลวในการช่วยทำทุกอย่างด้วยชื่อของเทคนิค

1
Eigenfunctions ของ adjacency matrix ของอนุกรมเวลา?
พิจารณาอนุกรมเวลาง่ายๆ > tp <- seq_len(10) > tp [1] 1 2 3 4 5 6 7 8 9 10 เราสามารถคำนวณเมทริกซ์ adjacency สำหรับอนุกรมเวลานี้ซึ่งเป็นตัวแทนของการเชื่อมโยงชั่วคราวระหว่างกลุ่มตัวอย่าง ในการคำนวณเมทริกซ์นี้เราเพิ่มไซต์จินตภาพในเวลา 0 และลิงก์ระหว่างการสังเกตนี้และการสังเกตจริงครั้งแรก ณ เวลา 1 เรียกว่าลิงก์ 0 ระหว่างเวลา 1 และเวลา 2 ลิงก์คือลิงค์ 1 และอื่น ๆ เนื่องจากเวลาเป็นกระบวนการกำหนดทิศทางเว็บไซต์จึงเชื่อมต่อกับลิงก์ (ที่ได้รับผลกระทบ) ซึ่งเป็น "อัปสตรีม" ของไซต์ ดังนั้นทุกไซต์เชื่อมต่อกับลิงค์ 0 แต่ลิงค์ 9 เชื่อมต่อกับไซต์ 10 เท่านั้น มันเกิดขึ้นชั่วคราวหลังจากแต่ละไซต์ยกเว้นไซต์ …

4
วิธีสร้างข้อมูลอนุกรมเวลาไบนารีอัตโนมัติแบบสุ่มที่มีความสัมพันธ์กันอย่างไร
ฉันจะสร้างอนุกรมเวลาแบบไบนารี่ได้อย่างไร: ความน่าจะเป็นโดยเฉลี่ยของการสังเกต 1 ถูกระบุ (พูด 5%) ความน่าจะเป็นแบบมีเงื่อนไขของการสังเกต 1 ที่เวลาให้ค่าที่t - 1 (พูด 30% ถ้าt - 1tttt−1t−1t-1t−1t−1t-1เท่ากับ 1)?

1
จะตรวจสอบแบบจำลองใดได้ดีกว่าในการวิเคราะห์อนุกรมเวลาในสภาวะอวกาศ?
ฉันกำลังทำการวิเคราะห์ข้อมูลอนุกรมเวลาโดยวิธีการของพื้นที่รัฐ ด้วยข้อมูลของฉันแบบจำลองระดับท้องถิ่นแบบสุ่มที่ทำได้ดีกว่าแบบกำหนดแน่นอน แต่แบบกำหนดระดับและแบบลาดชันให้ผลลัพธ์ที่ดีกว่าระดับสุ่มและความชันแบบสุ่ม เป็นเรื่องปกติหรือไม่ วิธีการทั้งหมดใน R ต้องการค่าเริ่มต้นและฉันอ่านบางแห่งที่เหมาะสมกับแบบจำลอง ARIMA ก่อนและรับค่าจากที่นั่นเนื่องจากค่าเริ่มต้นสำหรับการวิเคราะห์พื้นที่ของรัฐเป็นวิธีหนึ่ง ไปได้หรือไม่ หรือข้อเสนออื่น ๆ ? ฉันควรสารภาพที่นี่ว่าฉันใหม่ทั้งหมดในการวิเคราะห์พื้นที่ของรัฐ

3
จะรวมข้อมูลนาทีเป็นเวลาหนึ่งสัปดาห์เป็นรายชั่วโมงได้อย่างไร
คุณจะได้รับค่าเฉลี่ยรายชั่วโมงสำหรับคอลัมน์ข้อมูลหลายรายการเป็นระยะเวลารายวันอย่างไรและแสดงผลลัพธ์สำหรับ "โฮสต์" สิบสองรายการในกราฟเดียวกัน นั่นคือฉันต้องการกราฟว่าระยะเวลา 24 ชั่วโมงเป็นอย่างไรสำหรับสัปดาห์ที่มีค่าของข้อมูล เป้าหมายสุดท้ายคือการเปรียบเทียบข้อมูลสองชุดนี้ก่อนและหลังการสุ่มตัวอย่าง dates Host CPUIOWait CPUUser CPUSys 1 2011-02-11 23:55:12 db 0 14 8 2 2011-02-11 23:55:10 app1 0 6 1 3 2011-02-11 23:55:09 app2 0 4 1 ฉันสามารถเรียกใช้ xyplot (CPUUser ~ เดท | โฮสต์) ได้ดี อย่างไรก็ตามแทนที่จะแสดงแต่ละวันในสัปดาห์ฉันต้องการให้แกน X เป็นชั่วโมงของวัน การพยายามนำข้อมูลนี้ไปไว้ในวัตถุ xts ทำให้เกิดข้อผิดพลาดเช่น"order.by ต้องใช้วัตถุตามเวลาที่เหมาะสม" นี่คือ str …

3
การแนะนำที่ดีกับอนุกรมเวลา (พร้อม R)
ขณะนี้ฉันกำลังรวบรวมข้อมูลสำหรับการทดลองในลักษณะทางจิตสังคมที่เกี่ยวข้องกับประสบการณ์ความเจ็บปวด เป็นส่วนหนึ่งของเรื่องนี้ฉันกำลังรวบรวมการวัด GSR และ BP ทางอิเล็กทรอนิกส์จากผู้เข้าร่วมของฉันพร้อมกับรายงานตนเองและมาตรการโดยนัย ฉันมีภูมิหลังทางจิตวิทยาและรู้สึกสบายใจกับการวิเคราะห์ปัจจัยตัวแบบเชิงเส้นและการวิเคราะห์เชิงทดลอง คำถามของฉันคือทรัพยากรที่มีประโยชน์ (ฟรี) ที่ดีสำหรับการเรียนรู้เกี่ยวกับการวิเคราะห์อนุกรมเวลา ฉันเป็น newb รวมเมื่อมันมาถึงพื้นที่นี้ดังนั้นความช่วยเหลือใด ๆ จะได้รับการชื่นชมอย่างมาก ฉันมีข้อมูลนำร่องที่จะฝึกปฏิบัติ แต่ต้องการให้แผนวิเคราะห์ของฉันทำงานโดยละเอียดก่อนที่ฉันจะรวบรวมข้อมูลให้เสร็จ หากการอ้างอิงที่ให้นั้นเกี่ยวข้องกับ R นั่นก็คงจะวิเศษมาก แก้ไข: เพื่อเปลี่ยนไวยากรณ์และเพื่อเพิ่ม 'รายงานตนเองและมาตรการโดยนัย'

3
การพิจารณาว่าเว็บไซต์ทำงานอยู่หรือไม่โดยใช้การเข้าชมรายวัน
บริบท: ฉันมีกลุ่มเว็บไซต์ที่ฉันบันทึกจำนวนการเข้าชมรายวัน: W0 = { 30, 34, 28, 30, 16, 13, 8, 4, 0, 5, 2, 2, 1, 2, .. } W1 = { 1, 3, 21, 12, 10, 20, 15, 43, 22, 25, .. } W2 = { 0, 0, 4, 2, 2, 5, 3, 30, 50, 30, 30, …

4
ความคล้ายคลึงกันทางสถิติของอนุกรมเวลา
หากว่าใครมีอนุกรมเวลาซึ่งสามารถวัดต่าง ๆ เช่นระยะเวลาสูงสุดต่ำสุดเฉลี่ย ฯลฯ แล้วใช้สิ่งเหล่านี้เพื่อสร้างแบบจำลองคลื่นไซน์ที่มีคุณลักษณะเดียวกันมีวิธีการทางสถิติใดที่สามารถใช้วัดปริมาณได้ ข้อมูลจริงที่ตรงกับตัวแบบที่สันนิษฐานมากแค่ไหน จำนวนจุดข้อมูลในชุดข้อมูลจะอยู่ระหว่าง 10 ถึง 50 คะแนน ความคิดแรกที่ง่ายที่สุดของฉันคือการกำหนดค่าให้กับทิศทางการเคลื่อนที่ของคลื่นไซน์เช่น +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1 ทำแบบเดียวกันกับข้อมูลจริงจากนั้นก็หาค่าปริมาณของความคล้ายคลึงกันของทิศทางการเคลื่อนไหว แก้ไข: ให้ความคิดกับสิ่งที่ฉันต้องการทำกับข้อมูลของฉันมากขึ้นและจากการตอบคำถามเดิมของฉันสิ่งที่ฉันต้องการก็คืออัลกอริทึมการตัดสินใจเลือกระหว่างสมมติฐานที่แข่งขันกัน: นั่นคือข้อมูลของฉันเป็นเส้นตรง (หรือ แนวโน้ม) ด้วยเสียงที่อาจมีองค์ประกอบที่เป็นวงจร ข้อมูลของฉันนั้นเป็นวัฏจักรที่ไม่มีแนวโน้มที่จะพูดถึง ข้อมูลนั้นเป็นเพียงแค่เสียงรบกวน หรือเป็นการเปลี่ยนแปลงระหว่างสถานะใด ๆ เหล่านี้ ความคิดของฉันตอนนี้อาจรวมรูปแบบของการวิเคราะห์แบบเบย์กับ Euclidean / LMS ขั้นตอนในวิธีการนี้จะเป็น สร้างคลื่นไซน์ที่สันนิษฐานจากการวัดข้อมูล ติดตั้ง LMS ให้ตรงกับข้อมูล สืบทอด …

2
มีโมเดล cointegration สำหรับอนุกรมเวลาที่เว้นระยะผิดปกติหรือไม่?
ฉันยังไม่ชัดเจนในการคำนวณ cointegration ด้วยอนุกรมเวลาที่ผิดปกติ (ควรใช้แบบทดสอบ Johansenกับ VECM) ความคิดเริ่มต้นของฉันคือการทำให้ซีรีส์เป็นแบบปกติและแก้ไขค่าที่หายไปแม้ว่าจะมีอคติในการประมาณค่า มีวรรณกรรมในเรื่องนี้บ้างไหม?

2
เหตุใดการคาดการณ์ของอนุกรมเวลาจึง“ แย่มาก”
ฉันพยายามเรียนรู้วิธีใช้ Neural Networks ฉันกำลังอ่านบทช่วยสอนนี้ หลังจากติดตั้งโครงข่ายประสาทในอนุกรมเวลาโดยใช้ค่าที่เพื่อทำนายค่าที่t + 1ผู้เขียนได้รับพล็อตต่อไปนี้โดยที่เส้นสีฟ้าคืออนุกรมเวลาสีเขียวคือการทำนายข้อมูลรถไฟสีแดงคือ การคาดการณ์ข้อมูลการทดสอบ (เขาใช้การทดสอบรถไฟแบบแยก)เสื้อเสื้อtt + 1เสื้อ+1t+1 และเรียกมันว่า "เราจะเห็นว่าแบบจำลองนั้นทำงานได้ค่อนข้างแย่ในการปรับทั้งชุดฝึกอบรมและชุดทดสอบ เสื้อเสื้อtt - 1เสื้อ-1t-1t - 2เสื้อ-2t-2t + 1เสื้อ+1t+1 และพูดว่า "เมื่อมองที่กราฟเราจะเห็นโครงสร้างเพิ่มเติมในการทำนาย" คำถามของฉัน ทำไมคนยากจนคนแรก? มันเกือบจะสมบูรณ์แบบสำหรับฉันมันทำนายการเปลี่ยนแปลงทุกอย่างสมบูรณ์แบบ และในทำนองเดียวกันทำไมอันดับสองถึงดีกว่า? "โครงสร้าง" อยู่ที่ไหน สำหรับฉันมันดูด้อยกว่าครั้งแรกมาก โดยทั่วไปการคาดการณ์ของซีรีย์เวลาจะดีและเมื่อไร

1
อนุกรมเวลาหลายตัวแปรชีวภาพ: VAR และฤดูกาล
ฉันมีชุดข้อมูลอนุกรมเวลาหลายตัวแปรรวมถึงตัวแปรชีวภาพและสิ่งแวดล้อมที่มีปฏิสัมพันธ์ (รวมถึงตัวแปรภายนอกบางอย่าง) นอกจากฤดูกาลแล้วไม่มีข้อมูลในระยะยาวที่ชัดเจน จุดประสงค์ของฉันคือการดูว่าตัวแปรใดบ้างที่เกี่ยวข้องกัน การคาดการณ์นั้นไม่ได้ถูกมองหา เป็นเรื่องใหม่สำหรับการวิเคราะห์อนุกรมเวลาฉันอ่านการอ้างอิงหลายอย่าง เท่าที่ฉันเข้าใจโมเดล Vector Autoregressive (VAR) จะเหมาะสม แต่ฉันรู้สึกไม่สะดวกกับฤดูกาลและตัวอย่างส่วนใหญ่ที่ฉันพบในสาขาเศรษฐศาสตร์ที่เกี่ยวข้อง (บ่อยครั้งกับการวิเคราะห์อนุกรมเวลา ... ) โดยไม่มีฤดูกาล ฉันควรทำอย่างไรกับข้อมูลตามฤดูกาลของฉัน ฉันถือว่าพวกเขา deseasonalizing - ตัวอย่างเช่นใน R ฉันจะใช้decomposeแล้วใช้$trend + $randค่าเพื่อรับสัญญาณที่ปรากฏนิ่งสวย (ตามการตัดสินต่อacf) ผลลัพธ์ของแบบจำลอง VAR ทำให้ฉันสับสน (แบบจำลองแบบ 1-lag ถูกเลือกในขณะที่ฉันคาดหวังอย่างสังหรณ์ใจมากขึ้นและมีค่าสัมประสิทธิ์สำหรับการตอบโต้อัตโนมัติเท่านั้น ฉันกำลังทำอะไรผิดหรือฉันควรสรุปว่าตัวแปรของฉันไม่เกี่ยวข้อง (เป็นเส้นตรง) / โมเดลของฉันไม่ใช่คำถามที่ดี (คำถามย่อย: มี VAR ที่ไม่ใช่เชิงเส้นเทียบเท่าหรือไม่) [อีกวิธีหนึ่งฉันอ่านฉันอาจใช้ตัวแปรตามฤดูกาลได้แม้ว่าฉันจะไม่สามารถทราบได้ว่าจะนำไปใช้อย่างไร] คำแนะนำทีละขั้นตอนจะได้รับการชื่นชมอย่างมากเนื่องจากรายละเอียดสำหรับผู้ใช้ที่มีประสบการณ์อาจให้ข้อมูลกับฉัน (และตัวอย่างโค้ด R หรือลิงก์ไปยังตัวอย่างที่เป็นรูปธรรมยินดีต้อนรับแน่นอน)

4
สถิติ Ljung-Box สำหรับ ARIMA ที่เหลือใน R: ผลการทดสอบที่สับสน
ฉันมีอนุกรมเวลาที่ฉันพยายามคาดการณ์ซึ่งฉันใช้ ARIMA ตามฤดูกาล (0,0,0) (0,1,0) [12] โมเดล (= fit2) มันแตกต่างจากสิ่งที่ R แนะนำกับ auto.arima (R คำนวณ ARIMA (0,1,1) (0,1,0) [12] น่าจะเหมาะกว่าฉันตั้งชื่อมันว่า fit1) อย่างไรก็ตามในช่วง 12 เดือนสุดท้ายของซีรีส์เวลาของฉันโมเดลของฉัน (พอดี 2) ดูเหมือนจะดีกว่าเมื่อปรับแล้ว (มันมีอคติเรื้อรังฉันได้เพิ่มค่าเฉลี่ยที่เหลือ นี่คือตัวอย่างของ 12 เดือนล่าสุดและ MAPE สำหรับ 12 เดือนล่าสุดสำหรับทั้งสองพอดี: อนุกรมเวลามีลักษณะดังนี้: จนถึงตอนนี้ดีมาก ฉันทำการวิเคราะห์ที่เหลือสำหรับทั้งสองรุ่นและนี่คือความสับสน acf (ส่วนที่เหลือ (พอดี 1)) ดูดีมากเสียงดังมาก: อย่างไรก็ตามการทดสอบ Ljung-Box นั้นดูไม่ดีเช่น 20 lags: Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1) ฉันได้รับผลลัพธ์ต่อไปนี้: …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.