คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

2
สัญชาตญาณของกระบวนการย้อนกลับในอนุกรมเวลาคืออะไร?
ฉันกำลังอ่านหนังสือเกี่ยวกับอนุกรมเวลาและเริ่มเกาหัวในส่วนต่อไปนี้: ใครช่วยอธิบายสัญชาตญาณให้ฉันได้บ้าง ฉันไม่สามารถรับมันจากข้อความนี้ ทำไมเราต้องมีกระบวนการที่จะกลับด้านได้? ภาพใหญ่ที่นี่คืออะไร? ขอบคุณสำหรับความช่วยเหลือ ฉันใหม่กับสิ่งนี้ดังนั้นหากคุณสามารถใช้คำศัพท์ระดับนักเรียนเมื่ออธิบายสิ่งนี้ :)
19 time-series  arma 

2
การทดสอบสมมติฐานและความสำคัญของอนุกรมเวลา
การทดสอบความสำคัญตามปกติเมื่อค้นหาประชากรสองคนคือ t-test, paired t-test หากเป็นไปได้ นี่ถือว่าการกระจายเป็นปกติ มีข้อสมมติฐานที่ทำให้เข้าใจง่ายที่คล้ายกันที่สร้างการทดสอบนัยสำคัญสำหรับอนุกรมเวลาหรือไม่? โดยเฉพาะเรามีประชากรหนูสองตัวที่ค่อนข้างเล็กซึ่งกำลังได้รับการปฏิบัติแตกต่างกันและเราทำการวัดน้ำหนักสัปดาห์ละครั้ง กราฟทั้งสองแสดงฟังก์ชั่นที่เพิ่มขึ้นอย่างราบรื่นด้วยกราฟหนึ่งกราฟเหนืออีกแน่นอน เราจะหาปริมาณ "ความชัดเจน" ในบริบทนี้ได้อย่างไร สมมติฐานว่างควรเป็นว่าน้ำหนักของประชากรทั้งสอง "ทำงานในลักษณะเดียวกัน" เมื่อเวลาผ่านไป เราจะกำหนดรูปแบบนี้ในรูปแบบง่าย ๆ ที่เป็นเรื่องธรรมดา (เช่นเดียวกับการแจกแจงแบบปกติทั่วไป) ด้วยพารามิเตอร์จำนวนเล็กน้อยเท่านั้น เมื่อเราทำเช่นนั้นแล้วเราจะวัดความสำคัญหรือสิ่งที่คล้ายคลึงกับค่า p ได้อย่างไร แล้วการจับคู่เมาส์จับคู่ลักษณะให้ได้มากที่สุดโดยแต่ละคู่มีตัวแทนหนึ่งคนจากประชากรสองคนแต่ละคน ฉันยินดีต้อนรับตัวชี้ไปยังหนังสือหรือบทความที่เกี่ยวข้องที่เขียนได้ดีและเข้าใจได้ง่ายเกี่ยวกับอนุกรมเวลา ฉันเริ่มเป็นคนโง่เขลา ขอบคุณสำหรับความช่วยเหลือของคุณ. David Epstein

3
เป็นตัวอย่างที่ดีที่ซีรีส์ที่ไม่มีรูทยูนิตไม่ใช่เครื่องเขียน
ฉันเคยเห็นหลายครั้งที่ผู้คนปฏิเสธโมฆะในการทดสอบเพิ่ม Dickey-Fullerแล้วอ้างว่ามันแสดงให้เห็นว่าซีรี่ส์ของพวกเขานั้นอยู่กับที่ (แต่น่าเสียดายที่ฉันไม่สามารถแสดงแหล่งที่มาของการอ้างสิทธิ์เหล่านี้ได้ วารสารหนึ่งฉบับหรืออีกฉบับหนึ่ง) ฉันยืนยันว่ามันเป็นความเข้าใจผิด (การปฏิเสธโมฆะของหน่วยรากนั้นไม่จำเป็นต้องเป็นแบบเดียวกับที่มีชุดเครื่องเขียนโดยเฉพาะอย่างยิ่งเนื่องจากรูปแบบทางเลือกที่ไม่เป็นทางเลือกจะไม่ค่อยถูกตรวจสอบหรือพิจารณาเมื่อทำการทดสอบเช่นนั้น) สิ่งที่ฉันค้นหาคือ: a) ตัวอย่างที่ชัดเจนที่ชัดเจนเกี่ยวกับการอ้างสิทธิ์ (ฉันนึกภาพออกได้สองสามคนตอนนี้ แต่ฉันพนันได้ว่าคนอื่นที่ไม่ใช่ฉันจะมีสิ่งที่ดีกว่าที่ฉันคิดไว้) มันอาจเป็นคำอธิบายของสถานการณ์ที่เฉพาะเจาะจงอาจมีข้อมูล (จำลองหรือจริงทั้งสองมีข้อดี) หรือ b) ข้อโต้แย้งที่น่าเชื่อถือว่าทำไมการปฏิเสธในส่วนที่เพิ่มขึ้นของ Dickey-Fuller ควรถูกมองว่าเป็นการสร้างความคงที่ (หรือแม้กระทั่งทั้งคู่ (ก) และ (ข) หากคุณรู้สึกฉลาด)

2
การปรับให้เรียบ - ควรใช้เมื่อใดและเมื่อใด?
มีโพสต์เก่า ๆ บนบล็อกของ William Briggsซึ่งดูที่ข้อผิดพลาดของการทำให้ข้อมูลเรียบและดำเนินการกับข้อมูลที่ราบรื่นผ่านการวิเคราะห์ อาร์กิวเมนต์ที่สำคัญคือ: หากในช่วงเวลาหนึ่งของความบ้าคุณทำข้อมูลอนุกรมเวลาที่ราบรื่นและคุณใช้มันเป็นข้อมูลป้อนเข้าในการวิเคราะห์อื่น ๆ คุณจะเพิ่มโอกาสในการหลอกตัวเองได้อย่างมาก! เพราะนี่คือการทำให้ราบรื่นสัญญาณปลอม - สัญญาณที่ดูสมจริงกับวิธีการวิเคราะห์อื่น ๆ ไม่ว่าคุณจะแน่ใจในผลลัพธ์สุดท้ายของคุณมากเกินไป! อย่างไรก็ตามฉันพยายามดิ้นรนเพื่อหาบทสนทนาที่ครอบคลุมว่าจะราบรื่นหรือไม่และเมื่อใด มันขมวดคิ้วเพียงเพื่อทำให้ราบรื่นเมื่อใช้ข้อมูลที่ทำให้ราบเรียบเป็นข้อมูลการวิเคราะห์อื่น ๆ หรือมีสถานการณ์อื่น ๆ เมื่อไม่แนะนำให้เรียบ? ในทางกลับกันมีสถานการณ์ที่ควรปรับให้เรียบหรือไม่?

5
การตรวจจับการเปลี่ยนแปลงในอนุกรมเวลา (ตัวอย่าง R)
ฉันต้องการตรวจจับการเปลี่ยนแปลงในข้อมูลอนุกรมเวลาซึ่งมักจะมีรูปร่างเหมือนกัน จนถึงตอนนี้ฉันได้ทำงานกับchangepointแพ็คเกจสำหรับ R และcpt.mean(), cpt.var()และcpt.meanvar()ฟังก์ชั่น cpt.mean()ด้วยวิธี PELT จะทำงานได้ดีเมื่อข้อมูลอยู่ในระดับเดียว อย่างไรก็ตามฉันต้องการตรวจจับการเปลี่ยนแปลงในระหว่างการแทรก ตัวอย่างของการเปลี่ยนแปลงที่ฉันต้องการตรวจสอบคือส่วนที่เส้นโค้งสีดำลดลงอย่างกระทันหันในขณะที่จริงควรทำตามเส้นประสีแดงแบบตัวอย่าง ฉันได้ทดลองกับฟังก์ชัน cpt.var () แต่ฉันไม่ได้ผลลัพธ์ที่ดี คุณได้รับคำแนะนำ (ที่ไม่จำเป็นต้องใช้ R) หรือไม่? นี่คือข้อมูลที่มีการเปลี่ยนแปลง (เป็นวัตถุ R): dat.change <- c(12.013995263488, 11.8460207231808, 11.2845153487846, 11.7884417180764, 11.6865425802022, 11.4703118125303, 11.4677576899063, 11.0227199625084, 11.274775836817, 11.03073498338, 10.7771805591742, 10.7383206158923, 10.5847230134625, 10.2479315651441, 10.4196381241735, 10.467607842288, 10.3682422713283, 9.7834431752935, 9.76649842404295, 9.78257968297228, 9.87817694914062, 9.3449034905713, 9.56400153361727, 9.78120084558148, 9.3445162813738, 9.36767436354887, 9.12070987223648, …

1
, จำลองสถานการณ์ในช่วงการพยากรณ์
ฉันมีข้อมูลอนุกรมเวลาและฉันใช้เป็นโมเดลเพื่อให้พอดีกับข้อมูล เอ็กซ์ทีเป็นตัวบ่งชี้ตัวแปรสุ่มที่เป็นทั้ง 0 (เมื่อฉันไม่เห็นเหตุการณ์ที่ยาก) หรือ 1 (เมื่อฉันเห็นเหตุการณ์ที่หายาก) จากการสังเกตก่อนหน้านี้ที่ฉันมีสำหรับX tฉันสามารถพัฒนาแบบจำลองสำหรับX tโดยใช้วิธีการแบบ Variable Length Markov Chain สิ่งนี้ทำให้ฉันสามารถจำลองX tตลอดช่วงเวลาการพยากรณ์และให้ลำดับของศูนย์และอัน เนื่องจากนี่เป็นเหตุการณ์ที่หายากฉันจะไม่เห็นARIMA(p,d,q)+XtARIMA(p,d,q)+XtARIMA(p,d,q)+X_tXtXtX_tXtXtX_tXtXtX_tXtXtX_tXt=1Xt=1X_t=1 บ่อยครั้ง ฉันสามารถคาดการณ์และได้รับการคาดการณ์ช่วงเวลาที่อยู่บนพื้นฐานของค่าจำลองสำหรับที XtXtX_t คำถาม: ฉันจะพัฒนาขั้นตอนการจำลองที่มีประสิทธิภาพที่จะคำนึงถึงการเกิดขึ้นของ 1 ในจำลองในช่วงคาดการณ์หรือไม่ ฉันต้องได้รับค่าเฉลี่ยและช่วงการพยากรณ์ XtXtX_t ความน่าจะเป็นของการสังเกต 1 นั้นน้อยเกินไปสำหรับฉันที่จะคิดว่าการจำลองแบบมอนติคาร์โลปกติจะทำงานได้ดีในกรณีนี้ บางทีฉันสามารถใช้“ การสุ่มตัวอย่างที่สำคัญ” แต่ฉันไม่แน่ใจอย่างแน่นอน ขอขอบคุณ.

3
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้ ซีรีส์หมายถึงผลรวมของลำดับ เหตุใดจึงเป็นอนุกรมเวลาไม่ใช่ลำดับเวลา คือเวลาตัวแปรอิสระ?

2
ฉันจะตีความการถดถอยของฉันด้วยตัวแปรที่แตกต่างแรกได้อย่างไร
ฉันมีสองชุดเวลา: พร็อกซีสำหรับพรีเมี่ยมความเสี่ยงด้านตลาด (ERP; สายสีแดง) อัตราปลอดความเสี่ยงโดยพันธบัตรรัฐบาล (เส้นสีน้ำเงิน) ฉันต้องการทดสอบว่าอัตราที่ปราศจากความเสี่ยงสามารถอธิบาย ERP ได้หรือไม่ ด้วยเหตุนี้ฉันจึงปฏิบัติตามคำแนะนำของ Tsay (2010, รุ่นที่ 3, หน้า 96): ซีรี่ส์เวลาทางการเงิน: จัดวางโมเดลการถดถอยเชิงเส้นและตรวจสอบความสัมพันธ์แบบอนุกรมของส่วนที่เหลือ หากซีรี่ย์ที่เหลือเป็นหน่วยที่ไม่ใช่ความแปรปรวนของรูทยูนิตให้รับความแตกต่างแรกของตัวแปรที่ขึ้นอยู่กับและอธิบาย ทำขั้นตอนแรกฉันได้รับผลลัพธ์ต่อไปนี้: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.77019 0.25103 26.97 <2e-16 *** Risk_Free_Rate -0.65320 0.04123 -15.84 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ …

4
คำศัพท์เกี่ยวกับข้อผิดพลาดของโมเดลค่าเฉลี่ยเคลื่อนที่
นี่เป็นคำถามพื้นฐานสำหรับรุ่น Box-Jenkins MA ตามที่ผมเข้าใจแบบจำลอง MA เป็นพื้นถดถอยเชิงเส้นของอนุกรมเวลาค่าที่YYYกับก่อนหน้านี้เงื่อนไขข้อผิดพลาดet,...,et−net,...,et−ne_t,..., e_{t-n} n นั่นคือการสังเกตYYYจะถดถอยครั้งแรกกับค่าก่อนหน้านี้Yt−1,...,Yt−nYt−1,...,Yt−nY_{t-1}, ..., Y_{t-n}แล้วหนึ่งหรือมากกว่าY−Y^Y−Y^Y - \hat{Y}ค่าจะถูกใช้เป็นเงื่อนไขข้อผิดพลาดสำหรับรุ่นซาชูเซตส์ แต่ข้อผิดพลาดถูกคำนวณในรูปแบบ ARIMA (0, 0, 2) อย่างไร หากใช้โมเดล MA โดยไม่มีชิ้นส่วนตอบรับอัตโนมัติและไม่มีค่าโดยประมาณฉันจะมีคำผิดได้อย่างไร

5
การล้างข้อมูลสามารถทำให้ผลการวิเคราะห์เชิงสถิติแย่ลงได้หรือไม่?
การเพิ่มจำนวนผู้ป่วยและการเสียชีวิตเกิดขึ้นในช่วงที่มีการระบาดของโรค (เพิ่มจำนวนขึ้นอย่างกะทันหัน) เนื่องจากการไหลเวียนของไวรัส (เช่น West Nile Virus ในสหรัฐอเมริกาในปี 2545) หรือลดความต้านทานของผู้คนหรือการปนเปื้อนของอาหารหรือน้ำ ยุง โรคระบาดเหล่านี้จะปรากฏเป็นค่าผิดปกติซึ่งสามารถเกิดขึ้นได้ทุก 1 ถึง 5 ปี การลบค่าผิดปกติเหล่านี้ทำให้เราลบหลักฐานการระบาดซึ่งเป็นส่วนสำคัญในการพยากรณ์และการทำความเข้าใจเกี่ยวกับโรค การทำความสะอาดข้อมูลจำเป็นหรือไม่เมื่อต้องรับมือกับผู้ผิดที่เกิดจากโรคระบาด? มันจะปรับปรุงผลลัพธ์หรือทำให้แย่ลงจากการวิเคราะห์ทางสถิติ?

3
การถดถอยโลจิสติกและโครงสร้างชุดข้อมูล
ฉันหวังว่าฉันจะถามคำถามนี้ได้อย่างถูกวิธี ฉันสามารถเข้าถึงข้อมูลแบบเล่นโดยการเล่นดังนั้นจึงเป็นปัญหามากขึ้นด้วยวิธีที่ดีที่สุดและสร้างข้อมูลได้อย่างถูกต้อง สิ่งที่ฉันต้องการทำคือการคำนวณความน่าจะเป็นในการชนะเกมของ NHL จากคะแนนและเวลาที่เหลืออยู่ในการควบคุม ฉันคิดว่าฉันสามารถใช้การถดถอยโลจิสติก แต่ฉันไม่แน่ใจว่าชุดข้อมูลควรมีลักษณะอย่างไร ฉันจะมีข้อสังเกตหลายครั้งต่อเกมและทุกครั้งที่ฉันสนใจ ฉันจะมีหนึ่งการสังเกตการณ์ต่อเกมและพอดีกับโมเดลที่แยกกันต่อส่วนของเวลาหรือไม่? การถดถอยของโลจิสติกเป็นวิธีที่ถูกต้องหรือไม่ ความช่วยเหลือใด ๆ ที่คุณสามารถให้จะได้รับการชื่นชมอย่างมาก! ขอแสดงความนับถืออย่างสูง.

2
เป็นไปได้ไหมที่จะทำการพยากรณ์อนุกรมเวลาโดยอัตโนมัติ
ฉันต้องการสร้างอัลกอริทึมที่สามารถวิเคราะห์อนุกรมเวลาใด ๆ และ "อัตโนมัติ" เลือกวิธีการพยากรณ์แบบดั้งเดิม / สถิติที่ดีที่สุด (และพารามิเตอร์) สำหรับข้อมูลอนุกรมเวลาที่วิเคราะห์ เป็นไปได้ไหมที่จะทำอะไรแบบนี้ ถ้าใช่คุณสามารถให้คำแนะนำกับฉันเกี่ยวกับวิธีการนี้ได้หรือไม่?

2
หากโมเดลอนุกรมเวลาถอยหลังอัตโนมัติเป็นแบบไม่ใช่เชิงเส้นมันยังต้องใช้ความคงที่หรือไม่?
กำลังคิดเกี่ยวกับการใช้เครือข่ายประสาทที่เกิดขึ้นอีกสำหรับการพยากรณ์อนุกรมเวลา โดยพื้นฐานแล้วพวกเขาใช้การเรียงลำดับของการถดถอยอัตโนมัติแบบไม่ใช่เชิงเส้นทั่วไปเมื่อเปรียบเทียบกับแบบจำลอง ARMA และ ARIMA ซึ่งใช้การถดถอยเชิงเส้นแบบอัตโนมัติ หากเรากำลังทำการถดถอยอัตโนมัติแบบไม่เป็นเชิงเส้นมันยังคงจำเป็นสำหรับอนุกรมเวลาที่จะหยุดนิ่งและเราจะต้องดำเนินการแตกต่างจากวิธีที่เราทำในแบบจำลอง ARIMA หรือไม่? หรือตัวละครที่ไม่ใช่เชิงเส้นของแบบจำลองให้ความสามารถในการจัดการกับอนุกรมเวลาที่ไม่หยุดนิ่งหรือไม่? ที่จะนำคำถามอีกวิธี: ข้อกำหนดความคงที่ (ในค่าเฉลี่ยและความแปรปรวน) สำหรับโมเดล ARMA และ ARIMA เนื่องจากความจริงที่ว่าโมเดลเหล่านี้เป็นแบบเส้นตรงหรือเป็นเพราะอย่างอื่นหรือไม่

4
อะไรคือความแตกต่างระหว่างคำว่า "การวิเคราะห์อนุกรมเวลา" และ "การวิเคราะห์ข้อมูลระยะยาว"
เมื่อพูดถึงข้อมูลระยะยาวเราอาจอ้างถึงข้อมูลที่รวบรวมจากหน่วยงาน / การศึกษาเดียวกันซ้ำ ๆ ซ้ำ ๆ กันดังนั้นจึงมีความสัมพันธ์สำหรับการสังเกตในเรื่องเดียวกันคือความคล้ายคลึงกันภายในเรื่อง เมื่อพูดถึงข้อมูลอนุกรมเวลาเรายังอ้างถึงข้อมูลที่รวบรวมในช่วงเวลาหนึ่งและดูเหมือนว่าจะคล้ายกับการตั้งค่าตามยาวที่กล่าวถึงข้างต้น ฉันสงสัยว่าถ้าใครบางคนสามารถให้คำอธิบายที่ชัดเจนระหว่างสองคำนี้ความสัมพันธ์และความแตกต่างคืออะไร?

5
วิธีการเพิ่มองค์ประกอบตามระยะเวลาในรูปแบบการถดถอยเชิงเส้น?
ฉันมีข้อมูลความถี่สะสม บรรทัดดูเหมือนว่าเหมาะกับข้อมูลที่ดีมาก แต่มีการวนรอบ / แบบกระดิกในบรรทัด ฉันต้องการที่จะประเมินเมื่อความถี่สะสมจะถึงค่าบางอย่างคเมื่อฉันพล็อตส่วนที่เหลือเทียบกับค่าติดตั้งฉันได้รับพฤติกรรมไซน์ที่สวยงามy=ax+by=ax+by=ax+bccc ตอนนี้เพื่อเพิ่มความซับซ้อนอื่นให้ทราบว่าในแปลงที่เหลือ มีสองรอบที่มีค่าต่ำกว่ารอบอื่น ๆ ซึ่งหมายถึงเอฟเฟกต์สุดสัปดาห์ที่ต้องนำมาพิจารณาด้วย ดังนั้นฉันจะไปจากที่นี่ที่ไหน ฉันจะรวมคำโคไซน์ไซน์หรือไซโคลเข้ากับตัวแบบการถดถอยได้อย่างไร ประมาณการเมื่อความถี่สะสมจะเท่ากับ ?ccc

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.