วิธีการเปรียบเทียบอนุกรมเวลาสองวิธี


43

ฉันมีสองชุดเวลาแสดงในโครงเรื่องด้านล่าง:

พล็อตอนุกรมเวลา

เนื้อเรื่องแสดงรายละเอียดทั้งหมดของอนุกรมเวลาทั้งสอง แต่ฉันสามารถลดมันลงไปในการสังเกตการณ์แบบบังเอิญได้ถ้าต้องการ

คำถามของฉันคือ: ฉันสามารถใช้วิธีการทางสถิติเพื่อประเมินความแตกต่างระหว่างอนุกรมเวลาได้อย่างไร

ฉันรู้ว่านี่เป็นคำถามที่ค่อนข้างกว้างและคลุมเครือ แต่ฉันไม่สามารถหาข้อมูลเบื้องต้นได้จากทุกที่ อย่างที่ฉันเห็นมันมีสองสิ่งที่แตกต่างในการประเมิน:

1. ค่าเหมือนกันหรือไม่?

2. แนวโน้มเหมือนกันหรือไม่

การทดสอบทางสถิติแบบใดที่คุณแนะนำให้ดูเพื่อประเมินคำถามเหล่านี้ สำหรับคำถามที่ 1 ฉันสามารถประเมินความหมายของชุดข้อมูลที่แตกต่างกันและมองหาความแตกต่างอย่างมีนัยสำคัญในการแจกแจง แต่มีวิธีการทำสิ่งนี้ที่คำนึงถึงลักษณะอนุกรมเวลาของข้อมูลหรือไม่

สำหรับคำถามที่ 2 - มีบางอย่างเหมือนกับการทดสอบ Mann-Kendall ที่มองหาความคล้ายคลึงกันระหว่างสองแนวโน้มหรือไม่ ฉันสามารถทำการทดสอบ Mann-Kendall สำหรับทั้งชุดข้อมูลและเปรียบเทียบ แต่ไม่รู้ว่าเป็นวิธีที่ถูกต้องในการทำสิ่งต่าง ๆ หรือว่ามีวิธีที่ดีกว่า

ฉันทำทั้งหมดนี้ใน R ดังนั้นหากการทดสอบที่คุณแนะนำมีแพ็คเกจ R แล้วโปรดแจ้งให้เราทราบ


9
เนื้อเรื่องดูเหมือนจะปิดบังสิ่งที่อาจเป็นความแตกต่างที่สำคัญระหว่างซีรีย์เหล่านี้: พวกมันอาจถูกสุ่มตัวอย่างที่ความถี่ต่างกัน เส้นสีดำ (Aeronet) ดูเหมือนจะถูกสุ่มตัวอย่างเพียงประมาณ 20 ครั้งและเส้นสีแดง (การมองเห็น) หลายร้อยครั้งหรือมากกว่า ปัจจัยสำคัญอีกประการหนึ่งคือความสม่ำเสมอของการสุ่มตัวอย่างหรือการขาดมัน: เวลาระหว่างการสังเกตของ Aeronet ดูเหมือนจะแตกต่างกันเล็กน้อย โดยทั่วไปจะช่วยในการลบเส้นเชื่อมต่อและแสดงเฉพาะจุดที่สอดคล้องกับข้อมูลจริงเพื่อให้ผู้ดูสามารถกำหนดสิ่งเหล่านี้ด้วยสายตา
whuber

นี่คือห้องสมุด Python สำหรับการวิเคราะห์อนุกรมเวลาที่มีระยะห่างไม่เท่ากัน
kjetil b halvorsen

คำตอบ:


27

ดังที่คนอื่น ๆ ระบุไว้คุณต้องมีความถี่ในการวัดร่วมกัน (เช่นเวลาระหว่างการสังเกต) เมื่อถึงตอนนั้นฉันจะระบุโมเดลทั่วไปที่จะอธิบายแต่ละชุดแยกกันอย่างสมเหตุสมผล นี่อาจเป็นโมเดล ARIMA หรือโมเดลการถดถอยแบบทวีคูณที่มีระดับการเลื่อนระดับที่เป็นไปได้หรือโมเดลคอมโพสิตที่รวมทั้งหน่วยความจำ (ARIMA) และตัวแปรดัมมี่ แบบจำลองทั่วไปนี้สามารถประมาณได้ทั่วโลกและแยกกันสำหรับแต่ละชุดสองชุดจากนั้นเราสามารถสร้างการทดสอบ F เพื่อทดสอบสมมติฐานของชุดพารามิเตอร์ทั่วไป


1
คุณไม่จำเป็นต้องมีความถี่เท่ากันทั้งสองซีรี่ส์ มันเพียงแค่ว่าเพื่อให้ค่าโดยสารมีซอฟต์แวร์เล็ก ๆ น้อย ๆ สำหรับกรณีอื่น ๆ แต่ดูtraces.readthedocs.io/en/latest ดูเหมือนว่าจะมีคน pubslihed มากในกรณีอื่น ๆ ในวารสารทางดาราศาสตร์และในด้านการเงินและธรณีฟิสิกส์ ... ดู refs ในen.wikipedia.org/wiki/Unevenly_spaced_time_series
kjetil b halvorsen

12

พิจารณาgrangertest()ในไลบรารีlmtest

เป็นการทดสอบเพื่อดูว่าอนุกรมเวลาหนึ่งมีประโยชน์ในการพยากรณ์อื่นหรือไม่

คู่อ้างอิงเพื่อให้คุณเริ่มต้น:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
ขนาดตัวอย่างของเขาจะเล็กเกินไปด้วย <10 ดาต้าพอยน์เทียบกับปริมาณของพารามิเตอร์ที่คุณต้องการในเกรนเจอร์
Jase

1
@fionn ลิงก์ในคำตอบของคุณจะตาย คุณสามารถปรับปรุงคำตอบของคุณ?
Davor Josipovic

0

เพิ่งเจอสิ่งนี้ คำตอบแรกของคุณคือการพล็อต g ทั้งสองตั้งค่ามาตราส่วนเดียวกัน (timewise) เพื่อดูความแตกต่างทางสายตา คุณทำสิ่งนี้และสามารถเห็นได้อย่างชัดเจนว่ามีความแตกต่างที่เห็นได้ชัดอยู่บ้าง ขั้นตอนต่อไปคือการใช้การวิเคราะห์ความสัมพันธ์อย่างง่าย ... และดูว่าพวกมันเกี่ยวข้องกันอย่างไรโดยใช้สัมประสิทธิ์สหสัมพันธ์ (r) ถ้า r มีค่าน้อยข้อสรุปของคุณก็คือพวกมันมีความสัมพันธ์กันอย่างอ่อนและดังนั้นจึงไม่มีการเปรียบเทียบที่น่าพึงพอใจและค่าที่มากกว่าถ้า r จะแนะนำการเปรียบเทียบที่ดีระหว่างสองซีรีส์ ขั้นตอนที่สามที่มีความสัมพันธ์ที่ดีคือการทดสอบนัยสำคัญทางสถิติของ r ที่นี่คุณสามารถใช้การทดสอบ Shapiro Welch ซึ่งจะสมมติว่าทั้งสองซีรีส์มีการแจกแจงแบบปกติ (สมมุติฐานว่าง) หรือไม่ (สมมุติฐานทางเลือก) มีการทดสอบอื่น ๆ ที่คุณสามารถทำได้ แต่ให้ฉันหวังว่าคำตอบของฉันจะช่วยได้


1
เมื่อเปรียบเทียบอนุกรมเวลามันคือความสัมพันธ์อัตโนมัติและแบบจำลองอนุกรมเวลาที่เหมาะสม เช่นรุ่น ARIMA ที่สามารถช่วยตัดสินว่ามีความคล้ายคลึงกันอย่างไร การรับรู้ของกระบวนการสุ่มเดียวกันสองครั้งไม่จำเป็นต้องเหมือนกันเมื่อทำการวางแผน
Michael Chernick

-2

พอดีเป็นเส้นตรงกับสัญญาณอนุกรมเวลาโดยใช้ polyfit จากนั้นคำนวณค่า root-mean-square-error (RMSE) สำหรับทั้งสองบรรทัด ค่าที่ได้รับสำหรับเส้นสีแดงจะน้อยกว่าค่าที่ได้จากเส้นสีเทา

ยังทำให้การอ่านในความถี่ทั่วไปบางอย่าง


2
ยินดีต้อนรับสู่ Cross Validated และขอบคุณสำหรับคำตอบแรกของคุณ! อย่างไรก็ตามฉันกังวลว่าคุณไม่ได้ตอบคำถามโดยตรง - วิธีการที่เสนอจะช่วยผู้ถามได้อย่างไรว่าค่านิยมและ / หรือแนวโน้มมีความคล้ายคลึงกันอย่างไร
มาร์ตินModrák
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.