ฉันควรระวังปัญหาอะไรบ้างเมื่อรวมอนุกรมหลายเวลา


10

สมมติว่าฉันมีอนุกรมเวลาจำนวนหนึ่งเช่นจำนวนบันทึกอุณหภูมิจากสถานีต่าง ๆ ในภูมิภาค ฉันต้องการได้รับการบันทึกอุณหภูมิเดียวสำหรับทั้งภูมิภาคซึ่งฉันสามารถอธิบายลักษณะของภูมิอากาศในภูมิภาค วิธีการที่เข้าใจง่ายอาจเพียงแค่ใช้ค่าเฉลี่ยของทุกสถานีในแต่ละเวลา แต่ความรู้สึกทางสถิติของฉัน (ซึ่งฉันยังติดต่อไม่ได้ด้วย) บอกฉันว่านี่อาจไม่ใช่เรื่องง่าย โดยเฉพาะอย่างยิ่งฉันจินตนาการว่าค่าเฉลี่ยทั่วทั้งภูมิภาคจะลบจุดสุดยอดอุณหภูมิที่น่าสนใจบางส่วนและฉันอาจมีปัญหากับการพึ่งพาระหว่างสถานีปิด

ฉันอาจประสบปัญหาอื่นใดอีกถ้าฉันลองใช้กลยุทธ์เช่นนี้และมีวิธีที่จะเอาชนะพวกเขาหรือวิธีการที่เหมาะสมกว่าในการรวมข้อมูลประเภทนี้

หมายเหตุ: คำตอบอาจกว้างกว่าตัวอย่างเชิงพื้นที่ที่ฉันให้ไว้


1
ปัญหาอาจเกิดจากความขัดแย้งระหว่าง "บันทึกอุณหภูมิเดียวสำหรับทั้งภูมิภาค" และความสนใจใด ๆ ที่คุณมีในรูปแบบของภูมิภาค วิธีการแก้ปัญหาอาจเกี่ยวข้องกับวิธีการกระทบยอดทั้งสองปัญหาเช่นการแบ่งความแปรปรวนลงในองค์ประกอบภายในและระหว่างภูมิภาค
ปีเตอร์เอลลิส

@ PeterEllis ใช่ฉันกำลังคิดอย่างคลุมเครือในเรื่องนั้น สำหรับวัตถุประสงค์ของคำถามสมมติว่าฉันไม่สนใจเกี่ยวกับความแปรปรวนเชิงพื้นที่
naught101

ในกรณีนี้ฉันคิดว่าสิ่งสำคัญที่คุณต้องกังวลคือการพึ่งพาระหว่างสถานีใกล้ หาวิธีลดน้ำหนักการสังเกตที่ทำซ้ำสถานีได้อย่างมีประสิทธิภาพและคุณควรจะโอเค
ปีเตอร์เอลลิส

@PeterEllis: ตกลง แต่อาจไม่มีวิธีทางกายภาพที่สมเหตุสมผลในการทำเช่นนั้น - ความใกล้ชิดของสถานีไม่ได้หมายความว่าพวกเขาจะพึ่งพามากขึ้น - เช่น สถานีปิดสองแห่งที่อยู่ฝั่งตรงข้ามของเทือกเขาอาจมีความคล้ายคลึงน้อยกว่าสถานีสองแห่งบนที่ราบกว้าง มีวิธีที่เชื่อถือได้ในการกำหนดการพึ่งพาทางสถิติ? ความแปรปรวนร่วมฉันคิดว่า ... ยังคงมีจุดสูงสุดในซีรีส์ผลลัพธ์น้อยกว่า (ฉันเดาว่าจะสะท้อนให้เห็นถึงสถานการณ์ทางกายภาพแม้ว่า - การเปลี่ยนแปลงอุณหภูมิทั่วทั้งภูมิภาคมีแนวโน้มที่จะช้าลงและมั่นคงกว่าที่เดียว)
naught101

@ ไม่มีสิ่งใดเกี่ยวกับลักษณะเชิงพื้นที่ของคำถามของคุณภูมิภาคของคุณมีการกำหนดอย่างไร ในความคิดเห็นของคุณคุณพูดถึงว่าสองสถานีปิดในฝั่งตรงข้ามของภูเขาอาจแตกต่างจากสองสถานีไกลบนที่ราบกว้าง คุณได้พิจารณากำหนดภูมิภาคของสถานีอีกครั้งโดยพิจารณาจากความใกล้เคียงและความคล้ายคลึงกันสำหรับการวิเคราะห์ของคุณหรือไม่? พวกเขาไม่จำเป็นต้องตรงกับขอบเขตของภูมิภาค แต่พวกเขาอาจกลายเป็นภาพซ้อนทับเชิงวิเคราะห์ที่สามารถพล็อตแผนที่แบบดั้งเดิม
dav

คำตอบ:


1

ก่อนอื่นฉันอยากจะบอกว่าฉันจะเพิ่มความคิดเห็น แต่ฉันยังทำไม่ได้ (ตัวแทน) แต่ฉันชอบคำถามและต้องการมีส่วนร่วมดังนั้นนี่คือ "คำตอบ" นอกจากนี้ฉันเห็นว่านี่เก่า แต่ก็น่าสนใจ

ครั้งแรกเป็นไปได้ไหมที่จะใช้เทคนิคการลดขนาดเช่น PCA เพื่อย่อเวลา หากค่าลักษณะเฉพาะแรกมีขนาดใหญ่อาจหมายความว่าการใช้ค่าลักษณะเฉพาะของคุณจะเป็นตัวแทนของการเปลี่ยนแปลงส่วนใหญ่

ประการที่สองและอื่น ๆ โดยทั่วไปคุณต้องการใช้อนุกรมเวลาอะไร ไม่รู้อะไรเลยฉันจะเดาว่าอุณหภูมิอาจแตกต่างกันเล็กน้อย เช่นหากบันทึกอุณหภูมิอยู่ใกล้เมืองคุณอาจได้รับผลกระทบประเภท "เกาะความร้อน" หรืออาจมีการเปลี่ยนแปลงเล็กน้อยในระยะทางด้านข้างเกิดขึ้นเพื่อให้เกิดการเปลี่ยนแปลงขนาดใหญ่ในระยะทางแนวตั้ง --- สถานที่หนึ่งอาจอยู่ที่ระดับน้ำทะเลและอยู่ทางขวาของมหาสมุทรและที่อื่นไม่ใช่ "ไกลเกินไป" สิ่งเหล่านั้นจะมีอุณหภูมิที่แตกต่างกันอย่างแน่นอน!

นี่เป็นเพียงความคิด บางทีอาจมีคนอื่นกระโดดเข้ามาและให้คำตอบที่ดีกว่า


1
จุดดี. พูดตามตรงฉันจำไม่ได้ว่าบริบทรอบ ๆ คำถามนี้คืออะไรและฉันรู้สึกว่าความคิดเห็นของฉันทำให้เข้าใจผิด ฉันมีความสนใจเป็นพิเศษในการไม่สูญเสียความแปรปรวนร่วมกับทุกสถานี แต่อยู่นอกช่วง นึกถึงสถานีทั่วทุกทวีปและแนวหน้าอันเย็นยะเยือก ค่าเฉลี่ยเชิงพื้นที่อย่างง่ายอาจลบส่วนหน้าหนาวซึ่งไม่ใช่สิ่งที่ดีจริงๆเพราะแต่ละสถานีจะแสดงอย่างรุนแรง แต่ในเวลาที่ต่างกัน อาจใช้ PCA บางชนิดในแต่ละสถานีแล้วเฉลี่ยผลลัพธ์อย่างใดอาจเป็นวิธีที่จะได้รับรอบ
naught101

โอ้ว้าวโอเคดังนั้นถ้าคุณพยายามที่จะอธิบายแนวโน้มในซีรีย์เวลาทั่วภูมิภาคบางทีคุณควรทำให้ซีรีย์เวลาหยุดนิ่งและแต่ละอันมีค่าเฉลี่ย 0 คุณสามารถลองลบวงจรรายวันออกจาก แต่ละอัน (หรือใช้ค่าเฉลี่ยรายวัน) จากนั้นคุณจะถูกทิ้งให้อยู่กับการเปลี่ยนแปลงของอุณหภูมิที่ต่ำลงโดยแต่ละรอบจะมีค่าเฉลี่ยเท่ากับ 0 เมื่อคุณมีแล้วคุณอาจจะควบแน่นอนุกรมเวลา + ที่อยู่กึ่งกลางโดยใช้เทคนิคการลดขนาดเช่น PCA ฉันดีใจที่คุณพูดถึงบริบทของคำถามเล็กน้อย b / c ที่ช่วยได้จริงๆ สิ่งที่ดี!
rbatt
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.