วิธีการเพิ่มองค์ประกอบตามระยะเวลาในรูปแบบการถดถอยเชิงเส้น?


17

ฉันมีข้อมูลความถี่สะสม บรรทัดดูเหมือนว่าเหมาะกับข้อมูลที่ดีมาก แต่มีการวนรอบ / แบบกระดิกในบรรทัด ฉันต้องการที่จะประเมินเมื่อความถี่สะสมจะถึงค่าบางอย่างคเมื่อฉันพล็อตส่วนที่เหลือเทียบกับค่าติดตั้งฉันได้รับพฤติกรรมไซน์ที่สวยงามy=ax+bc

ตอนนี้เพื่อเพิ่มความซับซ้อนอื่นให้ทราบว่าในแปลงที่เหลือ

ข้อความแสดงแทน

มีสองรอบที่มีค่าต่ำกว่ารอบอื่น ๆ ซึ่งหมายถึงเอฟเฟกต์สุดสัปดาห์ที่ต้องนำมาพิจารณาด้วย

ดังนั้นฉันจะไปจากที่นี่ที่ไหน ฉันจะรวมคำโคไซน์ไซน์หรือไซโคลเข้ากับตัวแบบการถดถอยได้อย่างไร ประมาณการเมื่อความถี่สะสมจะเท่ากับ ?c

คำตอบ:


9

คุณสามารถลองใช้stl()วิธีการที่ยอดเยี่ยม- มันสลายตัว (โดยใช้loess()ข้อต่อแบบวนซ้ำ) เข้ากับแนวโน้มและฤดูกาลและส่วนที่เหลือ นี่อาจเป็นเพียงแค่การแกว่งของคุณที่นี่


8

หากคุณทราบความถี่ของการแกว่งคุณสามารถรวมตัวทำนายสองตัวเพิ่มเติมบาป (2π wt) และ cos (2π wt) - ตั้งค่า w เพื่อให้ได้ความยาวคลื่นที่ต้องการ - และนี่จะเป็นแบบจำลองการแกว่ง คุณต้องการคำศัพท์ทั้งสองเพื่อให้พอดีกับแอมพลิจูดและมุมเฟส หากมีมากกว่าหนึ่งความถี่คุณจะต้องใช้คำว่าไซน์และโคไซน์สำหรับแต่ละความถี่

หากคุณไม่ทราบว่าความถี่คืออะไรวิธีมาตรฐานในการแยกความถี่หลายความถี่คือการทำให้ข้อมูลเสียหาย วิธีที่รวดเร็วและสกปรกในการทำเช่นนี้คือใน MS-Excel ซึ่งมีเครื่องมือวิเคราะห์ฟูริเยร์ใน Add-In การวิเคราะห์ข้อมูล ดำเนินการวิเคราะห์กับส่วนที่เหลือรับค่าสัมบูรณ์ของการแปลงรูปและกราฟแท่งผลลัพธ์ ยอดเขาจะเป็นองค์ประกอบความถี่หลักของคุณที่คุณต้องการสร้างแบบจำลอง

เมื่อคุณเพิ่มตัวทำนายแบบวนซ้ำเหล่านี้ให้ใส่ใจกับค่า p ของพวกเขาในการถดถอยของคุณและอย่าให้มากเกินไป ใช้เฉพาะความถี่ที่มีนัยสำคัญทางสถิติ น่าเสียดายที่สิ่งนี้อาจทำให้การปรับความถี่ต่ำเป็นเรื่องยากเล็กน้อย


2
เมื่อคุณประเมินความถี่จากข้อมูล (เช่นเดียวกับการวิเคราะห์ฟูริเยร์) และรวมไว้เป็นเงื่อนไขบาป / cos ในการถดถอยค่า p ของพวกเขาจะไม่มีความหมาย
whuber

4

เริ่มต้นด้วยการสังเกตว่าการใช้กำลังสองน้อยที่สุดแบบธรรมดาสำหรับข้อมูลเหล่านี้น่าจะไม่เหมาะสม ถ้าข้อมูลของแต่ละบุคคลที่ถูกสะสมจะถือว่าเป็นปกติที่จะมีข้อผิดพลาดส่วนประกอบสุ่มแล้วข้อผิดพลาดในข้อมูลที่สะสม (คนไม่ความถี่สะสม --that ของบางสิ่งบางอย่างที่แตกต่างจากสิ่งที่คุณมี) เป็นผลรวมสะสมของทุกแง่ข้อผิดพลาด สิ่งนี้ทำให้ข้อมูลแบบรวม heteroscedastic (กลายเป็นตัวแปรมากขึ้นเรื่อย ๆ เมื่อเวลาผ่านไป) และมีความสัมพันธ์เชิงบวกอย่างมาก เนื่องจากข้อมูลเหล่านี้มีพฤติกรรมที่สม่ำเสมอและมีจำนวนมากดังนั้นจึงมีปัญหาเล็กน้อยกับความเหมาะสม คุณจะได้รับ แต่การประมาณข้อผิดพลาดการคาดคะเนของคุณ (ซึ่งเป็นคำถามที่เกี่ยวกับ) และโดยเฉพาะอย่างยิ่งข้อผิดพลาดมาตรฐานในการคาดการณ์ของคุณอาจจะหายไป

ขั้นตอนมาตรฐานสำหรับการวิเคราะห์ข้อมูลดังกล่าวเริ่มต้นด้วยค่าดั้งเดิม รับความแตกต่างแบบวันต่อวันเพื่อลบองค์ประกอบของไซน์ไซด์ความถี่สูง ใช้ความแตกต่างรายสัปดาห์ของสิ่งเหล่านั้นเพื่อลบรอบสัปดาห์ต่อสัปดาห์ที่เป็นไปได้ วิเคราะห์สิ่งที่เหลืออยู่ การสร้างแบบจำลองARIMAเป็นวิธีการที่ยืดหยุ่นและทรงพลัง แต่เริ่มต้นง่ายๆ: กราฟข้อมูลที่แตกต่างกันเหล่านั้นเพื่อดูว่าเกิดอะไรขึ้นจากนั้นไปที่อื่น โปรดทราบเช่นกันว่าด้วยข้อมูลน้อยกว่าสองสัปดาห์การประมาณการรอบรายสัปดาห์ของคุณจะไม่ดีและความไม่แน่นอนนี้จะครอบงำความไม่แน่นอนในการคาดการณ์


2

เห็นได้ชัดว่าความผันผวนที่โดดเด่นมีระยะเวลาหนึ่งวัน ดูเหมือนว่ายังมีส่วนประกอบความถี่ต่ำที่เกี่ยวข้องกับวันของสัปดาห์ดังนั้นเพิ่มส่วนประกอบที่มีความถี่หนึ่งสัปดาห์ (เช่นหนึ่งในเจ็ดของวัน) และฮาร์โมนิกส์แรก ที่ให้รูปแบบของรูปแบบ:

E(Y)=+a0cos(2πเสื้อ)+0บาป(2πเสื้อ)+a1cos(2πเสื้อ/7)+1บาป(2πเสื้อ/7)+a2cos(4πเสื้อ/7)+2บาป(4πเสื้อ/7)+...

- สมมติว่า เสื้อมีหน่วยเป็นวัน ที่นี่Yคือข้อมูลดิบไม่ใช่ผลรวมสะสม


-2

ทำไมไม่ใช้ GA เพื่อค้นหาแอมพลิจูดระยะเวลาและเฟสของซีรีส์ Sine (หรือโคไซน์) ตามลำดับแล้วรวมกัน ปรับให้เหมาะสมดังต่อไปนี้: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS


1
มันไม่ชัดเจนว่าสิ่งนี้ตอบคำถามเกี่ยวกับการคำนวณฟังก์ชันความถี่สะสมผกผันได้อย่างไร และคุณหมายถึงอะไรโดย "GA" อัลกอริทึมทางพันธุกรรม? อื่น ๆ อีก?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.