ข้อมูลการตรวจนับเวลา


12

ฉันใช้ stl () ใน R เพื่อย่อยสลายข้อมูลนับเป็นแนวโน้มองค์ประกอบตามฤดูกาลและผิดปกติ ค่าแนวโน้มผลลัพธ์ไม่ได้เป็นจำนวนเต็มอีกต่อไป ฉันมีคำถามต่อไปนี้:

  1. เป็น stl () เป็นวิธีที่เหมาะสมในการ deseasonalize ข้อมูลการนับ?
  2. เนื่องจากแนวโน้มที่เกิดขึ้นไม่ได้เป็นค่า interger อีกต่อไปฉันสามารถใช้ lm () เพื่อสร้างแบบจำลองส่วนประกอบแนวโน้มได้หรือไม่

คำตอบ:


8

ไม่มีปัญหาโดยธรรมชาติกับการใช้ stl () เพื่อ deseasonalize data count หนึ่งในปัญหาที่จะตระหนักถึง แต่เป็นข้อมูลที่นับว่าโดยทั่วไปมีความแปรปรวนเพิ่มขึ้นตามการเพิ่มขึ้นของค่าเฉลี่ย สิ่งนี้มักจะเห็นได้ในองค์ประกอบตามฤดูกาลและการสุ่มของการสลายตัว การใช้ stl () กับข้อมูลดิบจะไม่นำสิ่งนี้มาพิจารณาและดังนั้นจึงเป็นการดีที่สุดที่จะใช้ลอการิทึม (แก้ไข - หรือรากที่สอง) ของข้อมูลของคุณก่อน

ไม่สำคัญว่าค่าแนวโน้มจะไม่ใช่จำนวนเต็มอีกต่อไป พวกเขาสามารถคิดในลักษณะที่คล้ายกับพารามิเตอร์ในการกระจาย Poisson แม้ว่าตัวแปรแบบกระจายปัวซงจะต้องเป็นจำนวนเต็มค่าเฉลี่ยไม่จำเป็นต้องเป็น

อย่างไรก็ตามนี่ไม่ได้หมายความว่าคุณสามารถใช้ lm () เพื่อสร้างแบบจำลององค์ประกอบแนวโน้ม มีข้อผิดพลาดมากมายในการสร้างแบบจำลองแนวโน้มในอนุกรมเวลาเนื่องจากความสัมพันธ์ปลอมจะยากมากที่จะหลีกเลี่ยง โดยทั่วไปคนแรกจะทำให้เกิดความเสียหายต่อซีรีส์และจากนั้นทำโมเดลส่วนที่เหลือ


1
คุณจะทราบได้อย่างไรว่ามีกี่แนวโน้มที่จะต้องมีการปรับและความยาวของแต่ละแนวโน้ม คุณแยกแยะความแตกต่างระหว่างการเลื่อนระดับและแนวโน้มและโดยทั่วไปคุณจะดูหมิ่นในการแสดงตน pf outliers / inliers อย่างไร
IrishStat

@IrishStat - ใช่นั่นคือจุดที่ดีทั้งหมดและฉันไม่ได้พยายามที่จะแก้ไขปัญหาอย่างเต็มรูปแบบเพียงแค่ดึงความสนใจไปที่ปัญหาของการใช้องค์ประกอบแนวโน้มจากผลลัพธ์ของ R ของ stl () เป็นตัวแปรการตอบสนองในการถดถอย . stl () ใช้การถดถอยแบบถ่วงน้ำหนักเฉพาะที่ในการย่อยสลายซึ่งโดยทั่วไปจะให้ผลลัพธ์ที่สมเหตุสมผลเมื่อมันมาถึงทิศทางการเปลี่ยนทิศทาง ฯลฯ แม้ว่าแน่นอนว่ามันมีข้อ จำกัด เมื่อเทียบกับวิธีการที่ใช้แบบจำลองโดยเฉพาะอย่างยิ่งสำหรับการพยากรณ์
ปีเตอร์เอลลิส
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.