อนุกรมเวลาตามฤดูกาล


9

ฉันใช้decomposeฟังก์ชั่นRและคิดส่วนประกอบ 3 อย่างของอนุกรมเวลารายเดือนของฉัน (แนวโน้มฤดูกาลและการสุ่ม) ถ้าฉันพล็อตแผนภูมิหรือดูที่ตารางฉันสามารถเห็นได้อย่างชัดเจนว่าอนุกรมเวลาได้รับผลกระทบตามฤดูกาล

อย่างไรก็ตามเมื่อฉันถอยหลังอนุกรมเวลาลงในตัวแปรจำลองตามฤดูกาล 11 ค่าสัมประสิทธิ์ทั้งหมดไม่มีนัยสำคัญทางสถิติซึ่งบอกว่าไม่มีฤดูกาล

ฉันไม่เข้าใจว่าทำไมฉันถึงได้ผลลัพธ์ที่แตกต่างกันสองอย่าง สิ่งนี้เกิดขึ้นกับใคร? ฉันกำลังทำอะไรผิดหรือเปล่า?


ฉันจะเพิ่มรายละเอียดที่เป็นประโยชน์ที่นี่

นี่คืออนุกรมเวลาของฉันและการเปลี่ยนแปลงรายเดือนที่สอดคล้องกัน ในแผนภูมิทั้งสองคุณสามารถเห็นว่ามีฤดูกาล (หรือนี่คือสิ่งที่ฉันต้องการประเมิน) โดยเฉพาะในแผนภูมิที่สอง (ซึ่งเป็นการเปลี่ยนแปลงรายเดือนของซีรี่ส์) ฉันสามารถเห็นรูปแบบที่เกิดซ้ำ (คะแนนสูงและคะแนนต่ำในเดือนเดียวกันของปี)

TimeSeries

MonthlyChange

ด้านล่างเป็นผลลัพธ์ของdecomposeฟังก์ชั่น ฉันขอขอบคุณที่ @RichardHardy กล่าวว่าฟังก์ชั่นไม่ได้ทดสอบว่ามีฤดูกาลจริงหรือไม่ แต่การสลายตัวดูเหมือนจะยืนยันสิ่งที่ฉันคิด

เปื่อย

อย่างไรก็ตามเมื่อฉันถอยหลังอนุกรมเวลาของตัวแปรตัวประกอบตามฤดูกาล 11 ตัว (มกราคมถึงพฤศจิกายนไม่รวมธันวาคม) ฉันพบสิ่งต่อไปนี้:

    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 5144454056  372840549  13.798   <2e-16 ***
    Jan     -616669492  527276161  -1.170    0.248    
    Feb     -586884419  527276161  -1.113    0.271    
    Mar     -461990149  527276161  -0.876    0.385    
    Apr     -407860396  527276161  -0.774    0.443    
    May     -395942771  527276161  -0.751    0.456    
    Jun     -382312331  527276161  -0.725    0.472    
    Jul     -342137426  527276161  -0.649    0.520    
    Aug     -308931830  527276161  -0.586    0.561    
    Sep     -275129629  527276161  -0.522    0.604    
    Oct     -218035419  527276161  -0.414    0.681    
    Nov     -159814080  527276161  -0.303    0.763

โดยทั่วไปค่าสัมประสิทธิ์ของฤดูกาลทั้งหมดไม่มีนัยสำคัญทางสถิติ

ในการรันการถดถอยเชิงเส้นฉันใช้ฟังก์ชันต่อไปนี้:

lm.r = lm(Yvar~Var$Jan+Var$Feb+Var$Mar+Var$Apr+Var$May+Var$Jun+Var$Jul+Var$Aug+Var$Sep+Var$Oct+Var$Nov)

ที่ฉันตั้งค่า Yvar เป็นตัวแปรอนุกรมเวลาด้วยความถี่รายเดือน (ความถี่ = 12)

ฉันยังลองพิจารณาส่วนประกอบที่เป็นที่นิยมของอนุกรมเวลารวมถึงตัวแปรเทรนด์ของการถดถอย อย่างไรก็ตามผลลัพธ์ไม่เปลี่ยนแปลง

                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 3600646404   96286811  37.395   <2e-16 ***
    Jan     -144950487  117138294  -1.237    0.222    
    Feb     -158048960  116963281  -1.351    0.183    
    Mar      -76038236  116804709  -0.651    0.518    
    Apr      -64792029  116662646  -0.555    0.581    
    May      -95757949  116537153  -0.822    0.415    
    Jun     -125011055  116428283  -1.074    0.288    
    Jul     -127719697  116336082  -1.098    0.278    
    Aug     -137397646  116260591  -1.182    0.243    
    Sep     -146478991  116201842  -1.261    0.214    
    Oct     -132268327  116159860  -1.139    0.261    
    Nov     -116930534  116134664  -1.007    0.319    
    trend     42883546    1396782  30.702   <2e-16 ***

ดังนั้นคำถามของฉันคือ: ฉันทำอะไรผิดในการวิเคราะห์การถดถอยหรือไม่?


1
@forecaster, นี่คือคำตอบสำหรับคำถามของคุณ (OP กล่าวว่าdecomposeฟังก์ชั่นในการRถูกนำมาใช้)
Richard Hardy

1
อ่านไฟล์ช่วยเหลือของdecomposeฟังก์ชั่นดูเหมือนว่าฟังก์ชั่นไม่ได้ทดสอบว่ามีฤดูกาล แต่จะได้รับค่าเฉลี่ยสำหรับแต่ละฤดูกาลหักค่าเฉลี่ยและเรียกสิ่งนี้ว่าองค์ประกอบตามฤดูกาล ดังนั้นมันจะสร้างองค์ประกอบตามฤดูกาลโดยไม่คำนึงว่ามีองค์ประกอบตามฤดูกาลจริงหรือเป็นเพียงแค่เสียงรบกวน อย่างไรก็ตามสิ่งนี้ไม่ได้อธิบายว่าทำไมหุ่นของคุณไม่มีนัยสำคัญแม้ว่าคุณจะบอกว่าฤดูกาลสามารถมองเห็นได้จากพล็อตของข้อมูล เป็นไปได้ไหมว่ากลุ่มตัวอย่างของคุณมีขนาดเล็กเกินไปที่จะได้รับหุ่นตัวจริงตามฤดูกาล พวกเขามีความหมายร่วมกันหรือไม่
Richard Hardy

3
คุณต้องดูที่ตาชั่งแผนภูมิตามฤดูกาลจะแสดงการเปลี่ยนแปลงตามฤดูกาลอยู่ระหว่าง -0.02 ถึง +0.04 ในขณะที่ค่าจริงมีตั้งแต่ 4 พันถึง 6 พันล้าน ฟังก์ชันการสลายตัวบังคับให้ข้อมูลของคุณแสดงบางฤดูกาลซึ่งเป็นสาเหตุที่แสดงค่าที่ไม่สำคัญ ไม่มีข้อมูลตามฤดูกาลของคุณ
พยากรณ์

1
ฉันคิดว่าฤดูกาลเป็นเรื่องเกี่ยวกับการเคลื่อนไหวด้วยความถี่ "คงที่" มากกว่าความรุนแรงของการเคลื่อนไหว ตาชั่งแตกต่างกันไปตามแผนภูมิแรกแสดงยอดคงเหลือ (ในรูปของปอนด์) และอันดับที่สองคือการเปลี่ยนแปลง (แสดงเป็นเปอร์เซ็นต์) ฉันแค่พยายามทำการถดถอยอีกครั้ง: ถ้าฉันคำนึงถึงแนวโน้มพหุนามค่าสัมประสิทธิ์บางอย่างก็เริ่มมีความสำคัญ ฉันเดาตามที่ @danno แนะนำแนวโน้มนั้นสำคัญมาก
mattiace

1
การทดสอบ Canova และ Hansen อาจให้ข้อมูลเพิ่มเติมเกี่ยวกับสถานะและความเสถียรของรูปแบบตามฤดูกาลในข้อมูลของคุณ สำหรับบางแอปพลิเคชันของการทดสอบนี้ดูตัวอย่างโพสต์นี้ซึ่งให้ลิงก์ไปยังกระดาษต้นฉบับและโค้ดตัวอย่าง
javlacalle

คำตอบ:


1

คุณกำลังทำการถดถอยข้อมูลหลังจากคุณลบแนวโน้มหรือไม่ คุณมีแนวโน้มในเชิงบวกและมีแนวโน้มว่าลายเซ็นตามฤดูกาลของคุณอยู่ในการถดถอย (ความแปรปรวนเนื่องจากแนวโน้มหรือข้อผิดพลาดมีขนาดใหญ่กว่าเนื่องจากเดือน) เว้นแต่ว่าคุณได้คำนึงถึงแนวโน้มใน Yvar ...

นอกจากนี้ฉันไม่มั่นใจอย่างมากกับอนุกรมเวลา แต่ไม่ควรมอบหมายการสังเกตแต่ละเดือนและการถดถอยของคุณมีลักษณะเช่นนี้หรือไม่

lm(Yvar ~ Time + Month)

ขออภัยหากไม่มีเหตุผล ... การถดถอยนั้นสมเหตุสมผลที่สุดหรือไม่


ฉันอ่านหนังสือเศรษฐมิติ (Wooldridge) ว่าถ้าคุณแนะนำปัจจัย "เวลา" ในการถดถอยมันเหมือนกับการตัดแนวโน้มซีรีย์เวลาดั้งเดิมของคุณ สำหรับปัจจัย "เวลา" ฉันหมายถึงเวกเตอร์เช่น [1, 2, ... , n] โดยมี n = ตามจำนวนการสังเกต ฉันไม่เข้าใจประเด็นที่สองของคุณ การถดถอยครั้งที่สองของฉันมีลักษณะดังนี้: lm.r = lm (Yvar ~ Var Jan + Var Nov) นี่คือสิ่งที่คุณหมายถึง? Tผมม.อี+VaRFอี+...+VaR
mattiace

มันจะช่วยให้เห็นข้อมูลของคุณสองสามบรรทัด แต่ฉันคิดว่าคุณมีสามคอลัมน์คือ Time, Yvar, Month แถวเป็นข้อสังเกต ดังนั้นฉันคิดว่าปัจจัยใน lm () ของคุณจะเป็นเวลาและเดือน (ไม่ใช่ระดับปัจจัยของเดือน) นอกจากนี้ฉันคิดว่ามีบางประเด็นเกี่ยวกับ lm () ตามลำดับเวลา ... การสังเกตไม่เป็นอิสระ
danno

1

ในภาพกราฟิกของอนุกรมเวลาคุณจะเห็นได้ชัดว่า "เทรนด์" - องค์ประกอบเชิงเส้นในเวลา - เป็นผู้มีส่วนสำคัญที่สุดในการทำให้เกิดผล เราจะแสดงความคิดเห็นว่าสิ่งสำคัญที่สุดของชุดเวลานี้คือการเพิ่มขึ้นอย่างมั่นคงในแต่ละเดือน

หลังจากนั้นฉันจะแสดงความคิดเห็นว่ารูปแบบที่เปลี่ยนแปลงตามฤดูกาลนั้นเล็กมากโดยการเปรียบเทียบ ดังนั้นจึงไม่น่าแปลกใจเลยที่การใช้มาตรการรายเดือนมากกว่า 6 ปี (รวมจากการสังเกตเพียง 72 ครั้ง) โมเดลการถดถอยเชิงเส้นไม่สามารถแม่นยำในการระบุความแตกต่าง 11 เดือนใด ๆ ที่มีนัยสำคัญทางสถิติ ไม่น่าแปลกใจที่เวลาเอฟเฟกต์นั้นมีนัยสำคัญทางสถิติเพราะมันเป็นเส้นตรงที่เพิ่มขึ้นโดยประมาณที่เกิดขึ้นในการสังเกตทั้ง 72 ครั้งโดยมีเงื่อนไขตามผลของฤดูกาล

การขาดความสำคัญทางสถิติสำหรับความแตกต่างใด ๆ ของ 11 เดือนไม่ได้หมายความว่าจะไม่มีผลตามฤดูกาล ในความเป็นจริงหากคุณต้องใช้แบบจำลองการถดถอยเพื่อตรวจสอบว่ามีฤดูกาลหรือไม่การทดสอบที่เหมาะสมคือการทดสอบอิสระ 11 ระดับที่ซ้อนกันซึ่งประเมินความสำคัญทางสถิติของแต่ละเดือน คุณจะได้รับการทดสอบดังกล่าวโดยทำการทดสอบความแปรปรวนแบบทดสอบความน่าจะเป็นอัตราส่วนหรือแบบทดสอบวัลด์ที่มีประสิทธิภาพ ตัวอย่างเช่น

library(lmtest) model.mt <- lm(outcome ~ time + month) model.t <- lm(outcome ~ time) aov(model.mt, model.t) lrtest(model.mt, model.t) library(sandwich) ## autoregressive consistent robust standard errors waldtest(lrtest, lmtest, vcov.=function(x)vcovHAC(x))


0

ฉันไม่ทราบว่าเป็นกรณีของคุณหรือไม่ แต่นั่นเกิดขึ้นกับฉันเมื่อฉันเริ่มวิเคราะห์อนุกรมเวลาใน R และปัญหาคือฉันไม่ได้ระบุระยะเวลาอนุกรมเวลาอย่างถูกต้องเมื่อสร้างวัตถุอนุกรมเวลาเพื่อแยกย่อยมัน มีพารามิเตอร์ในฟังก์ชันอนุกรมเวลาที่ให้คุณระบุความถี่ การทำเช่นนี้จะเป็นการย่อยสลายแนวโน้มของฤดูกาลอย่างถูกต้อง


jmnavarro ฉันกำหนดความถี่อย่างถูกต้องในฟังก์ชั่นการสลายตัว (= 12 เนื่องจากฉันมีข้อมูลรายเดือน) อันที่จริงฉันมีความสุขกับผลลัพธ์ของฟังก์ชั่นนี้ คำถามของฉันคือทำไมฉันไม่พบผลลัพธ์เดียวกัน (ฤดูกาลมีความสำคัญ) เมื่อฉันทำการถดถอยเชิงเส้นโดยใช้ตัวแปรจำลอง ฉันทำทั้งกับ R และ excel และผลลัพธ์เหมือนกัน: สัมประสิทธิ์ dummy ไม่มีนัยสำคัญทางสถิติ นี่คือสิ่งที่ฉันพบในฟังก์ชั่นการสลายตัว ฉันไม่เข้าใจว่าฉันพลาดอะไรบางอย่างที่นี่
mattiace

จริงขอโทษฉันไม่เข้าใจคำถามของคุณอย่างสมบูรณ์ มันจะช่วยถ้าคุณสามารถโพสต์รหัสของคุณเพื่อให้เราสามารถลองและทำซ้ำได้
jmnavarro
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.