สร้างอนุกรมเวลาที่มีข้อสังเกตหลายอย่างสำหรับแต่ละวัน


11

ฉันพยายามใช้อนุกรมเวลากับข้อมูลตัวอย่างรายไตรมาส (ชีวมวลสัตว์) ในช่วงเวลา 10 ปีโดยมี 3 reps ต่อไตรมาส ดังนั้น 40 วัน แต่ 120 การสังเกตทั้งหมด

ฉันได้อ่านถึง SARIMA'a ในการวิเคราะห์อนุกรมเวลาของ Shumway และ Stoffer แล้วและก็เป็นแอปพลิเคชันเช่นเดียวกับ Woodward ที่เหลืออยู่ การวิเคราะห์อนุกรมเวลาของอัลประยุกต์และความเข้าใจของฉันคือแต่ละแบบจำลองนั้นอิงจากการสังเกตเพียงจุดเดียวในแต่ละจุดในอนุกรมเวลา

คำถาม: ฉันจะรวมการเปลี่ยนแปลงในแต่ละการสังเกตในแบบจำลองของฉันได้อย่างไร ฉันสามารถสร้างซีรีส์ตามค่าเฉลี่ย แต่ฉันจะหลวมการเปลี่ยนแปลงในแต่ละการสังเกตและฉันคิดว่ามันเป็นสิ่งสำคัญที่จะเข้าใจสิ่งที่เกิดขึ้น


SARIMA สามารถขยายไปยังกรณีแบบหลายตัวแปรซึ่งอาจจะเป็นประโยชน์สำหรับคุณ คำหลักในกรณีนี้คือ VAR ซึ่งหมายความว่าคุณสังเกตเวกเตอร์ของตัวเลขแทนหนึ่งหมายเลขสำหรับแต่ละช่วงเวลา
mpiktas

คำตอบ:


4

ขึ้นอยู่กับว่าคุณหมายถึงอะไรโดย "3 reps ต่อไตรมาส" แบบจำลองข้อมูลแผง ( วิกิพีเดีย ) อาจทำให้รู้สึก นี่หมายความว่าคุณกำลังวัดสามครั้งต่อไตรมาสหนึ่งแหล่งจากแหล่งที่แตกต่างกันสามแห่งที่ยังคงเหมือนเดิมเมื่อเวลาผ่านไป ข้อมูลของคุณจะมีลักษณะดังนี้:

obs quarter value
  A       1   2.2 
  A       2   2.3 
  A       3   2.4 
  B       1   1.8 
  B       2   1.7 
  B       3   1.6 
  C       1   3.3 
  C       2   3.4 
  C       3   3.5 

หากนี่คือสิ่งที่คุณกำลังดูมีหลายรุ่นสำหรับการทำงานกับข้อมูลพาเนล นี่คือการนำเสนอที่ดีที่ครอบคลุม R พื้นฐานบางอย่างที่คุณจะใช้เพื่อดูข้อมูลพาเนล เอกสารนี้มีความลึกมากกว่าเดิมเล็กน้อยแม้จะเป็นมุมมองทางเศรษฐมิติ

อย่างไรก็ตามหากข้อมูลของคุณไม่สอดคล้องกับระเบียบวิธีข้อมูลพาเนลมีเครื่องมืออื่น ๆ สำหรับ "ข้อมูลที่รวมกลุ่ม" คำจำกัดความจากบทความนี้ (pdf) :

การรวมข้อมูลหมายถึงการวิเคราะห์ทางสถิติโดยใช้แหล่งข้อมูลหลายแหล่งที่เกี่ยวข้องกับประชากรหลายกลุ่ม มันครอบคลุมค่าเฉลี่ยการเปรียบเทียบและการตีความข้อมูลทั่วไป สถานการณ์และปัญหาที่แตกต่างกันก็เกิดขึ้นเช่นกันว่าแหล่งข้อมูลและประชากรที่เกี่ยวข้องนั้นเหมือนหรือคล้ายกันหรือแตกต่างกัน

อย่างที่คุณเห็นจากนิยามนั้นเทคนิคที่คุณจะใช้จะขึ้นอยู่กับสิ่งที่คุณคาดหวังที่จะเรียนรู้จากข้อมูลของคุณ

ถ้าฉันจะแนะนำสถานที่สำหรับคุณที่จะเริ่มต้นสมมติว่าการดึงของคุณสามครั้งในแต่ละไตรมาสนั้นสอดคล้องกันตลอดเวลาฉันจะบอกว่าเริ่มต้นด้วยการใช้ตัวประมาณค่าเอฟเฟกต์คงที่ (หรือเรียกอีกอย่างว่า ข้อมูล.

สำหรับตัวอย่างของฉันด้านบนรหัสจะมีลักษณะดังนี้:

> Panel = data.frame(value=c(2.2,2.3,2.4,1.8,1.7,1.9,3.3,3.4,3.5), 
                     quarter=c(1,2,3,1,2,3,1,2,3), 
                     obs=c("A","A","A","B","B","B","C","C","C"))
> fixed.dum <-lm(value ~ quarter + factor(obs), data=Panel)
> summary(fixed.dum)

ซึ่งให้ผลลัพธ์ต่อไปนี้กับเรา:

Call:
lm(formula = value ~ quarter + factor(obs), data = Panel)

Residuals:
         1          2          3          4          5          6          7 
-1.667e-02 -8.940e-17  1.667e-02  8.333e-02 -1.000e-01  1.667e-02 -1.667e-02 
         8          9 
 1.162e-16  1.667e-02 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)   2.13333    0.06055  35.231 3.47e-07 ***
quarter       0.08333    0.02472   3.371 0.019868 *  
factor(obs)B -0.50000    0.04944 -10.113 0.000162 ***
factor(obs)C  1.10000    0.04944  22.249 3.41e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 0.06055 on 5 degrees of freedom
Multiple R-squared: 0.9955, Adjusted R-squared: 0.9928 
F-statistic: 369.2 on 3 and 5 DF,  p-value: 2.753e-06 

ที่นี่เราสามารถเห็นผลของเวลาในสัมประสิทธิ์ของตัวแปรไตรมาสได้อย่างชัดเจนรวมถึงผลของการอยู่ในกลุ่ม B หรือกลุ่ม C (ตรงข้ามกับกลุ่ม A)

หวังว่าสิ่งนี้จะนำคุณไปสู่ทิศทางที่ถูกต้อง


3

ฉันคิดว่านี่น่าสนใจ ข้อเสนอแนะของฉันคือการเฉลี่ยจุดข้อมูลทั้งสามเพื่อให้ได้อนุกรมเวลาที่พอดี ในขณะที่คุณชี้ให้เห็นว่าถ้าคุณทำเช่นนี้โดยไม่สนใจว่าคุณใช้ค่าเฉลี่ยของการสังเกตสามครั้งคุณจะทิ้งข้อมูล แต่สำหรับแต่ละจุดคุณสามารถรวมความเบี่ยงเบนกำลังสองจากค่าเฉลี่ยได้ รวมจำนวนสี่เหลี่ยมเหล่านั้นในช่วงเวลาทั้งหมดแล้วหารด้วย n-1 โดยที่ n คือจำนวนคะแนนทั้งหมดที่ใช้ในการคำนวณ หากคุณมีแบบจำลองที่มีโครงสร้างอนุกรมเวลา (เช่นแนวโน้มองค์ประกอบตามฤดูกาลโครงสร้างการพึ่งพา AR) การคำนวณนี้อาจเป็นการประเมินความแปรปรวนของคำผิดพลาดในแบบจำลองโดยอิสระและไม่ลำเอียง


1
+1 สำหรับแนวคิดที่มีประโยชน์ที่เรียกใช้งานได้ง่ายและใช้ได้จริงตามหลักวิชา การแก้ไขเล็กน้อยหนึ่งครั้ง: จะมีค่าสังเกตได้ในช่วงเวลาการประมาณค่าความแปรปรวนแบบไม่เอนเอียงจะแบ่งผลรวมของการเบี่ยงเบนกำลังสองทั้งหมดด้วยแทนที่จะเป็นหรือ (อย่างใดอย่างหนึ่งแตกต่างกันอย่างมาก หนึ่งอาจจะพล็อตการประมาณค่าความแปรปรวนของแต่ละบุคคล (หนึ่งครั้งต่อช่วงเวลา) เมื่อเวลาผ่านไปเช่นกันเพื่อประเมินว่ามันถูกต้องตามกฎหมายที่จะรวมพวกเขาทั้งหมดเช่นนี้ 3nn3n2nn13n1
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.