การประเมินการเดินแบบสุ่มด้วย AR (1)


10

เมื่อฉันประเมินการเดินแบบสุ่มด้วย AR (1) สัมประสิทธิ์ใกล้เคียงกับ 1 มาก แต่น้อยกว่าเสมอ

อะไรคือเหตุผลทางคณิตศาสตร์ที่สัมประสิทธิ์ไม่มากกว่าหนึ่ง?


ฉันลองใช้กล่องเครื่องมือ Matlab และสคริปต์ของฉันที่ arima (ซึ่งค่าสัมประสิทธิ์ถูกล้อมรอบที่ [-10,10] และผลลัพธ์จะเหมือนกัน) ฉันลองใช้ OLS แบบง่าย ๆ และผลลัพธ์ก็เหมือนกัน
Marco

การประเมินมีอคติต่ำลงเราต้องอ่านเอกสาร Dickey และ Fuller
Marco

คำตอบ:


12

เราประเมินโดยOLSรุ่น

xเสื้อ=ρxเสื้อ-1+ยูเสื้อ,E(ยูเสื้อ|{xเสื้อ-1,xเสื้อ-2,...})=0,x0=0

สำหรับตัวอย่างของขนาด T ตัวประมาณคือ

ρ^=Σเสื้อ=1Txเสื้อxเสื้อ-1Σเสื้อ=1Txเสื้อ-12=ρ+Σเสื้อ=1Tยูเสื้อxเสื้อ-1Σเสื้อ=1Txเสื้อ-12

หากกลไกการสร้างข้อมูลที่แท้จริงคือสุ่มเดินบริสุทธิ์แล้วและρ=1

xเสื้อ=xเสื้อ-1+ยูเสื้อxเสื้อ=Σผม=1เสื้อยูผม

การกระจายการสุ่มตัวอย่างของ OLS ประมาณการหรือเท่ากันการกระจายตัวอย่างของ ρ - 1ไม่สมมาตรรอบศูนย์ แต่ค่อนข้างจะเป็นเบ้ไปทางซ้ายของศูนย์กับ68 % ของค่าที่ได้รับ (เช่นมวลความน่าจะเป็น) เป็นเชิงลบและเพื่อให้เราได้รับบ่อยกว่าไม่ρ < 1 นี่คือการแจกแจงความถี่สัมพัทธ์ρ^-168ρ^<1

ป้อนคำอธิบายรูปภาพที่นี่

หมายถึง:-0.0017773กลาง:-0.00085984จำนวนขั้นต่ำ: -0.042875ขีดสุด: 0.0052173ส่วนเบี่ยงเบนมาตรฐาน: 0.0031625เบ้: -2.2568อดีต โด่ง: 8.3017

บางครั้งสิ่งนี้เรียกว่าการกระจาย "Dickey-Fuller" เพราะมันเป็นฐานสำหรับค่าวิกฤตที่ใช้ในการทำการทดสอบ Unit-Root ในชื่อเดียวกัน

ฉันจำไม่ได้ว่าเห็นความพยายามที่จะให้สัญชาตญาณสำหรับรูปร่างของการกระจายตัวตัวอย่าง เรากำลังดูการกระจายตัวตัวอย่างของตัวแปรสุ่ม

ρ^-1=(Σเสื้อ=1Tยูเสื้อxเสื้อ-1)(1Σเสื้อ=1Txเสื้อ-12)

ยูเสื้อρ^-1ρ^-1

T=5

หากเรารวมบรรทัดฐานผลิตภัณฑ์อิสระเราจะได้รับการแจกแจงที่ยังคงสมมาตรประมาณศูนย์ ตัวอย่างเช่น:

ป้อนคำอธิบายรูปภาพที่นี่

แต่ถ้าเรารวมเกณฑ์ปกติของผลิตภัณฑ์ที่ไม่เป็นอิสระเช่นเดียวกับกรณีของเราเราจะได้รับ

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งเอียงไปทางขวา แต่มีความน่าจะเป็นมากที่ปันส่วนไปยังค่าลบ และมวลดูเหมือนจะถูกผลักไปทางซ้ายมากขึ้นถ้าเราเพิ่มขนาดตัวอย่างและเพิ่มองค์ประกอบที่มีความสัมพันธ์มากขึ้นกับผลรวม

ส่วนกลับของผลรวมของ Gammas ที่ไม่เป็นอิสระนั้นเป็นตัวแปรสุ่มแบบไม่ลบที่มีความเบ้เป็นบวก

ρ^-1


ว้าวการวิเคราะห์ที่ดี! คุณสามารถระบุว่าข้อสันนิษฐานของ OLS มาตรฐานใดที่ถูกละเมิดที่นี่?
Richard Hardy

@ RichardHardy ขอบคุณ ฉันจะกลับมาในภายหลังเพื่อตอบความคิดเห็นของคุณ
Alecos Papadopoulos

ฉันยังสงสัยเกี่ยวกับสมมติฐานของ OLS ... ขอบคุณล่วงหน้า!
Richard Hardy

Xเสื้อ+1=αXเสื้อ+εXเสื้อ+1-Xเสื้อ

ρ^<1ρ^-1

6

นี่ไม่ใช่คำตอบจริงๆ แต่ยาวเกินไปสำหรับความคิดเห็นดังนั้นฉันโพสต์สิ่งนี้

ฉันสามารถรับสัมประสิทธิ์มากกว่า 1 สองครั้งจากร้อยสำหรับขนาดตัวอย่าง 100 (โดยใช้ "R"):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

การรับรู้ 84 และ 95 มีค่าสัมประสิทธิ์สูงกว่า 1 ดังนั้นจึงไม่ต่ำกว่าค่าหนึ่งเสมอ อย่างไรก็ตามแนวโน้มมีความชัดเจนว่าจะมีการประเมินแบบเอนเอียงลง คำถามที่ยังคงอยู่, ทำไม ?

แก้ไข:การถดถอยข้างต้นรวมถึงคำดักจับซึ่งดูเหมือนจะไม่ได้อยู่ในแบบจำลอง เมื่อการสกัดกั้นถูกลบออกฉันจะได้รับการประมาณการมากกว่า 1 (3158 จาก 10,000) แต่ก็ยังต่ำกว่า 50% ของทุกกรณีอย่างชัดเจน:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

ไม่แน่นอน "เสมอ" เล็กน้อย แต่ในกรณีส่วนใหญ่ เห็นได้ชัดว่ามันเป็นผลปลอม ทำไมเหตุผล
Marco

2
xเสื้อxเสื้อ-1
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.