เมื่อฉันประเมินการเดินแบบสุ่มด้วย AR (1) สัมประสิทธิ์ใกล้เคียงกับ 1 มาก แต่น้อยกว่าเสมอ
อะไรคือเหตุผลทางคณิตศาสตร์ที่สัมประสิทธิ์ไม่มากกว่าหนึ่ง?
เมื่อฉันประเมินการเดินแบบสุ่มด้วย AR (1) สัมประสิทธิ์ใกล้เคียงกับ 1 มาก แต่น้อยกว่าเสมอ
อะไรคือเหตุผลทางคณิตศาสตร์ที่สัมประสิทธิ์ไม่มากกว่าหนึ่ง?
คำตอบ:
เราประเมินโดยOLSรุ่น
สำหรับตัวอย่างของขนาด T ตัวประมาณคือ
หากกลไกการสร้างข้อมูลที่แท้จริงคือสุ่มเดินบริสุทธิ์แล้วและ
การกระจายการสุ่มตัวอย่างของ OLS ประมาณการหรือเท่ากันการกระจายตัวอย่างของ ρ - 1ไม่สมมาตรรอบศูนย์ แต่ค่อนข้างจะเป็นเบ้ไปทางซ้ายของศูนย์กับ≈ 68 % ของค่าที่ได้รับ (เช่น≈มวลความน่าจะเป็น) เป็นเชิงลบและเพื่อให้เราได้รับบ่อยกว่าไม่ρ < 1 นี่คือการแจกแจงความถี่สัมพัทธ์
บางครั้งสิ่งนี้เรียกว่าการกระจาย "Dickey-Fuller" เพราะมันเป็นฐานสำหรับค่าวิกฤตที่ใช้ในการทำการทดสอบ Unit-Root ในชื่อเดียวกัน
ฉันจำไม่ได้ว่าเห็นความพยายามที่จะให้สัญชาตญาณสำหรับรูปร่างของการกระจายตัวตัวอย่าง เรากำลังดูการกระจายตัวตัวอย่างของตัวแปรสุ่ม
หากเรารวมบรรทัดฐานผลิตภัณฑ์อิสระเราจะได้รับการแจกแจงที่ยังคงสมมาตรประมาณศูนย์ ตัวอย่างเช่น:
แต่ถ้าเรารวมเกณฑ์ปกติของผลิตภัณฑ์ที่ไม่เป็นอิสระเช่นเดียวกับกรณีของเราเราจะได้รับ
ซึ่งเอียงไปทางขวา แต่มีความน่าจะเป็นมากที่ปันส่วนไปยังค่าลบ และมวลดูเหมือนจะถูกผลักไปทางซ้ายมากขึ้นถ้าเราเพิ่มขนาดตัวอย่างและเพิ่มองค์ประกอบที่มีความสัมพันธ์มากขึ้นกับผลรวม
ส่วนกลับของผลรวมของ Gammas ที่ไม่เป็นอิสระนั้นเป็นตัวแปรสุ่มแบบไม่ลบที่มีความเบ้เป็นบวก
นี่ไม่ใช่คำตอบจริงๆ แต่ยาวเกินไปสำหรับความคิดเห็นดังนั้นฉันโพสต์สิ่งนี้
ฉันสามารถรับสัมประสิทธิ์มากกว่า 1 สองครั้งจากร้อยสำหรับขนาดตัวอย่าง 100 (โดยใช้ "R"):
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
การรับรู้ 84 และ 95 มีค่าสัมประสิทธิ์สูงกว่า 1 ดังนั้นจึงไม่ต่ำกว่าค่าหนึ่งเสมอ อย่างไรก็ตามแนวโน้มมีความชัดเจนว่าจะมีการประเมินแบบเอนเอียงลง คำถามที่ยังคงอยู่, ทำไม ?
แก้ไข:การถดถอยข้างต้นรวมถึงคำดักจับซึ่งดูเหมือนจะไม่ได้อยู่ในแบบจำลอง เมื่อการสกัดกั้นถูกลบออกฉันจะได้รับการประมาณการมากกว่า 1 (3158 จาก 10,000) แต่ก็ยังต่ำกว่า 50% ของทุกกรณีอย่างชัดเจน:
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1