ทำไมต้องใช้ Durbin-Watson แทนการทดสอบความสัมพันธ์อัตโนมัติ


10

การทดสอบ Durbin-Watson จะทดสอบความสัมพันธ์แบบอัตโนมัติของส่วนที่เหลือที่ล่าช้า 1 แต่จะทำการทดสอบความสัมพันธ์แบบอัตโนมัติที่ความล่าช้า 1 โดยตรง นอกจากนี้คุณสามารถทดสอบความสัมพันธ์อัตโนมัติที่ lag 2,3,4 และมีการทดสอบ portmanteau ที่ดีสำหรับการ autocorrelation ที่ความล่าช้าหลายครั้งและรับกราฟที่ดีและตีความง่าย [เช่นฟังก์ชัน acf () ใน R] Durbin-Watson นั้นไม่เข้าใจง่ายและมักให้ผลลัพธ์ที่สรุปไม่ได้ ดังนั้นทำไมจึงใช้

นี่เป็นแรงบันดาลใจจากคำถามนี้เกี่ยวกับความไม่ลงรอยกันของการทดสอบ Durbin-Watson บางอย่าง แต่แยกออกจากกันอย่างชัดเจน


1
จริงๆแล้วคุณสามารถทำ Durbin-Watson สำหรับความล่าช้าอื่น ๆ ค้นหาสถิติ Durbin-Watson ทั่วไป
Brandon Sherman

คำตอบ:


8

ดังที่ได้กล่าวไว้ก่อนหน้าในหัวข้อนี้และหัวข้ออื่น ๆ : (1) การทดสอบ Durbin-Watson ไม่สามารถสรุปได้ เฉพาะขอบเขตที่แนะนำในตอนแรกโดย Durbin และ Watson เป็นเพราะการกระจายที่แม่นยำขึ้นอยู่กับเมทริกซ์การถดถอยที่สังเกต อย่างไรก็ตามมันง่ายพอที่จะกล่าวถึงในซอฟต์แวร์เชิงสถิติ / เศรษฐมิติได้ในขณะนี้ (2) มีการวางหลักเกณฑ์ทั่วไปของการทดสอบ Durbin-Watson ให้ล่าช้ามากขึ้น ดังนั้นความไม่ลงรอยกันและข้อ จำกัด ของความล่าช้าจึงไม่เป็นข้อโต้แย้งต่อการทดสอบ Durbin-Watson

เมื่อเปรียบเทียบกับการทดสอบ Wald ของตัวแปรที่ล้าหลังการทดสอบ Durbin-Watson สามารถมีพลังงานที่สูงขึ้นในบางรุ่น โดยเฉพาะถ้าโมเดลนั้นมีแนวโน้มที่กำหนดขึ้นหรือรูปแบบตามฤดูกาลมันจะเป็นการดีกว่าที่จะทดสอบการหาค่าความสัมพันธ์แบบอัตโนมัติในส่วนที่เหลือ . ฉันรวมการจำลอง R ขนาดเล็กด้านล่าง

ข้อเสียเปรียบอย่างหนึ่งที่สำคัญของการทดสอบ Durbin-Watson คือต้องไม่ใช้กับรุ่นที่มีเอฟเฟกต์ระบบตอบโต้อัตโนมัติ ดังนั้นคุณจึงไม่สามารถทดสอบความสัมพันธ์อัตโนมัติที่เหลืออยู่หลังจากจับภาพบางส่วนในรูปแบบการตอบโต้อัตโนมัติ ในสถานการณ์นั้นพลังของการทดสอบ Durbin-Watson สามารถพังทลายลงอย่างสมบูรณ์ในขณะที่การทดสอบ Breusch-Godfrey นั้นไม่เป็นเช่นนั้น หนังสือของเรา "ประยุกต์เศรษฐกับ R" มีการศึกษาแบบจำลองขนาดเล็กที่แสดงให้เห็นว่าเรื่องนี้ในบท "การเขียนโปรแกรมการวิเคราะห์ของคุณเอง" ดูhttp://eeecon.uibk.ac.at/~zeileis/teaching/AER/

สำหรับชุดข้อมูลที่มีแนวโน้มและข้อผิดพลาดที่เกี่ยวข้องโดยอัตโนมัติอำนาจของการทดสอบ Durbin-Watson นั้นสูงกว่าการทดสอบ Breusch-Godfrey แม้ว่าจะสูงกว่าการทดสอบ Wald ของ autoregressive effect ฉันแสดงสิ่งนี้สำหรับสถานการณ์เล็ก ๆ ที่เรียบง่ายใน R. ฉันวาดการสังเกต 50 แบบจากแบบจำลองดังกล่าวและคำนวณค่า p สำหรับการทดสอบทั้งสามแบบ:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

จากนั้นเราสามารถจำลองค่า p 1,000 ค่าสำหรับทั้งสามรุ่น:

set.seed(1)
p <- t(replicate(1000, pvals()))

การทดสอบ Durbin-Watson นำไปสู่ค่า p ต่ำสุดโดยเฉลี่ย

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

และพลังสูงสุดที่ระดับนัยสำคัญ 5%:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 

ดังนั้นข้อ จำกัด อีกประการหนึ่งของสถิติ DW คือมันไม่สามารถใช้งานได้หากแบบจำลองพยายามควบคุมความสัมพันธ์อัตโนมัติแล้ว ฉันขอขอบคุณความจริงที่ว่า DW มีพลังมากกว่า Wald หรือ Breusch-Godfrey (ซึ่งฉันไม่เคยใช้) แต่การเปรียบเทียบตามปกติของฉันคือการทดสอบกระเป๋าหิ้วเช่น Ljung-Box และ autocorrelations แต่ละรายการเปรียบเทียบกับ 0 นั่นเป็นระบอบการปกครองโดยทั่วไปในการพยากรณ์ตำราเรียน
zbicyclist

2
ไม่ใช่ข้อ จำกัดอีกอย่างของ IMO แต่เป็นข้อ จำกัดหลัก ปัญหาอื่น ๆ (การคำนวณค่า p- ขอบเขตและจำนวนของความล่าช้า) สามารถจัดการได้ และระวังด้วยการตีความพลังงาน: ฉันบอกว่าในรูปแบบนี้โดยเฉพาะ - แนวโน้มข้อผิดพลาดของเทอม AR (1) - การทดสอบ Durbin-Watson มีพลังสูงกว่า นี่อาจไม่ใช่กรณีในการตั้งค่าอื่น ๆ อีกมากมาย และสำหรับการทดสอบ Ljung-Box: ใช่นี่คือการทดสอบแบบดั้งเดิมเพื่อตรวจสอบความสัมพันธ์อัตโนมัติที่เหลืออยู่หลังจากติดตั้งแบบจำลอง ARIMA
Achim Zeileis

3

การทดสอบ Durbin-Watson เป็นวิธีการทดสอบความสัมพันธ์ของคุณโดยอัตโนมัติ การพล็อต ACF นั้นเหมือนกับการทำ QQ plot เพื่อทดสอบความเป็นมาตรฐาน ความสามารถในการมองเห็นพล็อต QQ เพื่อทดสอบความเป็นปกตินั้นมีประโยชน์ แต่การทดสอบ Kolmogorov-Smirnov หรือ Levene จะเสริมสิ่งที่คุณเห็นในพล็อตเนื่องจากการทดสอบสมมติฐานสำหรับความปกตินั้นมีข้อสรุปที่ชัดเจนกว่า

สำหรับความล่าช้าหลายครั้งคุณสามารถใช้สถิติ Durbin-Watson ทั่วไปทำการทดสอบสมมติฐานบางอย่างและทำการแก้ไข Bonferroni เพื่อแก้ไขสำหรับการทดสอบหลาย ๆ แบบ คุณยังสามารถทำการทดสอบ Breusch-Godfreyซึ่งทำการทดสอบว่ามีความสัมพันธ์กับลำดับใดบ้าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.