จะทราบได้อย่างไรว่ามีเศษที่เกี่ยวข้องโดยอัตโนมัติจากกราฟิกหรือไม่


12

เมื่อคุณทำการถดถอยแบบ OLS และพล็อตค่าส่วนที่เหลือที่เกิดขึ้นคุณจะบอกได้อย่างไรว่าส่วนที่เหลือมีความสัมพันธ์โดยอัตโนมัติ ฉันรู้ว่ามีการทดสอบสำหรับเรื่องนี้ (Durbin, Breusch-Godfrey) แต่ฉันก็สงสัยว่าถ้าคุณสามารถดูพล็อตที่จะวัดว่าการหาค่าอัตโนมัตรอาจเป็นปัญหา (เพราะสำหรับ heteroskedasticity

คำตอบ:


12

ไม่เพียง แต่คุณจะสามารถมองเห็นพล็อตฉันคิดว่ามันเป็นตัวเลือกที่ดีกว่า การทดสอบสมมติฐานในสถานการณ์นี้ตอบคำถามที่ผิด

พล็อตปกติในการดูจะเป็นฟังก์ชั่น autocorrelation (ACF) ของส่วนที่เหลือ

ฟังก์ชั่นอัตความสัมพันธ์ของคลาดเคลื่อน (เป็นชุดเวลา) กับล่าช้าของตัวเอง

ตัวอย่างเช่นที่นี่คือ ACF ของส่วนที่เหลือจากตัวอย่างเล็ก ๆ จาก Montgomery และคณะ

ACF ของที่เหลือสำหรับการขายเครื่องดื่ม

ตัวอย่างความสัมพันธ์บางอย่าง (เช่นที่ล่าช้า 1,2 และ 8) ไม่เล็กโดยเฉพาะ (และอาจส่งผลกระทบอย่างมากกับสิ่งต่าง ๆ ) แต่พวกเขาก็ไม่สามารถบอกได้จากผลของเสียงรบกวน (ตัวอย่างมีขนาดเล็กมาก)

แก้ไข: นี่คือพล็อตเพื่อแสดงให้เห็นถึงความแตกต่างระหว่างซีรี่ส์ที่ไม่เกี่ยวข้องกับชุดที่มีความสัมพันธ์สูง

เสียงสีขาวและเดินสุ่ม

พล็อตด้านบนมีเสียงสีขาว (อิสระ) ด้านล่างเป็นการเดินแบบสุ่ม (ซึ่งมีความแตกต่างจากซีรี่ส์ดั้งเดิม) - มีความสัมพันธ์อัตโนมัติที่แข็งแกร่งมาก


1
ขอบคุณสำหรับคำตอบ. เมื่อคุณดูพล็อตบน wiki ( en.wikipedia.org/wiki/File:Acf_new.svg ) คุณสามารถบอกได้จากพล็อตด้านบน (ไม่ใช่พล็อต ACF) ว่าส่วนที่เหลือถูกป้อนอัตโนมัติหรือไม่
John Doe

ฉันจะพูดว่า "อืมมดูเป็นวงรอบ ... อาจจะเป็นแบบอัตชีวประวัติใช่มั้ย ACF มีหน้าตาเป็นอย่างไร?"
Glen_b -Reinstate Monica

1
โอเค แต่คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ไหมตัวอย่างเช่นฉันพบคำถามนี้: stats.stackexchange.com/questions/14914/… เห็นได้ชัดว่ามีการเชื่อมโยงอัตโนมัติ ฉันกำลังมองหาข้อสรุปนี้โดยเฉพาะอะไร
John Doe

แน่นอนว่าสิ่งนั้นแสดงให้เห็นบางสิ่งบางอย่างที่จะสร้างความสัมพันธ์เชิงบวกอัตโนมัติ (แม้ว่าฉันอาจจะใส่แนวโน้มลงไปรวมถึงการพึ่งพาเกี่ยวกับแนวโน้ม) ลองพิจารณา - หากการสังเกตเป็นอิสระจากนั้นให้คิดถึงโอกาสที่ระยะยาวของพวกเขาจะอยู่ข้างหนึ่งของค่าเฉลี่ยหรืออีกด้านหนึ่งโดยไม่มีใครอยู่ฝั่งตรงข้าม ฉันคิดว่าตัวเลือกแรกที่ดีที่สุดคือการจำลองข้อมูลที่เกี่ยวข้องอัตโนมัติในหลาย ๆ ระดับและดูมัน
Glen_b -Reinstate Monica

1
ฉันได้รับว่าคุณไม่มีความสัมพันธ์อัตโนมัติเมื่อข้อมูลถูกกระจายแบบสุ่ม แต่เป็นตัวบ่งชี้สำหรับความสัมพันธ์อัตโนมัติมันเพียงพอหรือไม่เมื่อข้อมูลไม่ได้ถูกกระจายแบบสุ่มหรือคุณเป็นรูปแบบ (เช่นจุดข้อมูลที่มีค่าสูงตามด้วยจุดข้อมูลหลายจุดที่มีค่าสูง)?
John Doe

2

ไม่ผิดปกติหาก 5% หรือน้อยกว่าของค่าความสัมพันธ์อัตโนมัติอยู่นอกช่วงเวลาเนื่องจากอาจเกิดจากรูปแบบการสุ่มตัวอย่าง วิธีปฏิบัติหนึ่งคือการสร้างพล็อตการหาค่าความสัมพันธ์อัตโนมัติสำหรับ 20 ค่าแรกและตรวจสอบว่ามีค่ามากกว่าหนึ่งค่าที่อยู่นอกช่วงเวลาที่อนุญาตหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.