vcovHC, vcovHAC, NeweyWest - ใช้ฟังก์ชั่นใด?


10

ฉันกำลังพยายามอัปเดตโมเดลตาม LM ของฉันเพื่อรับข้อผิดพลาดและการทดสอบมาตรฐานที่ถูกต้อง ฉันสับสนจริง ๆ ว่าเมทริกซ์ VC ที่จะใช้ sandwichแพคเกจราคาพิเศษvcovHC, และvcovHAC NeweyWestในขณะที่อดีตเพียงบัญชี heteroskedasticity สองหลังบัญชีทั้งความสัมพันธ์ต่อเนื่องและ heteroskedasticity กระนั้นเอกสารไม่ได้บอกอะไรมากมายเกี่ยวกับความแตกต่างระหว่างสองอันหลัง (อย่างน้อยฉันก็ไม่เข้าใจ) เมื่อมองไปที่ฟังก์ชั่นของตัวเองฉันรู้ว่า NeweyWest โทรหา vcovHAC จริงๆ

สังเกตุผลลัพธ์coeftest(mymodel, vcov. = vcovHAC)และcoeftest(mymodel, vcov. = NeweyWest)แตกต่างอย่างบ้าคลั่ง แม้ว่าvcovHACจะค่อนข้างใกล้เคียงกับผลลัพธ์ที่ไร้เดียงสา แต่การใช้ NeweyWest สัมประสิทธิ์ทั้งหมดจะเปลี่ยนไปเล็กน้อย (การทดสอบใกล้เคียงกับ 1)


โดยปกติหน้าความช่วยเหลือ R จะให้ลิงก์ไปยังบทความ รายละเอียดที่แม่นยำมักจะอยู่ที่นั่น ตัวอย่างบทความของ Zeileis นั้นมีให้ใช้อย่างอิสระและมีข้อมูลมากมาย
mpiktas

2
บทความของ Zeileisระบุว่าvcovHACแตกต่างNeweyWestอย่างไร เพื่อสรุปวิธีการ HAC ที่แตกต่างกันจะแตกต่างกันเฉพาะในการเลือกน้ำหนัก NeweyWestมีน้ำหนักที่ระบุvcovHACเป็นฟังก์ชั่นทั่วไปซึ่งช่วยให้คุณระบุน้ำหนักของคุณเองและโดยปกติแล้วจะใช้ตุ้มน้ำหนักแอนดรู
mpiktas

@mpiktas: ขอบคุณสำหรับการสรุป เนื่องจากฉันไม่ได้ระบุน้ำหนักใด ๆ จึงควรใช้ตุ้มน้ำหนักเริ่มต้นที่เกี่ยวข้อง ตอนนี้ฉันรู้แล้วฉันควรจะทบทวนคำถามของฉันเป็น: เหตุใดน้ำหนักเริ่มต้นที่แตกต่างกันของ vcovHAC และ NeweyWest สร้างความแตกต่างอย่างมากและวิธีการกำหนดน้ำหนัก ฉันหมายถึงคุณรู้น้ำหนักใดที่ STATA หรือแพ็คเกจอื่นใช้?
hans0l0

การคำนวณทั้งหมดเหล่านี้ขึ้นอยู่กับความจริงที่ว่าเป็นตัวแปรที่อยู่นิ่งซึ่งเป็น regressors และเป็นสิ่งรบกวน การเขียนแบบคงที่เป็นคุณสมบัติที่เข้มงวดเล็กน้อยดังนั้นโปรดตรวจสอบว่ามีอยู่หรือไม่ xtutxtut
mpiktas

คำตอบ:


3

คำถาม "แซนวิช" คือขนมปังสองชิ้นที่กำหนดโดยข้อมูลที่คาดว่าจะล้อมรอบเนื้อสัตว์ที่กำหนดโดยข้อมูลที่สังเกตได้ ดูความคิดเห็นของฉันที่นี่และที่นี่ สำหรับการถดถอยเชิงเส้นสมการประมาณคือ:

U(β)=XT(YXTβ)

ข้อมูลที่คาดหวัง (ขนมปัง) คือ:

A=U(β)β=(XTX)

ข้อมูลที่สังเกตได้ (เนื้อ) คือ:

B=E(U(β)U(β)T)=XT(YXTβ)(YXTβ)TX

หมายเหตุคำศัพท์ด้านในเป็นเส้นทแยงมุมของค่าคงที่ค่าคงที่เมื่อ homoscedasticity การหาข้อมูลที่เป็นอิสระคือสมมติฐานแล้วการประมาณค่าความแปรปรวนร่วมของแซนวิชซึ่งกำหนดโดยเป็นเมทริกซ์การถดถอยเชิงเส้นปกติโดยที่คือความแปรปรวนของส่วนที่เหลือ อย่างไรก็ตามมันค่อนข้างเข้มงวด คุณจะได้รับการประมาณค่าระดับที่กว้างขึ้นโดยการผ่อนคลายสมมติฐานที่เกี่ยวข้องกับเมทริกซ์ที่เหลือ : .A1BA1σ2(XTX)1σ2n×n

R=(YXTβ)(YXTβ)

เครื่องมือvcovHCประมาณการ"HC0" สอดคล้องกันแม้ว่าข้อมูลจะไม่เป็นอิสระ ดังนั้นฉันจะไม่บอกว่าเรา "ถือว่า" ส่วนที่เหลือมีความเป็นอิสระ แต่ฉันจะบอกว่าเราใช้ "โครงสร้างความแปรปรวนร่วมอิสระที่ทำงานได้" จากนั้นเมทริกซ์จะถูกแทนที่ด้วยเส้นทแยงมุมของสารตกค้างR

Rii=(YiβXI.)2,0 elsewhere

เครื่องมือประมาณค่านี้ทำงานได้ดียกเว้นในกลุ่มตัวอย่างขนาดเล็ก (มักจะน้อยกว่า 40) HC1-3 เป็นการแก้ไขตัวอย่างอัน จำกัด จำนวนมาก โดยทั่วไป HC3 นั้นมีประสิทธิภาพดีที่สุด

อย่างไรก็ตามถ้ามีเอฟเฟ็กต์ออโต้ทีเรียร์รายการแบบทแยงมุมของนั้นไม่เป็นศูนย์ดังนั้นเมทริกซ์ความแปรปรวนร่วมที่ปรับขนาดจะถูกสร้างขึ้นตามโครงสร้าง autoregressive ที่ใช้กันทั่วไป นี่คือเหตุผลสำหรับ "vcovHAC" ที่นี่มีวิธีการที่ยืดหยุ่นและใช้งานทั่วไปเพื่อประเมินเอฟเฟกต์การตอบโต้อัตโนมัติ: รายละเอียดอาจเกินขอบเขตคำถามของคุณ ฟังก์ชัน "meatHAC" เป็น workhorse ทั่วไป: วิธีการเริ่มต้นคือ Andrews ' Newey-West เป็นกรณีพิเศษของตัวประมาณค่าความผิดพลาดอัตโนมัติแบบอัตโนมัติทั่วไป วิธีการเหล่านี้แก้ปัญหาหนึ่งในสองปัญหา: 1. ความสัมพันธ์ลดลงระหว่างการสังเกตแบบ "ใกล้เคียง" และ 2. ระยะห่างที่เหมาะสมระหว่างการสังเกตสองครั้งคือเท่าใด เหล่านี้หากคุณมีข้อมูลพาเนลที่สมดุลตัวประมาณความแปรปรวนร่วมนี้มากเกินไปTgeegeeแพคเกจแทนการระบุโครงสร้างความแปรปรวนร่วมAR-1หรือคล้ายกัน

สำหรับการใช้งานนั้นขึ้นอยู่กับลักษณะของการวิเคราะห์ข้อมูลและคำถามทางวิทยาศาสตร์ ฉันจะไม่แนะนำให้เหมาะสมทุกประเภทและเลือกหนึ่งที่ดูดีที่สุดเพราะมันเป็นปัญหาการทดสอบหลายรายการ ดังที่ฉันได้กล่าวถึงก่อนหน้านี้ตัวประมาณค่า vcovHC นั้นมีความสอดคล้องแม้ในที่ที่มีเอฟเฟ็กต์การตอบโต้อัตโนมัติดังนั้นคุณสามารถใช้และแสดงให้เห็นถึง "รูปแบบความสัมพันธ์อิสระในการทำงาน" ในสถานการณ์ต่างๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.