รายงานข้อผิดพลาดมาตรฐานที่แข็งแกร่ง (ขาว) เสมอหรือไม่


20

ได้รับการแนะนำโดย Angrist และ Pischke ว่า Robust (เช่นมีความทนทานต่อ heteroskedasticity หรือความแปรปรวนไม่เท่ากัน) มีการรายงานข้อผิดพลาดมาตรฐานเป็นเรื่องของหลักสูตรมากกว่าการทดสอบ สองคำถาม:

  1. อะไรคือผลกระทบต่อข้อผิดพลาดมาตรฐานของการทำเช่นนั้นเมื่อมีความเป็นรักร่วมเพศ
  2. มีใครทำสิ่งนี้ในงานของพวกเขาบ้างไหม?

ฉันไม่แน่ใจในสิ่งที่คุณหมายถึงโดย "ข้อผิดพลาดมาตรฐานที่แข็งแกร่งถูกรายงานว่าเป็นเรื่องจริง" ข้อผิดพลาดมาตรฐานของอะไร คุณพูดว่าการทดสอบ "มัน" การทดสอบที่คุณพูดถึงคืออะไร?
robin girard

1
จุดดี .... ฉันกำลังพูดถึงข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยในการถดถอย OLS และปัญหาของ heteroscedasticity วิธีดั้งเดิมคือการทดสอบว่ามีการใช้ heteroscedasticity หรือไม่เช่นการทดสอบของไวท์หรือการทดสอบ Breusch Pagan หากพบว่ามีความแตกต่างกันอย่างใดอย่างหนึ่งจะรายงานข้อผิดพลาดมาตรฐานที่แข็งแกร่งมักจะข้อผิดพลาดมาตรฐานสีขาว
Graham Cookson

คุณช่วยใส่ลิงค์ไปที่ Angrist และ Pischke ได้ไหม
csgillespie

1
Angrist, Joshua D. และ Jorn-Steffen Pischke 2552. เศรษฐมิติที่ไม่เป็นอันตรายเป็นส่วนใหญ่: สหายของนักประจักษ์ Princeton University Press: Princeton, NJ.
ชาร์ลี

คำตอบ:


10

การใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งได้กลายเป็นเรื่องธรรมดาในทางเศรษฐศาสตร์ ข้อผิดพลาดมาตรฐานที่แข็งแกร่งมักจะมีขนาดใหญ่กว่าข้อผิดพลาดมาตรฐานที่ไม่แข็งแกร่ง (มาตรฐาน?) ดังนั้นการปฏิบัติสามารถดูได้ว่าเป็นความพยายามที่จะอนุรักษ์

ในกลุ่มตัวอย่างขนาดใหญ่ ( เช่นถ้าคุณทำงานกับข้อมูลการสำรวจสำมะโนประชากรด้วยการสังเกตหรือชุดข้อมูลที่มีการสังเกตนับพันครั้ง) การทดสอบแบบเฮเทอโรเซดิคติตี้นั้นเกือบจะเป็นผลดี

อีกวิธีหนึ่งในการต่อสู้กับ heteroskedasticity คือถ่วงน้ำหนักอย่างน้อยกำลังสอง แต่วิธีการนี้ได้ถูกมองลงเพราะเปลี่ยนการประมาณค่าพารามิเตอร์ซึ่งแตกต่างจากการใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่ง หากน้ำหนักของคุณไม่ถูกต้องการประมาณการของคุณจะมีอคติ หากน้ำหนักของคุณถูกต้องคุณจะได้รับข้อผิดพลาดมาตรฐานขนาดเล็ก ("มีประสิทธิภาพ") มากกว่า OLS พร้อมข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ


1
ข้อผิดพลาดมาตรฐานที่แข็งแกร่งนั้นมีความกว้างกว่าข้อผิดพลาดมาตรฐานทั่วไปเท่าใดเมื่อสมมติฐานของ OLS ไม่ถูกละเมิด
russellpierce

1
ไม่ได้กว้างกว่าเสมอ - ในความเป็นจริงบางครั้งพวกเขาอาจแคบ ดูโพสต์ล่าสุดบนบล็อกสำหรับหนังสือของ Angrist & Pischke: manyharmlesseconometrics.com/2010/12/…
onestop

1
+1, โดยมีข้อแม้ของ @ onestop ในความคิดเห็นด้านบนว่า se ที่แข็งแกร่งนั้นอาจใหญ่กว่าหรือเล็กกว่าได้ แต่โดยทั่วไปแล้วเราคาดว่าพวกมันจะใหญ่กว่า และใช่ฉันมักจะใช้ heteroskedastic ที่แข็งแกร่งหรือคลัสเตอร์ที่แข็งแกร่งในการทำงานของฉันเช่นเดียวกับทุกคนที่ฉันรู้
Cyrus S

1
การทดสอบความแตกต่างที่สำคัญไม่ได้เป็นเหตุผลที่จะหยุดกังวลเกี่ยวกับความแตกต่างของ OLS ของคุณ - การทดสอบนี้อาจไม่ได้มีอำนาจมากถึงแม้ว่าผลจะมี
แขกที่เข้าพัก

1
เหตุผลที่ดีสำหรับการไม่ลองใช้ WLS คือบ่อยครั้งที่คุณไม่ทราบว่าความสัมพันธ์แปรปรวนที่แท้จริง - และการดูข้อมูลที่เลือกจะทำให้การอนุมาน freqentist ของคุณเป็นโมฆะ เช่น Cyrus ฉันใช้ se ที่แข็งแกร่งทั่วทุกที่
แขกที่เข้าพัก

6

ในเศรษฐมิติเบื้องต้น (Woolridge, 2009 edition หน้า 268) คำถามนี้ได้รับการแก้ไข Woolridge กล่าวว่าเมื่อใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งสถิติ t ที่ได้รับจะมีการแจกแจงที่คล้ายคลึงกับการแจกแจงแบบ T แน่นอนหากขนาดตัวอย่างมีขนาดใหญ่ หากขนาดตัวอย่างเล็ก t-stats ที่ได้รับโดยใช้การถดถอยที่แข็งแกร่งอาจมีการแจกแจงที่ไม่ใกล้กับการแจกแจง t และสิ่งนี้อาจทำให้เกิดการอนุมาน


6

ข้อผิดพลาดมาตรฐานที่แข็งแกร่งให้การประมาณการข้อผิดพลาดมาตรฐานที่เป็นกลางภายใต้ความแตกต่างที่รุนแรง มีหนังสือตำราทางสถิติหลายเล่มที่ให้การสนทนาที่มีขนาดใหญ่และยาวเกี่ยวกับข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ ไซต์ต่อไปนี้ให้ข้อมูลสรุปที่ค่อนข้างครอบคลุมเกี่ยวกับข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ:

https://economictheoryblog.com/2016/08/07/robust-standard-errors/

กลับมาที่คำถามของคุณ การใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งไม่ได้เกิดขึ้นโดยไม่มีข้อ จำกัด อ้างอิงจาก Woolridge (2009 edition, หน้า 268) โดยใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งสถิติ t ที่ได้รับมีการแจกแจงซึ่งคล้ายคลึงกับการแจกแจงแบบ t แน่นอนหากขนาดตัวอย่างมีขนาดใหญ่ หากขนาดตัวอย่างเล็ก t-stats ที่ได้รับโดยใช้การถดถอยที่แข็งแกร่งอาจมีการแจกแจงที่ไม่ใกล้กับการแจกแจง t สิ่งนี้อาจทำให้เกิดการอนุมาน นอกจากนี้ในกรณีที่เป็นเนื้อเดียวกันความผิดพลาดมาตรฐานที่แข็งแกร่งยังคงเป็นกลาง อย่างไรก็ตามมันไม่มีประสิทธิภาพ นั่นคือข้อผิดพลาดมาตรฐานทั่วไปมีความแม่นยำมากกว่าข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ ในที่สุดการใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งเป็นเรื่องธรรมดาในหลายสาขาวิชา


5

มีเหตุผลมากมายที่จะหลีกเลี่ยงการใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ ในทางเทคนิคแล้วสิ่งที่เกิดขึ้นคือความแปรปรวนได้รับน้ำหนักตามน้ำหนักที่คุณไม่สามารถพิสูจน์ได้ในความเป็นจริง ความกังวลจึงเป็นเพียงเครื่องมือเสริมความงาม โดยทั่วไปแล้วคุณควรจะผอมเกี่ยวกับการเปลี่ยนรูปแบบ มีความเกี่ยวข้องมากมายในการจัดการกับความต่างของเซลล์ในวิธีที่ดีกว่าเพียงแค่ระบายสีปัญหาที่เกิดขึ้นจากข้อมูลของคุณ ใช้เป็นสัญลักษณ์เพื่อสลับโมเดล คำถามนี้เกี่ยวข้องกับคำถามว่าจะจัดการกับผู้ผิดได้อย่างไร คน SOme เพิ่งลบพวกเขาเพื่อให้ได้ผลลัพธ์ที่ดีกว่ามันเกือบจะเหมือนกันเมื่อใช้ข้อผิดพลาดมาตรฐานที่แข็งแกร่งเพียงในบริบทอื่น


นี่เป็นคำแนะนำที่ไม่ดีจริง ๆ ใช้ข้อผิดพลาดที่มีประสิทธิภาพเนื่องจากมีความสอดคล้องกันในทั้งสองกรณี
Repmat

3

ฉันคิดว่าข้อผิดพลาดมาตรฐานสีขาวและข้อผิดพลาดมาตรฐานที่คำนวณในแบบ "ปกติ" (เช่น Hessian และ / หรือ OPG ในกรณีที่มีความเป็นไปได้สูงสุด) เทียบเท่ากับ asymptotically ในกรณีของ homoskedasticity หรือไม่

เฉพาะในกรณีที่มีข้อผิดพลาดมาตรฐานแบบ heteroskedasticity ข้อผิดพลาดมาตรฐาน "ปกติ" จะไม่เหมาะสมซึ่งหมายความว่าข้อผิดพลาดมาตรฐานสีขาวมีความเหมาะสมไม่ว่าจะมีหรือไม่มีแบบ heteroskedasticity นั่นก็คือแม้ว่ารุ่นของคุณจะเป็นรุ่นเดียวกันก็ตาม

ฉันไม่สามารถพูดถึง 2 แต่ฉันไม่เห็นว่าทำไมคนไม่ต้องการคำนวณ White SE และรวมไว้ในผลลัพธ์


2

ฉันมีหนังสือเรียนเรื่อง Introduction to เศรษฐมิติเล่ม 3 โดย Stock และ Watson ที่อ่านว่า "หากข้อผิดพลาดเป็น heteroskedastic จากนั้น t-statistic ที่คำนวณโดยใช้ข้อผิดพลาดมาตรฐาน homoskedasticity เท่านั้นไม่ได้มีการแจกแจงแบบปกติมาตรฐานแม้ในกลุ่มตัวอย่างขนาดใหญ่" ฉันเชื่อว่าคุณไม่สามารถทำการทดสอบการอนุมาน / สมมุติฐานที่เหมาะสมโดยไม่สามารถสันนิษฐานได้ว่าสถิติเชิงสถิติของคุณถูกแจกแจงแบบปกติ ฉันมีความเคารพ Wooldridge มากมาย (อันที่จริงแล้วระดับบัณฑิตศึกษาของฉันก็ใช้หนังสือของเขาด้วย) ดังนั้นฉันจึงเชื่อว่าสิ่งที่เขาพูดเกี่ยวกับสถิติการใช้ SE ที่แข็งแกร่งต้องใช้ตัวอย่างขนาดใหญ่ที่เหมาะสมแน่นอน แต่ฉันคิดว่าเรา มักจะต้องจัดการกับความต้องการตัวอย่างขนาดใหญ่และเรายอมรับว่า อย่างไรก็ตามความจริงที่ว่าการใช้ SE ที่ไม่ทนทานจะไม่ให้ t-stat ที่มีการแจกแจงแบบปกติมาตรฐานแม้ว่าคุณจะมีกลุ่มตัวอย่างจำนวนมากก็สร้างความท้าทายที่ยิ่งใหญ่กว่าที่จะเอาชนะ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.