ทำไมข้อผิดพลาดการวัดในตัวแปรตามไม่ทำให้เกิดผลลัพธ์


10

เมื่อมีข้อผิดพลาดในการวัดในตัวแปรอิสระฉันเข้าใจว่าผลลัพธ์นั้นจะเอนเอียงกับ 0 เมื่อตัวแปรที่ขึ้นอยู่กับการวัดที่มีข้อผิดพลาดพวกเขาบอกว่ามันมีผลต่อข้อผิดพลาดมาตรฐาน แต่สิ่งนี้ไม่สมเหตุสมผลสำหรับฉันเพราะเรา การประเมินผลของไม่ได้อยู่ในตัวแปรดั้งเดิมแต่มีผลต่ออื่น ๆรวมถึงข้อผิดพลาด ดังนั้นสิ่งนี้จะไม่ส่งผลกระทบต่อประมาณการ ในกรณีนี้ฉันสามารถใช้ตัวแปรเครื่องมือเพื่อลบปัญหานี้ได้หรือไม่XYY

คำตอบ:


17

เมื่อคุณต้องการประเมินแบบจำลองอย่างง่ายเช่น และแทนที่จะเป็นจริงคุณจะสังเกตเห็นมันด้วยข้อผิดพลาดซึ่งเป็นเช่นนั้น ไม่เกี่ยวข้องกับและหากคุณลงทะเบียน โดยประมาณของคุณคือ

Yi=α+βXi+ϵi
YiY~i=Yi+νiXϵ
Y~i=α+βXi+ϵi
β
β^=Cov(Y~i,Xi)Var(Xi)=Cov(Yi+νi,Xi)Var(Xi)=Cov(α+βXi+ϵi+νi,Xi)Var(Xi)=Cov(α,Xi)Var(Xi)+βCov(Xi,Xi)Var(Xi)+Cov(ϵi,Xi)Var(Xi)+Cov(νi,Xi)Var(Xi)=βVar(Xi)Var(Xi)=β
เพราะความแปรปรวนระหว่าง ตัวแปรสุ่มและค่าคงที่ ( ) เป็นศูนย์เช่นเดียวกับโคระหว่างและเนื่องจากเราสันนิษฐานว่าพวกมันไม่เกี่ยวข้องกันαXiϵi,νi

ดังนั้นคุณจะเห็นว่าค่าสัมประสิทธิ์ของคุณถูกประเมินอย่างสม่ำเสมอ สิ่งเดียวที่น่ากังวลคือให้คำศัพท์เพิ่มเติมในข้อผิดพลาดซึ่งจะช่วยลดพลังของการทดสอบทางสถิติของคุณ ในกรณีที่แย่มากของข้อผิดพลาดการวัดในตัวแปรตามคุณอาจไม่พบผลกระทบที่มีนัยสำคัญแม้ว่ามันอาจจะมีในความเป็นจริง โดยทั่วไปแล้วตัวแปรเครื่องมือจะไม่ช่วยคุณในกรณีนี้เพราะพวกเขามักจะไม่แน่ชัดกว่า OLS และพวกเขาสามารถช่วยแก้ไขข้อผิดพลาดการวัดในตัวแปรอธิบายY~i=Yi+νi=α+βXi+ϵi+νi


ฉันมีคำถามง่ายๆที่นี่: จะเกิดอะไรขึ้นถ้าνiซึ่งเป็นข้อผิดพลาดในการวัดในตัวแปรตามมีความสัมพันธ์กับตัวแปรอิสระที่น่าสนใจ? ฉันคิดว่ามีความเป็นไปได้มากมายที่สิ่งนี้สามารถเกิดขึ้นได้และความลำเอียงที่เป็นที่ต้องการของสังคมสามารถเป็นตัวอย่างได้ หากผู้ตอบแบบสำรวจมีอคติทางสังคมเมื่อตอบคำถามแบบผันแปรและหากความปรารถนานั้นเกี่ยวข้องกับตัวแปรอิสระสมมุติว่าอายุหรือเพศ (ซึ่งอาจสัมพันธ์กับเนื้อหาที่เป็นที่ต้องการทางสังคม) แง่ของ endogeneity แล้ว?
Kang Inkyu

3

การวิเคราะห์การถดถอยตอบคำถาม "ค่าเฉลี่ย Y คืออะไรสำหรับผู้ที่ได้รับค่า X" หรือเท่ากัน "Y คาดการณ์ว่าจะเปลี่ยนเป็น AVERAGE เท่าไหร่ถ้าเราเปลี่ยน X ทีละหน่วย?" ข้อผิดพลาดในการวัดแบบสุ่มไม่ได้เปลี่ยนค่าเฉลี่ยของตัวแปรหรือค่าเฉลี่ยสำหรับชุดย่อยของแต่ละคนดังนั้นข้อผิดพลาดแบบสุ่มในตัวแปรตามจะไม่ประมาณการถดถอยแบบอคติ

สมมติว่าคุณมีข้อมูลส่วนสูงของตัวอย่างบุคคล ความสูงเหล่านี้วัดได้อย่างแม่นยำมากสะท้อนความสูงจริงของทุกคนอย่างแม่นยำ ภายในตัวอย่างค่าเฉลี่ยสำหรับผู้ชายคือ 175 ซม. และค่าเฉลี่ยสำหรับผู้หญิงคือ 162 ซม. ถ้าคุณใช้การถดถอยเพื่อคำนวณว่าเพศทำนายความสูงได้ดีแค่ไหน

HEIGHT=CONSTANT+βGENDER+RESIDUAL

ถ้าผู้หญิงถูกเขียนเป็น 0 และผู้ชายเป็น 1เป็นค่าเฉลี่ยของผู้หญิงหรือ 162 ซม. สัมประสิทธิ์การถดถอยแสดงจำนวนความสูงที่เปลี่ยนแปลงโดยเฉลี่ยเมื่อคุณเปลี่ยนโดยหนึ่งหน่วย (จาก 0 ถึง 1) เท่ากับ 13 เพราะคนที่มีค่าคือ 0 (ผู้หญิง) มีความสูงเฉลี่ย 162 ซม. ในขณะที่คนที่มีค่าคือ 1 (ผู้ชาย) มีค่าเฉลี่ยสูง 175 ซม.; ประมาณความแตกต่างเฉลี่ยระหว่างความสูงของชายและหญิงซึ่งสูง 13 ซม. (สะท้อนให้เห็นถึงความแปรปรวนภายในเพศสูง)CONSTANTβGENDERβGENDERGENDERβRESIDUAL

ทีนี้ถ้าคุณเพิ่ม -1 ซม. หรือ +1 ซม. ในความสูงที่แท้จริงของทุกคนจะเกิดอะไรขึ้น บุคคลที่มีความสูงจริงคือ 170 ซม. ขณะนี้จะถูกรายงานว่าเป็น 169 หรือ 171 ซม. อย่างไรก็ตามค่าเฉลี่ยของตัวอย่างหรือตัวอย่างใด ๆ จะไม่เปลี่ยนแปลง ผู้ที่มีความสูงจริงคือ 170 ซม. จะเฉลี่ย 170 ซม. ในชุดข้อมูลที่ผิดพลาดผู้หญิงจะมีค่าเฉลี่ย 162 ซม. เป็นต้นหากคุณเรียกใช้โมเดลการถดถอยที่ระบุข้างต้นโดยใช้ชุดข้อมูลใหม่นี้ค่าที่คาดไว้ของจะไม่เปลี่ยนแปลงเนื่องจากความแตกต่างเฉลี่ยระหว่างชายและหญิงยังคงเป็น 13 ซม. โดยไม่คำนึงถึงข้อผิดพลาดในการวัด (ข้อผิดพลาดมาตรฐานของจะมีขนาดใหญ่กว่าก่อนเนื่องจากความแปรปรวนของตัวแปรตามมีขนาดใหญ่กว่านี้)ββ

หากมีข้อผิดพลาดในการวัดในตัวแปรอิสระมากกว่าตัวแปรขึ้นอยู่กับจะเป็นการประเมินแบบเอนเอียง ง่ายต่อการเข้าใจเมื่อคุณพิจารณาตัวอย่างความสูง หากมีข้อผิดพลาดในการวัดแบบสุ่มในตัวแปรผู้ชายบางคนจะถูกเขียนรหัสผิดเป็นเพศหญิงและในทางกลับกัน ผลของสิ่งนี้คือการลดความแตกต่างทางเพศที่เห็นได้ชัดในระดับสูงเพราะการย้ายผู้ชายไปยังกลุ่มผู้หญิงจะทำให้ค่าเฉลี่ยของผู้หญิงมีขนาดใหญ่ขึ้นในขณะที่การย้ายหญิงไปยังกลุ่มชายจะทำให้ค่าเฉลี่ยตัวเล็ก ด้วยข้อผิดพลาดการวัดในตัวแปรอิสระจะต่ำกว่าค่าที่ไม่เอนเอียงที่ 13 ซม.βGENDERβ

ในขณะที่ฉันใช้ตัวแปรอิสระอย่างเด็ดขาด ( ) เพื่อความเรียบง่ายที่นี่ตรรกะเดียวกันนี้ใช้กับตัวแปรต่อเนื่อง ตัวอย่างเช่นหากคุณใช้ตัวแปรต่อเนื่องเช่นความสูงของทารกเพื่อทำนายความสูงของผู้ใหญ่ค่าที่คาดหวังของจะเหมือนกันโดยไม่คำนึงถึงจำนวนข้อผิดพลาดแบบสุ่มในการวัดความสูงของผู้ใหญ่GENDERβ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.