การถดถอยกำลังสองน้อยที่สุด (WLS) ไม่ใช่แบบจำลองที่แปลงแล้ว แต่จะเป็นเพียงการรักษาแต่ละสังเกตเป็นมากหรือน้อยให้ข้อมูลเกี่ยวกับความสัมพันธ์พื้นฐานระหว่างและY คะแนนเหล่านั้นที่ให้ข้อมูลมากกว่าจะได้รับ 'น้ำหนัก' มากขึ้นและที่มีข้อมูลน้อยจะได้รับน้ำหนักน้อยลง คุณมีสิทธิ์ที่การถดถอยอย่างน้อยกำลังสอง (WLS) ในทางเทคนิคจะใช้ได้เฉพาะในกรณีที่ทราบน้ำหนักก่อน XY
อย่างไรก็ตามการถดถอยเชิงเส้น (OLS) นั้นค่อนข้างแข็งแกร่งเมื่อเทียบกับ heteroscedasticity และดังนั้น WLS จึงเป็นเช่นนั้นหากการประมาณของคุณอยู่ใน ballpark กฎง่ายๆสำหรับการถดถอย OLS ก็คือมันไม่ได้รับผลกระทบจากความต่างกันมากเกินไปตราบใดที่ความแปรปรวนสูงสุดไม่เกิน 4 เท่าของความแปรปรวนขั้นต่ำ ตัวอย่างเช่นหากความแปรปรวนของส่วนที่เหลือ / ข้อผิดพลาดเพิ่มขึ้นด้วยดังนั้นคุณจะตกลงถ้าความแปรปรวนของส่วนที่เหลือที่ปลายสูงนั้นน้อยกว่าสี่เท่าของความแปรปรวนของส่วนที่เหลือที่ต่ำสุด ความหมายของสิ่งนี้คือถ้าน้ำหนักของคุณทำให้คุณอยู่ในช่วงนั้นคุณก็จะปลอดภัยพอสมควร มันเป็นรูปเกือกม้าและระเบิดมือXสถานการณ์. ดังนั้นคุณสามารถลองประมาณฟังก์ชั่นที่เกี่ยวข้องกับความแปรปรวนของส่วนที่เหลือกับระดับของตัวแปรตัวทำนายของคุณ
มีหลายประเด็นที่เกี่ยวข้องกับวิธีการประมาณเช่นนี้:
จำไว้ว่าน้ำหนักควรเป็นส่วนกลับของความแปรปรวน (หรืออะไรก็ตามที่คุณใช้)
หากข้อมูลของคุณเกิดขึ้นเฉพาะที่ระดับที่ไม่ต่อเนื่องเช่นในการทดสอบหรือ ANOVA คุณสามารถประเมินความแปรปรวนโดยตรงในแต่ละระดับของXและใช้ข้อมูลนั้น หากการประมาณการเป็นระดับที่ไม่ต่อเนื่องของตัวแปรต่อเนื่อง (เช่น 0 มก., 10 มก., 20 มก., ฯลฯ ) คุณอาจต้องการทำให้เรียบ แต่สิ่งเหล่านั้นอาจไม่สร้างความแตกต่างมากนัก XX
Xplot(model, which=2)
Xส่วนเบี่ยงเบนสัมบูรณ์เฉลี่ยจากค่ามัธยฐาน
XX
การรับน้ำหนักของคุณจากเศษซากของการถดถอย OLS นั้นสมเหตุสมผลเนื่องจาก OLS ไม่มีความเป็นกลางแม้ในภาวะที่มีความแตกต่าง อย่างไรก็ตามน้ำหนักเหล่านั้นอาจเกิดขึ้นกับรุ่นดั้งเดิมและอาจเปลี่ยนแปลงขนาดของ WLS รุ่นถัดไป ดังนั้นคุณควรตรวจสอบผลลัพธ์ของคุณโดยเปรียบเทียบเบตาที่ประเมินจากการถดถอยทั้งสอง หากพวกเขาคล้ายกันมากคุณก็โอเค หากค่าสัมประสิทธิ์ WLS แตกต่างจากค่า OLS คุณควรใช้การประเมิน WLS เพื่อคำนวณค่าเศษที่เหลือด้วยตนเอง (ค่าส่วนที่เหลือที่รายงานจากพอดีของ WLS จะคำนึงถึงน้ำหนัก) เมื่อคำนวณชุดสารตกค้างชุดใหม่ให้กำหนดน้ำหนักอีกครั้งและใช้น้ำหนักใหม่ในการถดถอย WLS ครั้งที่สอง กระบวนการนี้ควรทำซ้ำจนกว่าจะมีการวางเดิมพันโดยประมาณสองชุดที่มีความคล้ายคลึงกันอย่างเพียงพอ
หากกระบวนการนี้จะทำให้คุณค่อนข้างอึดอัดเพราะน้ำหนักอยู่ที่ประมาณและเพราะพวกเขามีความผูกพันกับก่อนหน้านี้รูปแบบที่ไม่ถูกต้องอีกทางเลือกหนึ่งคือการใช้ฮิวขาว 'แซนวิช' ประมาณการ สิ่งนี้มีความสอดคล้องแม้ในภาวะที่แตกต่างกันไม่ว่าจะรุนแรงเพียงใดและมันก็ไม่ได้เกิดขึ้นกับรุ่น นอกจากนี้ยังอาจรบกวนน้อยลง
ฉันแสดงให้เห็นถึงรูปแบบที่เรียบง่ายของสี่เหลี่ยมที่มีน้ำหนักน้อยที่สุดและการใช้แซนวิช SEs ในคำตอบของฉันที่นี่: ทางเลือกแทน ANOVA แบบทางเดียวสำหรับข้อมูลที่แตกต่างกัน