แบบจำลองการถดถอยที่มีความแปรปรวนไม่เท่ากัน


22

ฉันต้องการให้พอดีกับโมเดลเชิงเส้น (lm) ซึ่งความแปรปรวนของค่าคงที่นั้นขึ้นอยู่กับตัวแปรอธิบายอย่างชัดเจน

วิธีที่ฉันรู้ว่าการทำเช่นนี้คือการใช้ GLM กับครอบครัวแกมมาในการจำลองความแปรปรวนและแล้วใส่ลงไปในสิ่งที่ตรงกันข้ามน้ำหนักในการทำงาน LM (ตัวอย่าง: http://nitro.biosci.arizona.edu/r/chapter31 .pdf )

ฉันสงสัยว่า:

  • นี่เป็นเทคนิคเดียวหรือไม่
  • วิธีการอื่นใดที่เกี่ยวข้อง?
  • แพ็คเกจ / ฟังก์ชัน R ใดที่เกี่ยวข้องกับการสร้างแบบจำลองนี้? (อื่น ๆ แล้ว glm, lm)

4
ทำที่พวกเขาใช้glm()แล้วlm()ในบทที่คุณเชื่อมโยงไป ดูเหมือนว่าฉันglm()เป็นสิ่งที่จำเป็นและใช้ที่นั่น แต่ฉันอาจจะพลาดบางสิ่งบางอย่าง คุณสามารถลองทั่วไปกำลังสองน้อยที่สุด ( gls()ในnlme ) ซึ่งจะช่วยให้น้ำหนักที่จะคาดว่าจะควบคุมสำหรับประเภทของ heteroscedasticity ที่คุณพูดถึง; ดู?varFuncและติดตามลิงก์จากที่นั่น IIRC varFixed()จะทำสิ่งที่คุณต้องการ
Reinstate Monica - G. Simpson

ใน 'proc Mixed', 'subject = option' จะสร้างโครงสร้างบล็อกแนวทแยงในเมทริกซ์ความแปรปรวนร่วมและความแปรปรวนร่วมของส่วนที่เหลือ คุณได้พิจารณาแบบจำลองเชิงเส้นผสมแบบทั่วไปเพื่อปรับเปลี่ยนสมมติฐานความเป็นเนื้อเดียวกันหรือไม่?
ocram

ขอบคุณ Gavin ฉันดูที่ฟังก์ชันเหล่านี้เล็กน้อย สองคำถาม: 1) คุณแนะนำบทเรียนใด ๆ ? (ฉันสงสัยว่า MASS หนังสือของฉันเป็นการเริ่มต้นที่ดี แต่สงสัยว่าคุณมีความคิดอยู่หรือไม่) 2) เนื่องจากตัวแบบที่ฉันเหมาะสมเป็น OLS แบบง่ายการประมาณจะแตกต่างกันอย่างไรเมื่อใช้ฟังก์ชัน gls (ถ้าฉันจำอย่างถูกต้อง - ไม่มากเพราะมันควรจะทำงานในการประมาณองศาแรกซ้ำแล้วซ้ำอีก แต่ฉันไม่แน่ใจเกี่ยวกับเรื่องนี้เลย) Ocram - ขอบคุณ แต่ฉันไม่ได้ใช้ SAS
Tal Galili

ที่นี่ในส่วนที่ 2 ก็จะมีการอธิบายวิธีการทำเช่นนี้ในเดินทางเข้ามายังสำหรับถดถอย quasipoisson: stata.com/meeting/fnasug08/gutierrez.pdf หากใครบางคนสามารถแนะนำวิธีการบันทึกสิ่งนี้ใน R ฉันจะขอบคุณมาก
a11msp

คำตอบ:


17

ยาต่อต้าน "ผลโทรโข่ง" รวมถึง (ในหมู่อื่น ๆ ):

  1. ใช้บันทึกหรือการแปลงรากที่สอง Y
  2. ใช้ถ่วงน้ำหนักตารางถดถอยน้อย ในวิธีการนี้การสังเกตแต่ละครั้งจะได้รับปัจจัยความแปรปรวนของตัวเอง คำตอบนี้แสดงวิธีการใช้ WLSR ใน R (ตัวอย่างเช่นหากความแปรปรวนของส่วนที่เหลือเป็นสัดส่วนกับค่าเฉลี่ยคุณสามารถระบุน้ำหนักของค่าผกผันของค่าติดตั้งในโมเดลที่ไม่ถ่วงน้ำหนัก)
  3. ใช้การถดถอยที่แข็งแกร่ง funciton rlm()ในMASSแพ็คเกจของ R ทำการประมาณค่า M ซึ่งควรจะมีความทนทานต่อความไม่เท่ากันของความแปรปรวน

แก้ไข 2017 กรกฎาคม:ดูเหมือนว่ากำลังสองน้อยที่สุดตามคำแนะนำในคำตอบของ Greg Snow เป็นหนึ่งในตัวเลือกที่ดีที่สุด


2
ฉันสร้างในคำตอบนี้สำหรับคำถามกองมากเกิน
ปีเตอร์เอลลิส

1
อาจคุ้มค่าที่จะชี้ให้เห็นตัวเลือกกำลังสองน้อยที่สุดทั่วไปเช่นกันโดยใช้ gls พร้อมตัวเลือกตุ้มน้ำหนักที่ตั้งค่าเป็น varFixed () - สำหรับฉันนี่ดูเหมือนจะเป็นหนึ่งในตัวเลือกที่หรูหรากว่า ...
Tom Wenseleers

@TomWenseleers ฉันเห็นด้วย ขอให้สังเกตว่านี่เป็นคำตอบของ Greg Snow
gui11aume

9

ด้วยแพ็คเกจgamlssคุณสามารถสร้างแบบจำลองการแจกแจงข้อผิดพลาดของการตอบสนองเป็นแบบเส้นตรงแบบไม่เชิงเส้นหรือฟังก์ชันที่ราบรื่นของตัวแปรอธิบาย นี่ดูเหมือนจะเป็นวิธีที่มีประสิทธิภาพมาก (ฉันได้เรียนรู้มากมายเกี่ยวกับความเป็นไปได้ทั้งหมดที่อาจเกิดขึ้นในระหว่างกระบวนการคัดเลือกรุ่น) และทุกอย่างได้รับการอธิบายอย่างดีในสิ่งพิมพ์หลายเล่ม (รวมถึงหนังสือ) ที่อ้างถึงที่ลิงก์ด้านบน


8

glsฟังก์ชั่นในnlmeแพคเกจสำหรับ R สามารถประมาณการถดถอยและความสัมพันธ์กับความแปรปรวนในเวลาเดียวกัน ดูweightsอาร์กิวเมนต์และตัวอย่างที่ 2 ในหน้าช่วยเหลือ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.