ข้อมูลที่หายไปจะถูกจัดการได้อย่างไรเมื่อใช้ splines หรือ polynomials ที่เป็นเศษส่วน


12

ฉันกำลังอ่านการสร้างแบบจำลองหลายตัวแปร: แนวทางปฏิบัติในการวิเคราะห์การถดถอยโดยใช้พหุนามเศษส่วนสำหรับการสร้างแบบจำลองตัวแปรต่อเนื่องโดย Patrick Royston และ Willie Sauerbrei จนถึงตอนนี้ฉันประทับใจและเป็นวิธีที่น่าสนใจที่ฉันไม่เคยพิจารณามาก่อน

แต่ผู้เขียนไม่ได้จัดการกับข้อมูลที่ขาดหายไป แน่นอนใน p. พวกเขากล่าวว่าข้อมูลที่หายไป "นำเสนอปัญหาเพิ่มเติมมากมายไม่พิจารณาที่นี่"

การใส่หลายแบบทำงานกับพหุนามเศษส่วนหรือไม่

FP คือบางวิธี (แต่ไม่ใช่ทั้งหมด) ทางเลือกสำหรับ splines ง่ายต่อการจัดการกับข้อมูลที่ขาดหายไปสำหรับการถดถอยแบบอิสระหรือไม่


คุณจัดการกับ x ที่ขาดหายไปหรือ y ที่ขาดหายไปหรือทั้งสองอย่าง?
Glen_b -Reinstate Monica

2
+1 (!) ฉันดีใจมากที่เห็นคนอื่นถามคำถามที่คล้ายกัน เมื่อเร็ว ๆ นี้ฉันโพสต์คำถามนี้: stats.stackexchange.com/questions/295977/…เกี่ยวกับวิธีการใช้ลูกบาศก์ Splines แบบ จำกัด ในเมาส์ของ R ฉันเลือกใช้ splines โดยเฉพาะเนื่องจากไม่จำเป็นต้องระบุพหุนามแบบเศษส่วนในขณะที่ splines นั้นมีความยืดหยุ่นเพียงพอสำหรับรูปแบบการใช้งานจำนวนมาก ฉันไม่ทราบว่าสิ่งนี้จะตอบคำถามของคุณได้หรือไม่
IWS

2
นี่เป็นคำถามที่น่าสนใจเปิดขึ้น (เป็นมิติเดียวของคำตอบที่เป็นไปได้) ความเป็นไปได้ของการวิพากษ์วิจารณ์เทคนิคการปรับให้เรียบ / การแก้ไขหลายอย่างโดยการเปรียบเทียบความสามารถในการรองรับข้อมูลที่หายไป (ในระดับหนึ่งความเปราะบางต่อความหายไปเป็น 'ความลำบากใจ' ต่อวิธีการที่ทันสมัย) ฉันทราบเฉพาะในการผ่านจุดที่ชัดเจนว่าการดำเนินการแบบเบย์จะทำให้คุณใส่ความ 'ฟรี'
David C. Norris

2
@ DavidC.Norris ความคิดเห็นของคุณ intriques me! คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับวิธีการของ Bayesian ที่หายไป 'ฟรี' (ซึ่งฉันคิดว่าคุณได้รับการจัดการโดยวิธีการวิเคราะห์อย่างเหมาะสม 'อัตโนมัติ' และเป็นค่าเริ่มต้น) หรือไม่ (หรือชี้ให้ฉันอ้างอิง)
IWS

2
ส่วนที่ไม่มีอาหารกลางวันของ "ฟรี" ที่นี่คือคุณต้องเขียนแบบจำลองแบบเบย์ซึ่งหมายถึงการคิดอย่างชัดเจนเกี่ยวกับกระบวนการสร้างข้อมูล ( DGP ) เมื่อคุณทำเช่นนั้นแล้วคุณจะถือว่าค่าที่หายไปเป็นพารามิเตอร์ [รบกวน] (ใน Bayesian "ทุกอย่างเป็นพารามิเตอร์" ดูเพิ่มเติมที่ตัวแปรแฝง ) MCMC ของคุณจะใช้ประโยชน์จาก DGP ที่คุณระบุไว้เพื่อ 'ใส่ร้าย' ค่าที่หายไป "ฟรี" ในขณะที่มันสับตาม
David C. Norris

คำตอบ:


1

การใส่หลายแบบสามารถใช้ได้กับพหุนามเศษส่วนและเส้นโค้ง สมมติว่าแสดงถึงรูปแบบการทำงานของคุณ (เช่น ) ให้เป็นฟังก์ชั่นโดยประมาณในแต่ละตัวอย่างสังเคราะห์แล้วการทำงานของคุณคือ(x)f ( x ) = x + x .5 f m ( ) M 1f(x)f(x)=x+x.5fm()M1MmMfm(x)

สมมติว่าซอฟต์แวร์ที่คุณใช้สามารถให้การประเมินข้อผิดพลาดมาตรฐานสำหรับทุกค่าที่ไม่ซ้ำกันของ x คุณสามารถใช้รูบิน (การใส่หลายครั้งสำหรับ nonresponse ในแบบสำรวจ; 1987) สูตรสำหรับการคำนวณข้อผิดพลาดมาตรฐาน มีสูตรตัวอย่างขนาดเล็กและใหญ่สำหรับองศาอิสระที่มีการใส่ความหลากหลาย สูตรตัวอย่างขนาดใหญ่ (เช่นเดียวกับรูบิน) ใช้เพียงอินพุตเดียวกับข้อผิดพลาดมาตรฐานดังนั้นจึงสามารถใช้งานได้ กรณีตัวอย่างขนาดเล็กใช้องศาอิสระของโมเดลเป็นอินพุต ไม่ชัดเจนสำหรับฉันถ้าสูตรนี้สามารถใช้ได้ที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.