ฉันไม่มีตัวอย่างหรืองานเฉพาะในใจ ฉันเพิ่งใหม่ในการใช้ b-splines และฉันต้องการทำความเข้าใจกับฟังก์ชันนี้ในบริบทการถดถอย
สมมติว่าเราต้องการที่จะประเมินความสัมพันธ์ระหว่างตัวแปรตอบสนองและพยากรณ์บางx 1 , x 2 , . . , xพี ตัวทำนายประกอบด้วยตัวแปรตัวเลขบางตัวและตัวแปรบางตัว
สมมติว่าหลังจากปรับโมเดลการถดถอยแล้วหนึ่งในตัวแปรตัวเลขเช่นนั้นมีความสำคัญ ตรรกะขั้นตอนหลังจากนั้นคือการประเมินว่าคำสั่งชื่อพหุนามที่สูงขึ้นเช่น: x 2 1และx 3 1จะต้องอธิบายความสัมพันธ์อย่างเพียงพอโดยไม่ต้อง overfitting
คำถามของฉันคือ:
คุณเลือกจุดไหนระหว่าง b-splines หรือพหุนามคำสั่งที่สูงขึ้นอย่างง่าย เช่นใน R:
y ~ poly(x1,3) + x2 + x3
VS
y ~ bs(x1,3) + x2 + x3
คุณจะใช้พล็อตเพื่อแจ้งการเลือกระหว่างสองสิ่งนี้กับสิ่งที่เกิดขึ้นได้อย่างไรหากไม่ชัดเจนจากพล็อต (เช่น: เนื่องจากจุดข้อมูลจำนวนมาก)
คุณจะประเมินเงื่อนไขการโต้ตอบแบบสองทางระหว่างและสมมุติว่าx 3
การเปลี่ยนแปลงด้านบนสำหรับรุ่นที่แตกต่างกันอย่างไร
คุณจะพิจารณาที่จะไม่ใช้ชื่อพหุนามที่มีลำดับสูงและปรับ b-splines และลงโทษความยืดหยุ่นสูงเสมอหรือไม่
mgcv
ทำไมไม่ใช้โมเดลเสริมทั่วไป การเลือกความนุ่มนวลเป็นไปโดยอัตโนมัติและวิธีการอนุมานนั้นได้รับการพัฒนาอย่างดี