Quantile ถดถอยไม่ได้ทำให้สมมติฐานการกระจายคือสมมติฐานเกี่ยวกับส่วนที่เหลือนอกเหนือจากการสมมติว่าตัวแปรตอบสนองเกือบจะต่อเนื่อง หากคุณกำลังพูดถึงปัญหาของการประมาณควอนไทล์เดียวเป็นตัวทำนายฟังก์ชัน X สิ่งที่สำคัญที่สามารถผิดพลาดได้คือการผิดพลาดของตัวทำนายเชิงเส้นXβโดย underfitting คือความล้มเหลวในการรวมถึงผลกระทบที่ไม่เชิงเส้น (ปัญหาที่พบบ่อย) หรือผลกระทบปฏิสัมพันธ์ มีวิธีที่แนะนำอย่างน้อยสองวิธี ก่อนอื่นหากขนาดตัวอย่างของคุณใหญ่ให้พอดีกับโมเดลที่ยืดหยุ่นมากขึ้น การประนีประนอมที่ดีคือการอนุญาตให้ผลกระทบหลักทั้งหมดไม่เชิงเส้นโดยใช้เส้นโค้งการถดถอยเช่นเส้นโค้งลูกบาศก์แบบ จำกัด (เส้นโค้งธรรมชาติ) ดังนั้นจึงไม่มีสิ่งใดที่ต้องตรวจสอบยกเว้นการโต้ตอบ วิธีที่สองคือการหวังว่าแบบจำลองนั้นง่าย (ทำไม?) แต่อนุญาตให้มันมีความซับซ้อนจากนั้นประเมินผลกระทบของการเพิ่มที่ซับซ้อนในแบบจำลองอย่างง่าย ตัวอย่างเช่นเราสามารถประเมินผลงานร่วมของคำไม่เชิงเส้นหรือปฏิสัมพันธ์หรือทั้งสองอย่าง ตัวอย่างต่อไปนี้โดยใช้ R rms
และquantreg
แพคเกจ ใช้แบบฟอร์มการประนีประนอมเพื่อ จำกัด จำนวนพารามิเตอร์ การโต้ตอบนั้นถูก จำกัด ให้ไม่เป็นสองเท่าแบบไม่เชิงเส้น
require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f) # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)