มีหลายทางเลือกที่จะมีการถดถอยแบบขั้นตอน สิ่งที่ฉันเคยเห็นมากที่สุดคือ:
- ความคิดเห็นของผู้เชี่ยวชาญในการตัดสินใจว่าจะรวมตัวแปรใดในโมเดล
- บางส่วนน้อยถดถอยสี่เหลี่ยม คุณจะได้รับตัวแปรแฝงและทำการถดถอยกับพวกมัน คุณสามารถทำPCAด้วยตัวเองแล้วใช้ตัวแปรหลัก
- ตัวย่อการหดตัวและการเลือกน้อยที่สุด (LASSO)
ทั้งการถดถอย PLSและLASSOถูกนำไปใช้ในแพ็คเกจ R เช่น
PLS : http://cran.r-project.org/web/packages/pls/และ
LARS : http://cran.r-project.org/web/packages/lars/index.html
ถ้าคุณเพียงต้องการที่จะสำรวจความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ (เช่นคุณไม่จำเป็นต้องทดสอบนัยสำคัญทางสถิติ) ผมยังอยากจะแนะนำเครื่องเรียนรู้วิธีการเช่นป่าสุ่มหรือการจำแนกประเภทการถดถอย / ต้นไม้ ป่าสุ่มยังสามารถประมาณความสัมพันธ์ที่ไม่เป็นเชิงเส้นที่ซับซ้อนระหว่างตัวแปรตามและตัวแปรอิสระของคุณซึ่งอาจไม่ได้รับการเปิดเผยโดยเทคนิคเชิงเส้น (เช่นการถดถอยเชิงเส้น )
จุดเริ่มต้นที่ดีในการเรียนรู้ของเครื่องอาจเป็นมุมมองงานของ Machine Learning บน CRAN:
มุมมองงานการเรียนรู้ของเครื่อง : http://cran.r-project.org/web/views/MachineLearning.html