ฉันกำลังสร้างการถดถอยโลจิสติกใน R โดยใช้วิธี LASSO ด้วยฟังก์ชั่นcv.glmnet
สำหรับการเลือกlambda
และglmnet
สำหรับรุ่นสุดท้าย
ฉันรู้ข้อเสียทั้งหมดเกี่ยวกับการเลือกรุ่นอัตโนมัติแล้ว แต่ฉันต้องทำต่อไป
ปัญหาของฉันคือฉันต้องรวมตัวแปรปัจจัย (หมวดหมู่) ในแบบจำลองมีวิธีใดที่จะทำได้โดยไม่ต้องสร้างตัวแปรจำลองจำนวนมากหรือไม่ ตัวแปรนี้เกือบทุกสายและไม่ใช่ตัวเลข
2
ฉันอยากรู้วิธีที่ดีที่สุดที่จะไปเกี่ยวกับเรื่องนี้เช่นกัน
—
วิทยาศาสตร์ด้านป่าไม้