ใส่เพียงเพราะคุณสมบัติหมวดหมู่ของคุณหนึ่งระดับ (ที่นี่) กลายเป็นกลุ่มอ้างอิงในระหว่างการเข้ารหัสแบบจำลองสำหรับการถดถอยและซ้ำซ้อน ฉันอ้างถึงแบบฟอร์มที่นี่ "ตัวแปรเด็ดขาดของหมวดหมู่ K หรือระดับมักจะเข้าสู่การถดถอยเป็นลำดับของตัวแปรจำลอง K-1 จำนวนนี้เป็นสมมติฐานเชิงเส้นตรงในระดับความหมาย"
นี้จะกล่าวถึงอยู่แล้วที่นี้ดีมากคำตอบ stats.stackexchange
ผมก็บอกว่ามีเป็นหลักสูตรขั้นสูงโดย Yandex ใน Coursera ที่ครอบคลุมเรื่องนี้ในรายละเอียดมากขึ้นถ้าคุณยังคงมีข้อสงสัยโปรดดูที่นี่ หมายเหตุคุณสามารถตรวจสอบเนื้อหาของหลักสูตรได้ฟรีตลอดเวลา ;-)
อีกโพสต์ดีถ้าคุณต้องการคำอธิบายอย่างละเอียดที่มีจำนวนมากตัวอย่างที่มีมุมมองทางสถิติและไม่ได้ถูก จำกัด เพียงหุ่นเข้ารหัสดูนี้จากยูซีแอล (ใน R)
โปรดทราบว่าหากคุณใช้pandas.get_dummies
มีพารามิเตอร์คือdrop_first
เพื่อให้ได้รับหุ่น k-1 ออกจากระดับเด็ดขาด k โดยการลบระดับแรก โปรดทราบdefault = False
ว่าหมายถึงการอ้างอิงจะไม่ลดลงและ k หุ่นที่สร้างขึ้นจาก k เด็ดขาดระดับ!