ควรให้เวกเตอร์ร้อนหนึ่งรายการถูกปรับอัตราส่วนด้วยคุณลักษณะตัวเลข


20

ในกรณีที่มีการรวมกันของคุณสมบัติการจัดหมวดหมู่และตัวเลขฉันมักจะแปลงแอตทริบิวต์การจัดหมวดหมู่เป็นเวกเตอร์ร้อนหนึ่งรายการ คำถามของฉันคือฉันจะปล่อยเวกเตอร์เหล่านั้นตามที่เป็นอยู่และปรับขนาดตัวเลขด้วยการกำหนดมาตรฐาน / การทำให้เป็นมาตรฐานหรือฉันควรจะปรับเวกเตอร์ร้อนหนึ่งอันพร้อมกับคุณลักษณะตัวเลขหรือไม่

คำตอบ:


11

เมื่อแปลงเป็นรูปแบบตัวเลขแล้วแบบจำลองจะไม่ตอบสนองต่อคอลัมน์ที่มีการเข้ารหัสแบบร้อนแรงแตกต่างจากที่ทำกับข้อมูลตัวเลขอื่น ๆ ดังนั้นจึงมีความชัดเจนก่อนหน้านี้ที่จะทำให้ปกติค่า {0,1} เป็นมาตรฐานหากคุณกำลังทำมันด้วยเหตุผลใด ๆ ในการเตรียมคอลัมน์อื่น ๆ

ผลของการทำเช่นนั้นจะขึ้นอยู่กับคลาสของโมเดลและประเภทของการทำให้เป็นมาตรฐานที่คุณใช้ แต่ฉันสังเกตเห็นการปรับปรุง (เล็ก) บางอย่างเมื่อปรับเป็น 0, std 1 สำหรับการจัดหมวดหมู่ข้อมูลที่เข้ารหัสร้อนเมื่อฝึกเครือข่ายประสาท

มันอาจสร้างความแตกต่างได้เช่นกันสำหรับคลาสของโมเดลตามตัวชี้วัดระยะทาง

น่าเสียดายที่เช่นเดียวกับตัวเลือกประเภทนี้ส่วนใหญ่คุณต้องลองทั้งสองวิธีและเลือกวิธีที่ดีที่สุด


1
ถ้อยคำไม่ชัดเจน คุณกำลังบอกว่าคุณจะทำให้คอลัมน์ที่มีการเข้ารหัสแบบร้อนแรงเพียงหนึ่งเดียวถ้าคุณทำให้คอลัมน์ที่ไม่ใช่คอลัมน์ปกติ
Info5ek

@ Info5ek: ฉันกำลังบอกว่ามันอาจจะดีกว่าที่จะทำให้ปกติหนึ่งคอลัมน์ที่เข้ารหัสร้อนและถ้าคุณทำมันสำหรับคอลัมน์อื่นแล้วคุณอาจลองใช้ ไม่มีกฎตายตัวสำหรับเรื่องนี้มากเกินไปขึ้นอยู่กับปัญหาในมือ
Neil Slater
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.