ทำไมการแปลงพลังงานหรือบันทึกจึงไม่ได้สอนในเรื่องการเรียนรู้ของเครื่อง


24

การเรียนรู้ของเครื่อง (ML) ใช้เทคนิคการถดถอยเชิงเส้นและโลจิสติกอย่างหนัก นอกจากนี้ยังต้องอาศัยเทคนิคคุณลักษณะวิศวกรรม ( feature transform, kernelฯลฯ )

ทำไมจึงไม่มีอะไรที่เกี่ยวกับvariable transformation(เช่นpower transformation) กล่าวถึงใน ML? (ตัวอย่างเช่นฉันไม่เคยได้ยินเกี่ยวกับการรูทหรือบันทึกไปยังฟีเจอร์พวกเขามักใช้พหุนามหรือ RBFs) เช่นเดียวกันทำไมผู้เชี่ยวชาญ ML ไม่สนใจการเปลี่ยนคุณสมบัติสำหรับตัวแปรตาม (ตัวอย่างเช่นฉันไม่เคยได้ยินเกี่ยวกับการเปลี่ยนแปลงการบันทึกของ y พวกเขาเพียงแค่ไม่แปลง y)

การแก้ไข: อาจเป็นคำถามที่ไม่แน่นอนคำถามของฉันคือ "การแปลงพลังงานเป็นตัวแปรที่ไม่สำคัญใน ML หรือไม่"


4
ฉันต้องการทราบว่าทำไมสิ่งนี้จึงถูกลดระดับลง จริงๆแล้วมันเป็นคำถามที่น่าสนใจ
shadowtalker

1
ฉันคิดว่าคนส่วนใหญ่จะใช้หลักสูตรการถดถอยเชิงเส้นก่อนหลักสูตร ML แรกของพวกเขา แน่นอนหุ้น LR จะมีบทหนึ่งเกี่ยวกับสิ่งเหล่านี้ (การเปลี่ยนแปลง) Btw ฉันไม่ได้ลงคะแนนคำถาม
user603

คำตอบ:


12

หนังสือทำนายการสร้างแบบจำลองประยุกต์โดยคุห์นและจอห์นสันเป็นหนังสือการเรียนรู้ที่ได้รับการยอมรับอย่างสูงในภาคปฏิบัติโดยมีส่วนใหญ่เกี่ยวกับการเปลี่ยนแปลงของตัวแปรรวมถึง Box-Cox ผู้เขียนอ้างว่าอัลกอริทึมการเรียนรู้ของเครื่องจำนวนมากทำงานได้ดีขึ้นหากคุณลักษณะนั้นมีการแจกแจงแบบสมมาตรและแบบ unimodal การเปลี่ยนคุณสมบัติเช่นนี้เป็นส่วนสำคัญของ "คุณสมบัติวิศวกรรม"


8

จากมุมมองของตัวเองบ่อยครั้งที่ฉันสนใจในการกระจายการทำนายของตัวแปรตอบสนองไม่ใช่แค่ค่าเฉลี่ยที่มีเงื่อนไขและในกรณีนั้นมันจะดีกว่าถ้าใช้โอกาสที่แสดงการกระจายเป้าหมายได้อย่างถูกต้อง ตัวอย่างเช่นฉันต้องการใช้แบบจำลองเชิงเส้นเคอร์เนลมากกว่า (พูด) สนับสนุนการถดถอยเวกเตอร์เพราะฉันสามารถใช้โอกาสปัวซองถ้าฉันต้องการ เนื่องจากผู้คนเรียนรู้ด้วยเครื่องจักรจำนวนมากเป็นชาวเบย์ฉันคิดว่าการใช้โอกาสต่าง ๆ จะดูดีกว่าการเปลี่ยนแปลง (การเลือกโอกาสที่เหมาะสมมักเป็นขั้นตอนแรก)


0

นี่คือความคิดของฉันในภายหลัง

ฉันคิดว่าเป็นเพราะ ML ส่วนใหญ่เกี่ยวข้องกับการจำแนกประเภทและการจัดหมวดหมู่ไม่จำเป็นต้องเปลี่ยน y (y เป็นหมวดหมู่) ML มักจะจัดการกับตัวแปรอิสระขนาดใหญ่ (เช่นหลายพันใน NLP) และการถดถอยโลจิสติกไม่จำเป็นต้องมีมาตรฐาน ฉันคิดว่านั่นเป็นเหตุผลที่พวกเขาไม่ใช้การแปลงพลังงาน Box-Cox เนื่องจากการพิจารณาความเร็ว (หมายเหตุ: ฉันไม่คุ้นเคยกับการเปลี่ยนแปลงพลังงาน)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.