ดังนั้นฉันจึงถูกถามคำถามที่มาตรการกลาง L1 (เช่น Lasso) และ L2 (เช่นการถดถอยสัน) ประเมิน คำตอบคือ L1 = ค่ามัธยฐานและ L2 = ค่าเฉลี่ย มีเหตุผลแบบนี้หรือไม่? หรือว่าจะต้องมีการกำหนดทางพีชคณิต? ถ้าเป็นเช่นนั้นฉันจะทำยังไงต่อ
ดังนั้นฉันจึงถูกถามคำถามที่มาตรการกลาง L1 (เช่น Lasso) และ L2 (เช่นการถดถอยสัน) ประเมิน คำตอบคือ L1 = ค่ามัธยฐานและ L2 = ค่าเฉลี่ย มีเหตุผลแบบนี้หรือไม่? หรือว่าจะต้องมีการกำหนดทางพีชคณิต? ถ้าเป็นเช่นนั้นฉันจะทำยังไงต่อ
คำตอบ:
มีคำอธิบายทางเรขาคณิตอย่างง่าย ๆ ว่าเหตุใดฟังก์ชันการสูญเสีย L1 จึงให้ค่ามัธยฐาน
จำได้ว่าเรากำลังทำงานในมิติเดียวดังนั้นลองจินตนาการว่าจำนวนบรรทัดกระจายไปในแนวนอน เขียนจุดข้อมูลแต่ละจุดบนบรรทัดตัวเลข วางนิ้วของคุณที่ใดที่หนึ่งในบรรทัด; นิ้วของคุณจะเป็นค่าประมาณของผู้สมัครปัจจุบัน
สมมติว่าคุณเลื่อนนิ้วไปทางขวาเล็กน้อยพูดหน่วยไปทางขวา เกิดอะไรขึ้นกับการสูญเสียทั้งหมด? ถ้านิ้วของคุณอยู่ระหว่างจุดข้อมูลสองจุดและคุณเลื่อนข้ามจุดข้อมูลคุณจะเพิ่มการสูญเสียทั้งหมดโดยδสำหรับจุดข้อมูลแต่ละจุดทางด้านซ้ายของนิ้วของคุณและลดลงโดยδสำหรับแต่ละจุดข้อมูลไป ทางขวาของนิ้วของคุณ ดังนั้นหากมีจุดข้อมูลทางด้านขวาของนิ้วมากกว่าด้านซ้ายการเลื่อนนิ้วไปทางขวาจะเป็นการลดการสูญเสียทั้งหมด กล่าวอีกนัยหนึ่งถ้าจุดข้อมูลมากกว่าครึ่งอยู่ทางด้านขวาของนิ้วคุณควรเลื่อนนิ้วไปทางขวา
สิ่งนี้นำไปสู่การที่คุณเลื่อนนิ้วของคุณไปยังจุดที่จุดข้อมูลครึ่งหนึ่งอยู่บนจุดนั้นและอีกครึ่งอยู่ทางขวา จุดนั้นคือค่ามัธยฐาน
นั่นคือ L1 และค่ามัธยฐาน น่าเสียดายที่ฉันไม่มีคำอธิบายที่เหมือนกัน "ปรีชาญาณไม่มีพีชคณิต" ที่คล้ายกันสำหรับ L2 และค่าเฉลี่ย
คำอธิบายนี้เป็นผลรวมของความคิดเห็นของMuratoaและYvesเกี่ยวกับคำตอบของ DW แม้ว่าจะขึ้นอยู่กับแคลคูลัส แต่ฉันพบว่าตรงไปตรงมาและเข้าใจง่าย
สมมติว่าเราได้และต้องการได้ค่าประมาณβใหม่ขึ้นอยู่กับพวกเขา การสูญเสียที่น้อยที่สุดนั้นเกิดขึ้นเมื่อเราพบβซึ่งทำให้อนุพันธ์ของการสูญเสียเป็นศูนย์
∂L1
∂ L 2
การเพิ่มคำตอบของ DW ด้วยตัวอย่างที่เป็นประโยชน์ยิ่งขึ้น (สำหรับฟังก์ชัน L2 loss เช่นกัน):
ลองนึกภาพหมู่บ้านเล็ก ๆ ที่สร้างจากบ้าน 4 หลังใกล้กัน (เช่น 10 เมตร) ที่ 1 กิโลเมตรจากนั้นคุณมีบ้านที่แยกได้มาก ตอนนี้คุณมาถึงเมืองนั้นและต้องการสร้างบ้านของคุณเองที่ไหนสักแห่ง คุณต้องการที่จะอยู่ใกล้กับบ้านหลังอื่นและเป็นเพื่อนกับทุกคน พิจารณาทั้งสองสถานการณ์ทางเลือก:
คุณตัดสินใจที่จะอยู่ในตำแหน่งที่ระยะทางเฉลี่ยไปยังบ้านใด ๆ มีขนาดเล็กที่สุด (เช่นการลดฟังก์ชั่นการสูญเสีย L1)
ดังนั้นระยะทางเฉลี่ยต่ำสุด 100 เมตรจึงมาถึงได้โดยการสร้างบ้านในหมู่บ้าน โดยเฉพาะคุณจะสร้างบ้านกลางบ้านทั้ง 4 หลังเพื่อให้ได้ระยะทางเฉลี่ยไม่กี่เมตร และปรากฎว่าจุดนี้คือ " จุดมัธยฐาน " ซึ่งคุณจะได้รับโดยใช้สูตรค่ามัธยฐาน
ใช่มันเป็นเรื่องที่น่าสนใจที่จะสังเกตว่าบิตตอบโต้โดยสังเขปเมื่อเราลดผลรวมของระยะทางเราไม่ได้อยู่ใน "กลาง" ในแง่ของค่าเฉลี่ย แต่ในความหมายของ มัธยฐาน นี่เป็นส่วนหนึ่งของสาเหตุที่ OLS ซึ่งเป็นหนึ่งในโมเดลการถดถอยที่ได้รับความนิยมมากที่สุดใช้ข้อผิดพลาดกำลังสองแทนที่จะเป็นข้อผิดพลาดสัมบูรณ์
นอกจากคำตอบที่โพสต์แล้ว (ซึ่งเป็นประโยชน์กับฉันมาก!) มีคำอธิบายทางเรขาคณิตสำหรับการเชื่อมต่อระหว่างบรรทัดฐาน L2 และค่าเฉลี่ย
ในการใช้สัญลักษณ์เดียวกับchefwenสูตรสำหรับการสูญเสีย L2 คือ:
และการเอาสแควร์รูททั้งสองรักษาลำดับไว้
ตามที่เราคาดไว้