ฉันได้เห็นเอกสารจำนวนมากเกี่ยวกับการนำเสนอที่กระจัดกระจายเมื่อเร็ว ๆ นี้และส่วนใหญ่ใช้บรรทัดฐานและทำการย่อเล็กสุด คำถามของฉันคืออะไรบรรทัดฐานและบรรทัดฐานแบบผสมคืออะไร และเกี่ยวข้องกับการทำให้เป็นมาตรฐานได้อย่างไรℓ p ℓ p , q
ขอบคุณ
ฉันได้เห็นเอกสารจำนวนมากเกี่ยวกับการนำเสนอที่กระจัดกระจายเมื่อเร็ว ๆ นี้และส่วนใหญ่ใช้บรรทัดฐานและทำการย่อเล็กสุด คำถามของฉันคืออะไรบรรทัดฐานและบรรทัดฐานแบบผสมคืออะไร และเกี่ยวข้องกับการทำให้เป็นมาตรฐานได้อย่างไรℓ p ℓ p , q
ขอบคุณ
คำตอบ:
norms เป็นฟังก์ชั่นที่รับเวกเตอร์และส่งคืนตัวเลขที่ไม่ใช่ค่าลบ พวกมันถูกนิยามเป็นในกรณีที่p = 2นี่คือ เรียกว่าบรรทัดฐานแบบยุคลิด คุณสามารถกำหนดระยะทางยุคลิดเป็น\ | \ vec x - \ vec Y เมื่อp = \ inftyนี่หมายถึง\ | \ vec x \ | _ \ infty = \ sup_i x_i (หรือ\ max_i x_i ) พูดอย่างเคร่งครัดพีจะต้องเป็นที่หนึ่งอย่างน้อยสำหรับ\ | \ vec x \ | _Pจะเป็นบรรทัดฐาน ถ้า0 <p <1ดังนั้น\ | \ vec x \ | _p p = 2
(นอกจากนี้ยังมีบรรทัดฐานซึ่งมีการกำหนดไว้อย่างแน่นอนยกเว้นฟังก์ชั่นแทนเวกเตอร์หรือลำดับ - จริงๆนี่คือสิ่งเดียวกันเนื่องจากเวกเตอร์เป็นฟังก์ชั่นที่มีโดเมน จำกัด )
ฉันไม่ได้ตระหนักถึงการใช้ใด ๆ สำหรับบรรทัดฐานในการประยุกต์ใช้การเรียนรู้เครื่องที่นอกจากที่\ โดยปกติแล้วคุณจะเห็นหรือหรือบางครั้งที่คุณต้องการผ่อนคลายกรณี; ไม่เคร่งครัดนูนแต่คือสำหรับ<\ ซึ่งจะทำให้การค้นหาโซลูชัน "ง่ายขึ้น" ในบางกรณีp = ∞ p = 2 p = 1 1 < p < 2 p = 1 ‖ → x ‖ 1 → x ‖ → x ‖ p 1 < p < ∞
ในบริบทของการทำให้เป็นปกติถ้าคุณเพิ่มในฟังก์ชันวัตถุประสงค์ของคุณสิ่งที่คุณพูดคือคุณคาดว่าจะกระจัดกระจายนั่นคือส่วนใหญ่ประกอบด้วยศูนย์ มันเป็นเรื่องทางเทคนิคเล็กน้อย แต่โดยทั่วไปถ้ามีวิธีแก้ปัญหาหนาแน่นก็น่าจะมีวิธีแก้ปัญหาแบบแยกคำด้วยบรรทัดฐานเดียวกัน หากคุณคาดหวังว่าโซลูชันของคุณจะมีความหนาแน่นสูงคุณสามารถเพิ่ม เข้ากับวัตถุประสงค์ของคุณเพราะจากนั้นจะทำงานกับอนุพันธ์ได้ง่ายขึ้น ทั้งสองมีจุดประสงค์ในการป้องกันไม่ให้น้ำหนักมากเกินไป ‖ → x ‖ 2 2
บรรทัดฐานแบบผสมเกิดขึ้นเมื่อคุณพยายามรวมหลายแหล่ง โดยทั่วไปคุณต้องการให้เวกเตอร์โซลูชันประกอบด้วยหลายส่วนโดยที่คือดัชนีของแหล่งข้อมูลบางแหล่ง บรรทัดฐานเป็นเพียง -norm ของทุก -norms เก็บในเวกเตอร์ กล่าวคือjℓp,qqp‖ → x ‖p,q=( m ∑ j = 1 ( d ∑ i = 1 | x j i | p ) q / p)1/q
วัตถุประสงค์ของการนี้คือไม่ให้ "oversparsify" ชุดของการแก้ปัญหาพูดโดยใช้{1,2} ชิ้นส่วนแต่ละชิ้นจะกระจัดกระจาย แต่คุณไม่เสี่ยงที่จะทำเวกเตอร์โซลูชันทั้งหมดโดยใช้ -norm ของโซลูชันทั้งหมด ดังนั้นคุณจึงใช้ -norm ด้านนอกแทน 1 2
หวังว่าจะช่วย
ดูกระดาษนี้สำหรับรายละเอียดเพิ่มเติม