อธิบายขั้นตอนของอัลกอริธึม LLE (การฝังเชิงเส้นในพื้นที่) ไหม


13

ฉันเข้าใจหลักการพื้นฐานที่อยู่เบื้องหลังอัลกอริทึมสำหรับ LLE ประกอบด้วยสามขั้นตอน

  1. การค้นหาย่านที่คุ้นเคยของแต่ละจุดข้อมูลด้วยตัวชี้วัดบางอย่างเช่น k-nn
  2. ค้นหาน้ำหนักสำหรับแต่ละเพื่อนบ้านซึ่งแสดงถึงผลกระทบที่เพื่อนบ้านมีต่อจุดข้อมูล
  3. สร้างการฝังข้อมูลในระดับต่ำตามน้ำหนักที่คำนวณ

แต่คำอธิบายทางคณิตศาสตร์ของขั้นตอนที่ 2 และ 3 นั้นสร้างความสับสนในหนังสือเรียนและแหล่งข้อมูลออนไลน์ทั้งหมดที่ฉันได้อ่าน ฉันไม่สามารถให้เหตุผลว่าทำไมจึงใช้สูตรนี้

ขั้นตอนเหล่านี้มีการปฏิบัติอย่างไรในทางปฏิบัติ มีวิธีที่เข้าใจง่าย ๆ ในการอธิบายสูตรทางคณิตศาสตร์ที่ใช้หรือไม่?

ข้อมูลอ้างอิง: http://www.cs.nyu.edu/~roweis/lle/publications.html

คำตอบ:


10

Local linear embedding (LLE) ช่วยลดความจำเป็นในการประมาณระยะทางระหว่างวัตถุที่อยู่ห่างไกลและกู้คืนโครงสร้างที่ไม่ใช่เชิงเส้นทั่วโลก LLE มีประโยชน์เนื่องจากไม่มีพารามิเตอร์เช่นอัตราการเรียนรู้หรือเกณฑ์การลู่เข้า LLE ยังเครื่องชั่งน้ำหนักได้ดีกับมิติที่แท้จริงของ{Y} ฟังก์ชันวัตถุประสงค์สำหรับ LLE คือ start Weight matrixองค์ประกอบสำหรับวัตถุและถูกตั้งค่าเป็นศูนย์ถ้าY

ζ(Y)=(YWY)2=Y(IW)(IW)Y
Wwijijjไม่ใช่เพื่อนบ้านที่ใกล้ที่สุดของไม่เช่นนั้นน้ำหนักของเพื่อนบ้านที่ใกล้ที่สุดของ K-จะถูกกำหนดผ่านรูปสี่เหลี่ยมจัตุรัสที่น้อยที่สุดของ โดยที่ตัวแปรตามเป็นเวกเตอร์ของคนเป็นเมทริกซ์แกรมสำหรับเพื่อนบ้านที่ใกล้ที่สุดทั้งหมดของวัตถุและเป็นเวกเตอร์ของน้ำหนักที่เป็นไปตามข้อ จำกัด แบบรวมถึงความสามัคคี ปล่อยให้เป็นสมการเชิงบวก semidefiniteii
U=Gβ
UK×1GK×KiβK×1DK×Kเมทริกซ์ระยะทางสำหรับทุกคู่ของเพื่อนบ้าน K-ที่ใกล้ที่สุดของวัตถุมิติ\มันสามารถแสดงให้เห็นว่าเท่ากับเมทริกซ์ระยะทางที่กึ่งกลางด้วยองค์ประกอบ ค่าสัมประสิทธิ์การถดถอยถูกกำหนดตัวเลขโดยใช้ pxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
K
βK×1=(ττ)K×K1τUK×1,
และมีการตรวจสอบเพื่อยืนยันว่าพวกเขารวมเป็นเอกภาพ ค่าของจะถูกฝังลงในแถวของที่ตำแหน่งคอลัมน์ต่าง ๆ ที่สอดคล้องกับเค - เพื่อนบ้านที่ใกล้ที่สุดของออบเจ็กต์ , เช่นเดียวกับองค์ประกอบทรานสโพส สิ่งนี้ถูกทำซ้ำสำหรับแต่ละวัตถุที่ในชุดข้อมูล มันรับประกันว่าหากจำนวนเพื่อนบ้านที่ใกล้ที่สุดต่ำเกินไปอาจทำให้เบาบางทำให้ eigenanalysis กลายเป็นเรื่องยาก พบว่าเพื่อนบ้านที่ใกล้ที่สุดส่งผลให้βiWiiKWK=9Wเมทริกซ์ที่ไม่ได้มีพยาธิสภาพในระหว่างการกระตุ้นด้วยไฟฟ้า ฟังก์ชั่นวัตถุประสงค์จะลดลงโดยการหาค่าลักษณะเฉพาะที่ไม่ใช่ศูนย์ที่เล็กที่สุดของ รูปแบบที่ลดลงของแสดงโดยโดยที่มีมิติตามค่า eigenvalues ​​ที่น้อยที่สุดของแลมบ์ดา}
(IW)(IW)E=ΛDE.
XY=EEn×2Λ


"K = 9 เพื่อนบ้านที่ใกล้ที่สุด" สิ่งนี้ไม่ได้ขึ้นอยู่กับมิติของใช่หรือไม่ ตัวอย่างเช่นถ้ามีน้อยกว่า 9 มิติดังนั้นเมทริกซ์น้ำหนักจะไม่ถูกกำหนดโดยเฉพาะ สิ่งนี้ทำให้เกิดปัญหากับ LLE หรือไม่ YYW
สกอตต์

ใช่ แต่ถ้ามีให้บอกว่า 8 มิติสำหรับข้อมูลสุ่มอย่างแท้จริงทุกจุดสามารถเขียนได้อย่างสมบูรณ์แบบด้วยการรวมกันเชิงเส้นของอีก 9 คนในหลายวิธี
สกอตต์

มีสถานการณ์แบบ "เกิดอะไรขึ้นถ้า" เสมอเมื่อใช้เทคนิคและนั่นเป็นเหตุผลที่ใช้พารามิเตอร์ข้อ จำกัด
wrktsj
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.