จะเข้าใจ“ ไม่เชิงเส้น” เช่นเดียวกับ“ การลดขนาดแบบไม่เชิงเส้น” ได้อย่างไร?


24

ฉันพยายามเข้าใจความแตกต่างระหว่างวิธีการลดขนาดเชิงเส้น (เช่น PCA) และวิธีไม่เชิงเส้น (เช่น Isomap)

ฉันไม่สามารถเข้าใจสิ่งที่เป็นเส้นตรง (ไม่ใช่) ความหมายในบริบทนี้ ฉันอ่านจากWikipediaว่า

จากการเปรียบเทียบหาก PCA (อัลกอริทึมการลดขนาดเชิงเส้น) ใช้เพื่อลดชุดข้อมูลเดียวกันนี้เป็นสองมิติค่าผลลัพธ์จะไม่ได้รับการจัดระเบียบอย่างดี นี่แสดงให้เห็นว่าเวกเตอร์มิติสูง (แต่ละอันแสดงถึงตัวอักษร 'A') ที่ตัวอย่างหลากหลายนี้มีความหลากหลายในลักษณะที่ไม่เป็นเชิงเส้น

อะไรนะ

เวกเตอร์มิติสูง (แต่ละอันแทนตัวอักษร 'A') ที่ตัวอย่างนี้มีความหลากหลายในลักษณะที่ไม่เป็นเชิงเส้น

หมายความว่าอย่างไร หรือกว้างกว่าฉันจะเข้าใจความเป็นเส้นตรง (ไม่) ในบริบทนี้ได้อย่างไร

คำตอบ:


20

การลดขนาดหมายความว่าคุณแมปเวกเตอร์หลายมิติแต่ละตัวเป็นเวกเตอร์มิติต่ำ กล่าวอีกนัยหนึ่งคุณแทน (แทนที่) เวกเตอร์หลายมิติแต่ละอันด้วยเวกเตอร์มิติต่ำ

การลดขนาดเชิงเส้นหมายความว่าส่วนประกอบของเวกเตอร์มิติต่ำนั้นได้รับจากฟังก์ชันเชิงเส้นของส่วนประกอบของเวกเตอร์มิติสูงที่สอดคล้องกัน ตัวอย่างเช่นในกรณีของการลดลงถึงสองมิติเรามี:

[x1, x2, ..., xn] ->  [f1(x1, x2, ..., xn), f2(x1, x2, ..., xn)]

ถ้าf1และf2เป็นฟังก์ชันเชิงเส้น (ไม่ใช่) เรามีการลดขนาดเชิงเส้น (ไม่ใช่) เชิงเส้น


3
(ax+)=a(x)+W1x1++Wnxn

1
ผม=ผม(x1,...,xn)=(ผม)+ω1(ผม)x1+...ωn(ผม)xnผมxผมคือองค์ประกอบของเวกเตอร์ที่มีมิติต่ำและสูงตามลำดับ (และฉันคิดว่าไม่ใช่สิ่งที่คุณหมายถึง) ฉันคิดว่าปัญหาไม่ได้อยู่ในความเข้าใจว่าฟังก์ชั่นเชิงเส้นคืออะไร แต่ในที่ที่ลิเนียริตี้ปรากฏขึ้น
Roman

49

ภาพที่มีค่าพันคำ:

PCA กับ Isomap

ที่นี่เรากำลังมองหาโครงสร้าง 1 มิติใน 2D จุดนั้นอยู่ในแนวโค้งรูปตัว S PCA พยายามอธิบายข้อมูลด้วยmanifold เชิงเส้น 1 มิติซึ่งเป็นเพียงเส้นตรง แน่นอนว่าสายตรงกับข้อมูลเหล่านี้ค่อนข้างแย่ Isomap กำลังมองหาไม่เชิงเส้น (คือโค้ง!) 1 มิติหลากหลายและควรจะสามารถค้นพบเส้นโค้งรูปตัว S พื้นฐาน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.