ลิเนียริตี้ของ PCA


35

PCA ถือเป็นกระบวนการเชิงเส้นอย่างไรก็ตาม:

PCA(X)PCA(X1)+PCA(X2)++PCA(Xn),

ที่ n นี้คือจะบอกว่า eigenvectors ที่ได้รับจากการฝึกอบรมใน PCAS ข้อมูลX ฉันไม่สรุปให้เท่ากับ eigenvectors ที่ได้จาก PCA ในผลรวมของข้อมูลการฝึกอบรมXฉัน แต่ไม่ใช่นิยามของฟังก์ชันเชิงเส้นfที่:X=X1+X2++XnXiXif

f(x+y)=f(x)+f(y)?

เหตุใด PCA จึงถูกพิจารณาว่า "เป็นเส้นตรง" หากไม่เป็นไปตามเงื่อนไขพื้นฐานของความเป็นเส้นตรง


ฉันเคยเขียนหรือได้ยิน (ขอโทษฉันจำไม่ได้ว่าที่ไหนหรือเมื่อไหร่) PCA นั้น "เป็นของโพรซีเดอร์เชิงเส้นตระกูล" เพราะอาศัยการอ้างอิงเชิงเส้นตรงระหว่างตัวแปร มันใช้เมทริกซ์สหสัมพันธ์ของเพียร์สันและแสวงหาการรวมกันเชิงเส้นของความแปรปรวนสูงสุด
ŁukaszDeryło

4
ธรรมชาติของคำถามนี้อาจชัดเจนขึ้นเล็กน้อยโดยใคร่ครวญการตั้งค่าที่ง่ายกว่าและเป็นกิจวัตรของการถดถอยกำลังสองน้อยที่สุดธรรมดา: นี่คือต้นแบบของกระบวนการเชิงเส้นเชิงสถิติ แต่กระบวนการของการประมาณค่าสัมประสิทธิ์น้อยสแควร์เป็นฟังก์ชั่นแบบไม่เชิงเส้นอย่างชัดแจ้งของข้อมูลเมทริกซ์เป็นส่วนร่วมโดยสูตรβ = ( X ' X ) - 1 X ' Y (ขอให้สังเกตว่ามันเป็นฟังก์ชั่นเชิงเส้นของเวกเตอร์การตอบสนองy )Xβ^=(XX)1Xyy
whuber

4
มันอาจจะคุ้มค่าที่จะจำได้ว่า f (x) = x + 1 เป็น "ฟังก์ชั่นเชิงเส้น" ด้วย ... แต่มันก็ไม่ได้ตอบสนองสิ่งที่คุณเพิ่งพูด ... ซึ่งควรอธิบายบางสิ่งบางอย่าง
Mehrdad

นั่นเป็นเพราะ(X1+X2)T(X1+X2)X1TX1+X2TX2
Gabriel Romon

คำตอบ:


39

f:xzRpRkx

z=f(x)=Vx.

kVRp×kXRn×pPCA()

V=PCA(X),
X24

ที่ฉันได้รับ 35 upvotes สำหรับคำตอบเล็กน้อยนี้ค่อนข้างไร้สาระ (และส่วนใหญ่เนื่องจากหัวข้อนี้อยู่ในคำถามเครือข่ายร้อนสักครู่)
อะมีบาพูดว่า Reinstate Monica

5

"เชิงเส้น" อาจหมายถึงหลายสิ่งหลายอย่างและไม่ได้ใช้เฉพาะในลักษณะที่เป็นทางการ

PCA มักไม่ได้ถูกกำหนดให้เป็นฟังก์ชั่นในลักษณะที่เป็นทางการดังนั้นจึงไม่คาดว่าจะตอบสนองความต้องการของฟังก์ชันเชิงเส้นเมื่ออธิบายเช่นนี้ มีการอธิบายบ่อยครั้งมากขึ้นตามที่คุณพูดเป็นขั้นตอนและบางครั้งอัลกอริทึม (แม้ว่าฉันจะไม่ชอบตัวเลือกสุดท้ายนี้) มันมักถูกกล่าวว่าเป็นเส้นตรงในลักษณะที่ไม่เป็นทางการซึ่งไม่ชัดเจน

Xi

XifY(α)
αRkYkY

fi

fY(α)=i=1kαiYi
Y

Yαij


3

PCA ให้ / คือการแปลงเชิงเส้น

MPCA(X1+X2)M(X1+X2)=M(X1)+M(X2)

PCA(X1+X2)PCA(X1)PCA(X2)


เป็นการเปรียบเทียบตัวอย่างง่ายๆของกระบวนการที่ใช้การแปลงเชิงเส้น แต่ไม่ใช่การแปลงเชิงเส้นเอง:

D(v)v[x,y]=[1,0]

D([1,1])[0,2]

และ

D([0,1])[1,0]

แต่

D([1,1]+[0,1]=[1,2])[0.78,2.09][1,2]

การเพิ่มมุมนี้เป็นสองเท่าซึ่งเกี่ยวข้องกับการคำนวณมุมไม่ใช่เชิงเส้นและคล้ายคลึงกับคำแถลงของอะมีบาว่าการคำนวณของไอเก็นเวกเตอร์ไม่เชิงเส้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.