ฟังก์ชั่นวัตถุประสงค์ของ PCA คืออะไร?


42

การวิเคราะห์องค์ประกอบหลักสามารถใช้การสลายตัวของเมทริกซ์ แต่นั่นเป็นเพียงเครื่องมือในการเดินทาง

คุณจะค้นหาส่วนประกอบหลักโดยไม่ใช้พีชคณิตเมทริกซ์ได้อย่างไร

ฟังก์ชั่นวัตถุประสงค์ (เป้าหมาย) คืออะไรและมีข้อ จำกัด อะไร?


1
บางทีฉันอาจจะพลาดบางสิ่งบางอย่างดังนั้นโปรดแก้ไขให้ฉันถ้าฉันผิด แต่ควรเป็นไปได้ (อย่างน้อยในหลักการ) เพื่อสร้างสิ่งที่ทำใน PCA โดยใช้เมทริกซ์เป็นปัญหาเชิงเส้น (ซับซ้อน) การเขียนโปรแกรม แต่ฉันไม่ รู้ว่าคุณต้องระบุข้อ จำกัด ทั้งหมดอย่างไร นอกจากนี้ฉันไม่แน่ใจว่าจะง่ายมากเมื่อเทียบกับเพียงแค่ใช้ PCA ทำไมคุณพยายามหลีกเลี่ยงเมทริกซ์?
Chris Simokat

@ Chris ฉันไม่เห็นว่าจะมีปัญหาในการเขียนโปรแกรมเชิงเส้นอย่างไร มันก็ไม่ได้ทำความเข้าใจทั้งการฝึกอบรมของฉันที่ควรหลีกเลี่ยงในการคำนวณ คำถามคือสิ่งที่ชนิดของปัญหาจะถูกแก้ไขโดย PCA และไม่ใช่วิธีที่จะทำ (เช่นการคำนวณ SVD เป็นต้น) การแก้ปัญหาโดยพระคาร์ดินัลบอกว่าคุณหาเส้นทางมุมฉากต่อเนื่องของความแปรปรวนสูงสุด วิธีแก้ปัญหาที่ฉันนำเสนอบอกว่าคุณพบไฮเปอร์เพลนที่มีข้อผิดพลาดในการสร้างใหม่น้อยที่สุด
NRH

@ chris ฉันหวังว่าจะหาวิธีอื่นในการดู PCA โดยไม่ต้องใช้พีชคณิตเมทริกซ์เพื่อเพิ่มความเข้าใจของฉัน
Neil McGuigan

1
@Chris คุณมีฟังก์ชันวัตถุประสงค์กำลังสองและข้อ จำกัด ของความเสมอภาคของ norm หรืออีกวิธีหนึ่งภายใต้การกำหนดในคำตอบของ @ NRH คุณมีข้อ จำกัด อันดับของเมทริกซ์ นั่นไม่ใช่การเอาชนะปัญหาการเขียนโปรแกรมเชิงเส้น @NRH ให้สัญชาตญาณที่ดีและในความเป็นจริงมีการเชื่อมต่ออย่างใกล้ชิดระหว่างสองมุมมองใน PCA ที่ได้รับ บางทีในความร่วมมือกับ @NRH เราสามารถเพิ่มสิ่งนั้นไว้ในโพสต์ของเขา / เธอเพื่อให้ชุดคำตอบที่สมบูรณ์ยิ่งขึ้น 2
พระคาร์ดินัล

1
@NRH จริง ๆ แล้วฉันชอบESLมาก แต่ฉันคิดว่าการรักษาในหัวข้อนี้ค่อนข้างตื้นเพราะเป็นหัวข้อในหนังสือหลายเล่ม โดยเฉพาะอย่างยิ่งพวกเขาไม่ได้พิสูจน์ (หรือแม้แต่มอบหมายให้เป็นแบบฝึกหัด) ส่วนสำคัญของโซลูชันสำหรับปัญหาการเพิ่มประสิทธิภาพที่คุณให้
พระคาร์ดินัล

คำตอบ:


41

โดยไม่ต้องพยายามที่จะให้ไพรเมอร์เต็มรูปแบบใน PCA, จากมุมมองการเพิ่มประสิทธิภาพหลักฟังก์ชันวัตถุประสงค์คือความฉลาดทางเรย์ลี เมทริกซ์ที่ตัวเลขในความฉลาดคือ (หลายตัว) เมทริกซ์ความแปรปรวนตัวอย่าง ที่แต่ละเป็นเวกเตอร์ของคุณสมบัติและเป็นเมทริกซ์ดังกล่าวที่แถว TH เป็น T

S=1ni=1nxixiT=XTX/n
xipXixiT

PCA พยายามที่จะแก้ปัญหาการเพิ่มประสิทธิภาพลำดับ ลำดับแรกคือปัญหาที่ไม่มีข้อ จำกัด

maximizeuTSuuTu,uRp.

ตั้งแต่ปัญหาที่ไม่มีข้อ จำกัด ข้างต้นจะเทียบเท่ากับปัญหาที่ จำกัด uTu=u22=uu

maximizeuTSusubject touTu=1.

นี่คือที่ที่พีชคณิตเมทริกซ์เข้ามาเนื่องจากเป็นเมทริกซ์ semidefinite เชิงบวกแบบสมมาตร (จากการก่อสร้าง!) มันมีการสลายตัวแบบค่าเฉพาะของรูปแบบ ที่เป็น เมทริกซ์มุมฉาก (ดังนั้น ) และเป็นเส้นทแยงมุมเมทริกซ์ที่มีค่าลบรายการดังกล่าวว่า0S

S=QΛQT,
QQQT=IΛλiλ1λ2λp0

ดังนั้น 2 เนื่องจากมีข้อ จำกัด ในปัญหาที่จะมีบรรทัดฐานหนึ่งดังนั้นคือตั้งแต่ , โดยอาศัยอำนาจเป็นมุมฉากuTSu=uTQΛQTu=wTΛw=i=1pλiwi2uww2=QTu2=u2=1Q

แต่ถ้าเราต้องการเพิ่มปริมาณภายใต้ข้อ จำกัด ที่สิ่งที่ดีที่สุดที่เราทำได้คือ ชุด , ที่อยู่,และสำหรับ1i=1pλiwi2i=1pwi2=1w=e1w1=1wi=0i>1

ตอนนี้ให้สำรองข้อมูลสอดคล้องกันซึ่งเป็นสิ่งที่เราต้องการตั้งแต่แรกเราได้รับ โดยที่หมายถึงคอลัมน์แรกของคือวิคเตอร์ที่สอดคล้องกับค่าเฉพาะที่ใหญ่ที่สุดของ S ค่าของฟังก์ชั่นโดยมีวัตถุประสงค์แล้วยังมองเห็นได้ง่ายที่จะเป็น\u

u=Qe1=q1
q1QSλ1

ส่วนประกอบเวกเตอร์หลักที่เหลือนั้นจะถูกค้นพบโดยการแก้ลำดับ (จัดทำดัชนีโดย ) ของปัญหาการหาค่าเหมาะ ดังนั้นปัญหาที่เกิดขึ้นเหมือนกันยกเว้นว่าเราเพิ่มข้อ จำกัด เพิ่มเติมว่าการแก้ปัญหาจะต้องตั้งฉากกับทั้งหมดของการแก้ปัญหาก่อนหน้านี้ในลำดับ มันไม่ได้เป็นเรื่องยากที่จะขยายการโต้แย้งดังกล่าวข้างต้น inductively เพื่อแสดงให้เห็นว่าวิธีการแก้ปัญหาของปัญหา TH เป็นแท้จริงที่ TH วิคเตอร์ของ Si

maximizeuiTSuisubject touiTui=1uiTuj=01j<i.
iqiiS

วิธีการแก้ปัญหา PCA ก็มักจะแสดงในแง่ของการสลายตัวมูลค่าเอกพจน์ของ{X} เพื่อดูว่าทำไมให้ T จากนั้นและ (พูดอย่างเคร่งครัดถึงสัญญาณพลิก) และnXX=UDVTnS=XTX=VD2VTV=QΛ=D2/n

พบส่วนประกอบหลักโดยการฉายลงบนเวกเตอร์องค์ประกอบหลัก จากการกำหนดสูตร SVD เป็นเรื่องง่ายที่จะเห็นว่า X

XQ=XV=UDVTV=UD.

ความเรียบง่ายของการเป็นตัวแทนของทั้งเวกเตอร์องค์ประกอบหลักและส่วนประกอบหลักนั้นในแง่ของ SVD ของเมทริกซ์ของคุณสมบัติเป็นเหตุผลหนึ่งที่คุณสมบัติ SVD นั้นเด่นชัดในการรักษา PCA บางอย่าง


หากต้องการเพียงค่าเอกพจน์ / เวกเตอร์สองสามตัวแรกเท่านั้น Nash และ Shlien ให้อัลกอริทึมเตือนความทรงจำของวิธีการใช้พลังงานตามปกติสำหรับการคำนวณค่าลักษณะเฉพาะที่โดดเด่น นี่อาจเป็นที่สนใจของ OP
JM ไม่ใช่นักสถิติ

@ NRH ขอบคุณสำหรับการจับ (และแก้ไข) ความผิดพลาดของฉันก่อนที่ฉันจะได้เห็นพวกเขา!
พระคาร์ดินัล

1
สวัสดี @ cardinal ขอบคุณสำหรับคำตอบของคุณ แต่ดูเหมือนว่าคุณไม่ได้ให้ขั้นตอนในการพิสูจน์ว่าเหตุใดการเพิ่มประสิทธิภาพตามลำดับจึงนำไปสู่การปรับให้เหมาะสมระดับโลก คุณช่วยอธิบายรายละเอียดเกี่ยวกับเรื่องนี้ได้ไหม? ขอบคุณ!
Lifu Huang

21

วิธีแก้ปัญหาที่นำเสนอโดยคาร์ดินัลมุ่งเน้นไปที่เมทริกซ์ความแปรปรวนร่วมตัวอย่าง จุดเริ่มต้นอีกจุดหนึ่งคือข้อผิดพลาดในการสร้างใหม่ของข้อมูลโดยไฮเพอร์คิวชัน q -dimensional ถ้าจุดข้อมูลp -dimensional เป็นจุดประสงค์คือการแก้ไขx1,,xn

minμ,λ1,,λn,Vqi=1n||xiμVqλi||2

สำหรับเมทริกซ์ด้วยคอลัมน์ orthonormal และ Q สิ่งนี้ให้อันดับq- การก่อสร้างที่ดีที่สุดที่วัดโดยค่าปริภูมิแบบยุคลิดและคอลัมน์ของ solution เป็นเวกเตอร์องค์ประกอบหลักตัวแรกของคิวp×qVqλiRqVq

สำหรับที่ทางออกสำหรับและ (นี่คือการถดถอย) คือ Vqμλi

μ=x¯=1ni=1nxiλi=VqT(xix¯)

เพื่อความสะดวกในการคำนวณให้สมมุติว่าอยู่กึ่งกลางในการคำนวณต่อไปนี้ เราต้องลดให้น้อยที่สุด xi

i=1n||xiVqVqTxi||2

มากกว่าพร้อมคอลัมน์ orthonormal โปรดทราบว่าเป็นเส้นโครงบนพื้นที่คอลัมน์q -dimensional ดังนั้นปัญหาจึงเทียบเท่ากับการลด กว่าอันดับQประมาณการPนั่นคือเราจำเป็นต้องเพิ่ม เหนืออันดับqประมาณการโดยที่เป็นเมทริกซ์ความแปรปรวนร่วมตัวอย่าง ตอนนี้VqP=VqVqT

i=1n||xiPxi||2=i=1n||xi||2i=1n||Pxi||2
P
i=1n||Pxi||2=i=1nxiTPxi=tr(Pi=1nxixiT)=ntr(PS)
PS
tr(PS)=tr(VqTSVq)=i=1quiTSui
โดยที่คือคอลัมน์ (orthonormal) ในและอาร์กิวเมนต์ที่แสดงในคำตอบของ @ cardinal แสดงว่าค่าสูงสุดได้มาจากการเอา ' s to be eigenvectors สำหรับมีค่าลักษณะเฉพาะที่ใหญ่ที่สุดu1,,uqqVquiqSq

ข้อผิดพลาดในการสร้างใหม่แสดงให้เห็นจำนวนภาพรวมที่มีประโยชน์เช่นส่วนประกอบหลักที่กระจัดกระจายหรือการสร้างใหม่โดย manifolds ที่มีมิติต่ำแทนที่จะเป็นไฮเปอร์เพลน สำหรับรายละเอียดโปรดดูมาตรา 14.5 ในองค์ประกอบของการเรียนรู้ทางสถิติ


(+1) คะแนนดี บางข้อเสนอแนะ: มันจะดีที่จะกำหนดและจะจริงๆดีที่จะให้หลักฐานสั้นผล หรืออีกวิธีหนึ่งก็สามารถเชื่อมต่อกับปัญหาการเพิ่มประสิทธิภาพที่เกี่ยวข้องกับผลหาร Rayleight ฉันคิดว่านั่นจะทำให้คำตอบสำหรับคำถามนี้สมบูรณ์มาก! λi
พระคาร์ดินัล

@ cardinal ฉันเชื่อว่าฉันทำตามขั้นตอนที่หายไปในการสร้างสูตรการฟื้นฟูจนถึงปัญหาที่คุณแก้ไข
NRH

ทำได้ดีมาก ฉันเชื่อว่ามีเพียงช่องว่างที่เหลืออยู่ในคำสั่งสุดท้ายของคุณ ไม่ชัดเจนในทันทีว่าการเพิ่มประสิทธิภาพผลรวมนั้นเหมือนกับการทำตามลำดับของการเพิ่มประสิทธิภาพในคำตอบของฉัน ที่จริงแล้วฉันไม่คิดว่ามันจะตามมาโดยตรงโดยทั่วไป แต่ไม่จำเป็นต้องพูดถึงที่นี่เช่นกัน
พระคาร์ดินัล

@ คาร์ดินัลตามมาด้วยการเหนี่ยวนำ คุณให้เริ่มต้นการเหนี่ยวนำและในขั้นตอนการเหนี่ยวนำให้เลือกพาหะ orthonormalที่เพิ่มทุนและจัดเพื่อให้เป็นหน่วยเวกเตอร์ตั้งฉากกับ{Q-1} จากนั้นตามผลลัพธ์ของคุณและโดยสมมติฐานการปฐมนิเทศu_i แน่นอนว่าพื้นฐานไม่ได้เป็นพื้นฐานที่ไม่ซ้ำกันสำหรับพื้นที่ -dimensional นอกจากนี้คุณยังสามารถพูดคุย "อาร์กิวเมนต์ชุดค่าผสมนูน" ที่คุณใช้เพื่อให้การพิสูจน์โดยตรง w1,,wqwqu1,,uq1wqTSwquqTSuqi=1q1wiTSwii=1q1uiTSuiq
NRH

1
@ cardinal ฉันไม่ได้บังคับให้มีการซ้อนเพียงใช้การพิจารณาในมิติ หากเรามีพื้นที่ย่อย -dimensional คุณสามารถเลือกในพื้นที่ดังกล่าวได้ตลอดจนเป็นพื้นที่ย่อย -dimensional จากนั้นคุณเติม -basis ในแบบที่คุณต้องการ qwq(q1)w
NRH

4

ดู NIPALS ( wiki ) สำหรับอัลกอริทึมเดียวซึ่งไม่ได้ใช้การสลายตัวของเมทริกซ์อย่างชัดเจน ฉันคิดว่านั่นคือสิ่งที่คุณหมายถึงเมื่อคุณบอกว่าคุณต้องการหลีกเลี่ยงพีชคณิตเมทริกซ์เนื่องจากคุณไม่สามารถหลีกเลี่ยงพีชคณิตเมทริกซ์ได้ที่นี่ :)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.