เมื่อใดที่คุณจะใช้ PCA แทน LDA ในการจำแนกประเภท


10

ฉันกำลังอ่านบทความนี้เกี่ยวกับความแตกต่างระหว่างการวิเคราะห์องค์ประกอบหลักและการวิเคราะห์จำแนกหลายอย่าง (การวิเคราะห์จำแนกเชิงเส้น) และฉันพยายามเข้าใจว่าทำไมคุณถึงใช้ PCA แทน MDA / LDA

คำอธิบายสรุปได้ดังนี้

การพูดอย่างคร่าวๆใน PCA เรากำลังพยายามหาแกนที่มีความแปรปรวนสูงสุดซึ่งเป็นข้อมูลที่แพร่กระจายมากที่สุด (ภายในคลาสเนื่องจาก PCA ปฏิบัติต่อชุดข้อมูลทั้งหมดเป็นหนึ่งคลาส) และใน MDA เรายังเพิ่มการแพร่กระจายระหว่างชั้นเรียนเพิ่มเติม

คุณไม่ต้องการที่จะเพิ่มความแปรปรวนสูงสุดและเพิ่มการแพร่กระจายระหว่างคลาสให้สูงสุดหรือไม่?


1
ขออภัยฉันหมายถึงการวิเคราะห์จำแนกหลายอย่างซึ่งดูเหมือนว่าจะเรียกว่าการวิเคราะห์จำแนกเชิงเส้นหลายเส้นด้วยกัน
chris

1
คุณควรชี้แจงคำถามของคุณเพราะ ณ ตอนนี้มันเป็นเรื่องไม่สำคัญ: คุณควรจะชอบ PCA มากกว่า MDA เมื่อไม่มีคลาสที่ต้องจำแนกในข้อมูลของคุณ ฉันคิดว่าคุณควรระบุสิ่งนี้เกี่ยวกับการจำแนกประเภทในคำถาม
Firebug

1
LDA เป็นคำทั่วไปมากกว่า MDA ไม่จำเป็นต้องพูดว่า "หลายเส้น", "เชิงเส้น" ก็เพียงพอแล้ว
อะมีบา

คำตอบ:


11

คุณพลาดอะไรไปกว่านี้: PCA ไม่ใช่วิธีการจัดหมวดหมู่

PCA ในการเรียนรู้ของเครื่องถือเป็นวิธีการทางวิศวกรรมคุณสมบัติ เมื่อคุณใช้ PCA กับข้อมูลของคุณคุณจะรับประกันว่าจะไม่มีความสัมพันธ์ระหว่างคุณสมบัติที่ได้ อัลกอริทึมการจำแนกประเภทจำนวนมากได้รับประโยชน์จากสิ่งนั้น

คุณต้องจำไว้เสมอว่าอัลกอริธึมอาจมีข้อสมมติฐานเกี่ยวกับข้อมูลและหากสมมติฐานดังกล่าวไม่ถือพวกเขาอาจมีประสิทธิภาพต่ำกว่า

LDA ต้องคำนวณผกผันแปรปรวนเมทริกซ์เพื่อฉายข้อมูล (ตรวจสอบหัวข้อและคำตอบเหล่านี้: ควร PCA จะดำเนินการก่อนที่ผมจะทำจำแนก?และไม่ได้ทำให้ความรู้สึกที่จะรวม PCA และ LDA? ) หากคุณมีข้อมูลน้อยนี่เป็นสิ่งที่ไม่เสถียรและคุณได้รับการคาดการณ์ที่มากเกินไปไปยังจุดข้อมูลของคุณเช่นเมทริกซ์ความแปรปรวนร่วมแบบเอกพจน์ภายในคลาส PCA มักจะถูกใช้เพื่อหลีกเลี่ยงปัญหาดังกล่าวซึ่งช่วยลดปัญหามิติ

ดังนั้นคำตอบคือคุณไม่เคยใช้ PCA ในการจำแนกประเภท แต่คุณสามารถใช้มันเพื่อพยายามปรับปรุงประสิทธิภาพของ LDA


7

ในขณะที่คำตอบก่อนหน้าโดย Firebug ถูกต้องฉันต้องการเพิ่มมุมมองอื่น:

การเรียนรู้แบบไม่ควบคุมกับผู้เรียน:

LDA มีประโยชน์อย่างมากในการค้นหามิติที่มุ่งเป้าไปที่การแยกกลุ่มดังนั้นคุณจะต้องรู้จักกลุ่มก่อน LDA ไม่ใช่ตัวจําแนกโดยไม่จําเป็น แต่สามารถใช้เป็นตัวแยกประเภทได้ ดังนั้น LDA สามารถใช้ในการเรียนรู้แบบมีผู้สอนเท่านั้น

PCA เป็นวิธีการทั่วไปสำหรับdenoisingและการลดขนาดและไม่ต้องการข้อมูลเพิ่มเติมใด ๆ เช่นป้ายกำกับของชั้นเรียนในการเรียนรู้แบบมีผู้สอน ดังนั้นจึงสามารถนำไปใช้ในการเรียนรู้แบบไม่มีผู้ดูแล


2
+1 LDA is not neccesarily a classifierโดยเฉพาะอย่างยิ่งสำหรับ อ่าน (OP ด้วย) นอกจากนี้ยังแนะนำให้อ่านคำถามที่เกี่ยวข้อง: วิธี LDA เทคนิคการจำแนกยังทำหน้าที่เป็นเทคนิคการลดมิติเช่น PCA
ttnphns

และคำตอบที่นี่เปรียบเทียบผลลัพธ์และแปลงของ LDA และ PCA เป็นสลัว ลด
ttnphns

(+1) LDA เป็นเทคนิคการลดขนาดจริง ๆ ของการจำแนกเชิงเส้นของฟิชเชอร์ซึ่งคนมักจะถือว่าเป็นเกณฑ์การจำแนกประเภท
Firebug

2

LDA ใช้เพื่อแกะสลักพื้นที่หลายมิติ

PCA ใช้เพื่อยุบพื้นที่หลายมิติ

ตัวอย่างเช่น: วัตถุ 3 มิติใช้เงา 2 มิติ PCA มักจะช่วยให้เราสามารถยุบมิติเชิงพื้นที่หลายร้อยมิติไปสู่มิติเชิงพื้นที่จำนวนหนึ่งที่น้อยลงในขณะที่รักษาข้อมูลที่สำคัญไว้ 70% - 90%

ฉันจะเห็นขนาดและรูปร่างของมือคุณจากเงาของมันได้อย่างไร ฉันไม่สามารถบอกคุณทุกอย่างเกี่ยวกับรูปร่างของมือของคุณ แต่ด้วยการสะสมของเงา 3 หรือ 4 อันจากมุมที่เหมาะสมที่สุด จากนั้นฉันสามารถบอกคุณได้มากที่สุดเกี่ยวกับขนาดและรูปร่างของมือ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.