ในขณะที่ AdamO แนะนำในความคิดเห็นข้างต้นคุณไม่สามารถทำได้ดีกว่าอ่านบทที่ 4 ขององค์ประกอบของการเรียนรู้เชิงสถิติ (ซึ่งฉันจะเรียก HTF) ซึ่งเปรียบเทียบ LDA กับวิธีการจัดหมวดหมู่เชิงเส้นอื่น ๆ ให้ตัวอย่างมากมายและยังกล่าวถึงการใช้งาน ของ LDA เป็นเทคนิคการลดขนาดในหลอดเลือดดำของ PCA ซึ่งเมื่อ ttnphns ชี้ให้เห็นค่อนข้างเป็นที่นิยม
จากมุมมองของการจำแนกผมคิดว่าความแตกต่างที่สำคัญคือ ลองนึกภาพว่าคุณมีสองชั้นและคุณต้องการแยกพวกเขา แต่ละคลาสมีฟังก์ชันความหนาแน่นของความน่าจะเป็น สถานการณ์ที่ดีที่สุดที่เป็นไปได้คือถ้าคุณรู้ว่าฟังก์ชันความหนาแน่นเหล่านี้เพราะคุณสามารถทำนายได้ว่าจุดไหนที่เป็นของชั้นเรียนโดยการประเมินความหนาแน่นเฉพาะชั้นที่จุดนั้น
ลักษณนามบางประเภททำงานโดยการหาค่าประมาณของฟังก์ชันความหนาแน่นของคลาส LDA เป็นหนึ่งในสิ่งเหล่านี้ มันทำให้สมมติฐานที่ว่าความหนาแน่นเป็นตัวแปรหลายตัวที่มีเมทริกซ์ความแปรปรวนร่วมเดียวกัน นี่คือสมมติฐานที่คาดเดายาก แต่ถ้ามันถูกต้องโดยประมาณคุณจะได้ตัวแยกประเภทที่ดี ตัวแยกประเภทอื่น ๆ อีกมากมายใช้วิธีการแบบนี้เช่นกัน แต่พยายามยืดหยุ่นมากกว่าสมมติว่าปกติ ตัวอย่างเช่นดูหน้า 108 ของ HTF
ในทางกลับกันในหน้า 210 HTF เตือน:
หากการจำแนกประเภทเป็นเป้าหมายสูงสุดการเรียนรู้ความหนาแน่นของชั้นเรียนที่แยกจากกันอาจไม่จำเป็นและในความเป็นจริงอาจทำให้เข้าใจผิด
อีกวิธีคือการมองหาขอบเขตระหว่างสองคลาสซึ่งเป็นสิ่งที่ perceptron ทำ รุ่นที่ซับซ้อนกว่านี้คือเครื่องสนับสนุนเวกเตอร์ วิธีการเหล่านี้สามารถใช้ร่วมกับการเพิ่มคุณสมบัติให้กับข้อมูลโดยใช้เทคนิคที่เรียกว่าการสร้างเคอร์เนล สิ่งนี้ไม่ทำงานกับ LDA เพราะมันไม่ได้รักษาบรรทัดฐาน แต่ก็ไม่มีปัญหาสำหรับตัวจําแนกซึ่งเพียงแค่มองหาไฮเปอร์เพลนแบบแยก
ความแตกต่างระหว่าง LDA และตัวจําแนกซึ่งมองหาไฮเพอร์เพลตแบบแยกเป็นเหมือนความแตกต่างระหว่าง t-test และทางเลือกอื่นที่ไม่ใช่พารามิเตอร์ในสถิติทั่วไป หลังมีความแข็งแกร่งมากขึ้น (ตัวอย่างเช่นค่าผิดปกติ) แต่ตัวอย่างหลังนั้นเหมาะสมที่สุดหากสมมติฐานของมันพอใจ
อีกหนึ่งข้อสังเกต: มันอาจคุ้มค่าที่จะกล่าวถึงว่าบางคนอาจมีเหตุผลทางวัฒนธรรมสำหรับการใช้วิธีการเช่น LDA หรือการถดถอยโลจิสติกซึ่งอาจพ่นตาราง ANOVA ออกไปทดสอบการทดสอบสมมติฐานและรับรองสิ่งต่าง ๆ เช่นนั้น LDA ถูกคิดค้นโดย Fisher; perceptron เดิมเป็นแบบจำลองสำหรับเซลล์ประสาทของมนุษย์หรือสัตว์และไม่มีการเชื่อมต่อกับสถิติ มันยังทำงานในทางอื่น; บางคนอาจชอบวิธีการเช่นการสนับสนุนเครื่องเวคเตอร์เพราะพวกเขามีรูปแบบทันสมัยทันสมัยซึ่งวิธีการในศตวรรษที่ยี่สิบก็ไม่ตรงกัน ไม่ได้หมายความว่ามันดีกว่า (ตัวอย่างที่ดีของเรื่องนี้ถูกกล่าวถึงในการเรียนรู้ของเครื่องสำหรับแฮ็กเกอร์หากฉันจำได้ถูกต้อง)