การทำนาย Bayes ของความน่าจะเป็นสมาชิกระดับ LDA ของหลังเส้นโค้งโลจิสติกเช่นกัน
[Efron, B. ประสิทธิภาพของการถดถอยโลจิสติกเมื่อเทียบกับการวิเคราะห์จำแนกตามปกติ J Am Stat Assoc, 70, 892-898 (1975)]
ในขณะที่กระดาษนั้นแสดงให้เห็นว่าประสิทธิภาพสัมพัทธ์ของ LDA นั้นเหนือกว่า LR หากเป็นไปตามสมมติฐานของ LDA (การอ้างอิง: กระดาษ Efron ด้านบนจุดสุดท้ายของ @tthnps) ตามองค์ประกอบของการเรียนรู้ทางสถิติในทางปฏิบัติแทบไม่มีความแตกต่างใด ๆ
[Hastie, T. และ Tibshirani, R. และ Friedman, J. องค์ประกอบของการเรียนรู้ทางสถิติ; การทำเหมืองข้อมูลการอนุมานและการสะกดคำ Springer Verlag, New York, 2009]
การเพิ่มประสิทธิภาพสัมพัทธ์ของ LDA อย่างมหาศาลนั้นส่วนใหญ่เกิดขึ้นในกรณีที่ไม่มีอาการทางจิต
[Harrell, FE & Lee, KL การเปรียบเทียบการเลือกปฏิบัติของการวิเคราะห์การเลือกปฏิบัติและการถดถอยโลจิสติกภายใต้ภาวะหลายตัวแปรชีวสถิติ: สถิติในชีวการแพทย์สาธารณสุขศาสตร์และวิทยาศาสตร์สิ่งแวดล้อม, 333-343 (1985)]
แม้ว่าในทางปฏิบัติแล้วฉันจะพบกับสถานการณ์ตัวอย่างขนาดเล็กในมิติสูงซึ่ง LDA นั้นดูดีกว่า (แม้ว่าจะมีทั้งค่าปกติเชิงพหุตัวแปรและความแปรปรวนร่วมของเมทริกซ์ความแปรปรวนร่วมที่เท่ากันอย่างเห็นได้ชัด)
[ Beleites, C.; Geiger, K.; Kirsch, M. ; Sobottka, SB; Schackert, G. & Salzer, R. Raman การจัดระดับสเปกโทรสโกของเนื้อเยื่อ Astrocytoma: ใช้ข้อมูลอ้างอิงอ่อน, Anal Bioanal Chem, 400, 2801-2816 (2011) DOI: 10.1007 / s00216-011-4985-4 ]
แต่โปรดทราบว่าในบทความของเรา LR อาจจะดิ้นรนกับปัญหาที่พบว่ามีการแยกทิศทางที่สมบูรณ์แบบ (ใกล้) ที่สมบูรณ์แบบ LDA ในทางกลับกันอาจมีการ overfitting อย่างรุนแรงน้อยกว่า
สมมติฐานที่มีชื่อเสียงสำหรับ LDA นั้นมีความจำเป็นเพียงเพื่อพิสูจน์ความเป็นไปได้สูงสุด หากพวกเขาไม่ได้พบกับขั้นตอนยังคงสามารถเป็นฮิวริสติกที่ดี
ความแตกต่างที่สำคัญสำหรับฉันในทางปฏิบัติเนื่องจากปัญหาการจำแนกประเภทที่ฉันทำงานในบางครั้ง / บ่อยครั้งที่ปรากฏออกมาจริง ๆ แล้วไม่ใช่ปัญหาการจำแนกที่ชัดเจนเลย: LR สามารถทำได้อย่างง่ายดายด้วยข้อมูลที่การอ้างอิงมีระดับสมาชิกระดับกลาง ท้ายที่สุดมันเป็นเทคนิคการถดถอย
[ดูกระดาษที่ลิงค์ด้านบน]
คุณอาจพูดว่า LR ให้ความสำคัญมากกว่า LDA ในตัวอย่างที่อยู่ใกล้กับขอบเขตของชั้นเรียนและโดยทั่วไปไม่สนใจกรณีที่ "backside" ของการแจกแจง
นอกจากนี้ยังอธิบายว่าทำไมมันจึงมีความอ่อนไหวต่อค่าผิดปกติน้อยกว่า (เช่นที่ด้านหลัง) กว่า LDA
(สนับสนุนเครื่องเวกเตอร์จะเป็นตัวจําแนกที่ไปในทิศทางนี้ไปจนสุด: ทุกสิ่ง แต่กรณีที่ขอบเขตไม่ได้รับการสนใจ)