เหตุใดการถดถอยแบบลอจิสติกจึงไม่เรียกว่าการจำแนกแบบลอจิสติก


75

ตั้งแต่ถดถอยโลจิสติเป็นสถิติรูปแบบการจัดหมวดหมู่การจัดการกับตัวแปรตามเด็ดขาดทำไมไม่ได้เรียกว่าโลจิสติกการจัดประเภท ? ไม่ควรจองชื่อ "การถดถอย" กับตัวแบบที่เกี่ยวข้องกับตัวแปรตามแบบต่อเนื่อง


5
การถดถอยโลจิสติกเป็นของรุ่น GLM
Stéphane Laurent

10
คุณสามารถใช้มันเพื่อลดความน่าจะเป็น
Emre

25
ในขณะที่การถดถอยโลจิสติกสามารถนำมาใช้สำหรับการจัดหมวดหมู่อย่างแน่นอนโดยการแนะนำเกณฑ์ความน่าจะเป็นที่จะส่งคืน แต่ก็แทบจะไม่ใช้เพียงอย่างเดียวหรือแม้กระทั่งการใช้หลัก มันได้รับการพัฒนาสำหรับ - และยังคงใช้สำหรับ - เพื่อการถดถอยที่ไม่เกี่ยวข้องกับการจำแนกประเภท ฉันขอยืนยันว่านี่ยังคงเป็นสิ่งที่มันใช้งานได้ง่าย แต่ฉันคิดว่ามันขึ้นอยู่กับสิ่งที่คุณมอง
Glen_b

6
คุณอาจพบว่าบทความนี้เกี่ยวกับการพัฒนาของการถดถอยโลจิสติกส์ที่น่าสนใจโดยเฉพาะอย่างยิ่งเนื่องจากมันให้ความรู้สึกบางชนิดของปัญหาที่จะใช้เป็นเทคนิคการถดถอย
Glen_b

คำตอบ:


102

การถดถอยโลจิสติกไม่ได้เป็นขั้นตอนวิธีการจำแนกอย่างชัดเจน มันเป็นเพียงอัลกอริทึมการจัดหมวดหมู่ร่วมกับกฎการตัดสินใจที่ทำให้เกิดความแตกต่างของความน่าจะเป็นที่คาดการณ์ไว้ การถดถอยแบบลอจิสติกเป็นแบบจำลองการถดถอยเพราะมันประเมินความน่าจะเป็นของการเป็นสมาชิกคลาสในรูปแบบ (การแปลง a) ฟังก์ชั่นหลายชั้นของคุณลักษณะ

Frank Harrellได้โพสต์คำตอบจำนวนมากบนเว็บไซต์นี้เพื่อระบุข้อผิดพลาดเกี่ยวกับการถดถอยโลจิสติกส์เป็นอัลกอริทึมการจำแนกประเภท ในหมู่พวกเขา:

หากฉันจำได้ถูกต้องเขาเคยชี้ให้ฉันเห็นหนังสือของเขาเกี่ยวกับกลยุทธ์การถดถอยเพื่ออธิบายรายละเอียดเพิ่มเติมเกี่ยวกับจุด (และอื่น ๆ !) แต่ฉันไม่สามารถหาโพสต์นั้นได้


1
หากเป็นกรณีนี้ตัวแยกประเภททั้งหมด (หรือส่วนใหญ่) ทำนายความน่าจะเป็นที่จะอยู่ในคลาสก่อน (เท่าที่ฉันรู้) แล้วเปลี่ยนโพรบนี้เป็นคลาส
Outlier

9
@ ตัวอย่างก่อนหน้านี้: SVM ไม่ได้คำนวณความน่าจะเป็นของคลาสเลยเพียงแค่วัดระยะห่างระหว่างการสังเกตและไฮเปอร์เพลน
Sycorax

@Outlier ใน ML เรียกว่าลักษณนามน่าจะเป็น ต้นไม้และป่าสุ่มไม่ได้ xgboost คือ - อย่างน้อยกับ logloss)
seanv507

12

abstractly ถดถอยเป็นปัญหาของการคำนวณความคาดหวังที่มีเงื่อนไขx] แบบฟอร์มที่ใช้โดยความคาดหวังนี้แตกต่างกันไปขึ้นอยู่กับสมมติฐานของวิธีการสร้างข้อมูล:E[Y|X=x]

  • สมมติว่า (Y | X = x) ที่จะกระจายผลตอบแทนตามปกติกับการถดถอยเชิงเส้นแบบคลาสสิก
  • สมมติว่าการแจกแจงปัวซงให้ผลการถดถอยปัวซอง
  • สมมติว่าการแจกแจงแบบเบอร์นูลีทำให้เกิดการถดถอยโลจิสติก

คำว่า "ถดถอย" นอกจากนี้ยังมีการใช้มากขึ้นโดยทั่วไปกว่านี้รวมทั้งวิธีการเช่นการถดถอย quantile ซึ่งประมาณการ quantile ที่กำหนดx)(Y|X=x)


-3

นอกเหนือจากคำตอบที่ดีอยู่แล้วให้ดูก็คือว่าโลจิสติกการถดถอยคาดการณ์ความน่าจะเป็น (ซึ่งเป็นค่าอย่างต่อเนื่อง ) ที่ได้มีช่วง 0-1

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.