การถดถอยโลจิสติก (และโดยทั่วไปแล้ว GLM) ไม่ได้เป็นของการเรียนรู้ของเครื่อง! แต่วิธีการเหล่านี้เป็นของการสร้างแบบจำลองพารามิเตอร์
ทั้งโมเดลพารามิเตอร์และอัลกอริธึม (ML) ใช้ข้อมูล แต่ในวิธีที่ต่างกัน อัลกอริทึมแบบจำลองเรียนรู้จากข้อมูลว่าตัวทำนายจับคู่แผนที่กับตัวทำนายอย่างไร แต่พวกเขาไม่ได้ตั้งสมมติฐานเกี่ยวกับกระบวนการที่สร้างการสังเกต (หรือสมมติฐานอื่นใด) พวกเขาพิจารณาว่าความสัมพันธ์พื้นฐานระหว่างตัวแปรอินพุทและเอาท์พุทนั้นซับซ้อนและไม่ทราบดังนั้นจึงใช้วิธีการที่ขับเคลื่อนด้วยข้อมูลเพื่อทำความเข้าใจว่าเกิดอะไรขึ้นแทนที่จะกำหนดสมการอย่างเป็นทางการ
ในทางกลับกันโมเดลพารามิเตอร์จะถูกกำหนดเป็นนิรนัยโดยอาศัยความรู้เกี่ยวกับกระบวนการศึกษาใช้ข้อมูลเพื่อประมาณค่าพารามิเตอร์ของพวกเขาและสร้างสมมติฐานที่ไม่สมจริงซึ่งไม่ค่อยมีอยู่จริงในทางปฏิบัติ (เช่นความเป็นอิสระความแปรปรวนที่เท่ากันและ การกระจายข้อผิดพลาดปกติ)
นอกจากนี้แบบจำลองพารามิเตอร์ (เช่นการถดถอยโลจิสติก) เป็นแบบจำลองทั่วโลก พวกเขาไม่สามารถจับรูปแบบโลคอลในข้อมูล (ต่างจากวิธี ML ที่ใช้ต้นไม้เป็นแบบจำลองพื้นฐานเช่น RF หรือต้นไม้ที่ได้รับการเพิ่ม) ดูที่หน้ากระดาษนี้ 5. ในฐานะที่เป็นกลยุทธ์การฟื้นฟูสามารถใช้ GLM ในพื้นที่ (เช่นที่ไม่ใช่พารามิเตอร์) (ดูตัวอย่างของlocfit R แพ็คเกจ)
บ่อยครั้งที่เมื่อมีความรู้เล็กน้อยเกี่ยวกับปรากฏการณ์ที่มีอยู่แล้วจะเป็นการดีกว่าที่จะนำวิธีการที่ใช้ข้อมูลมาใช้และใช้แบบจำลองอัลกอริทึม ตัวอย่างเช่นหากคุณใช้การถดถอยแบบโลจิสติกในกรณีที่การทำงานร่วมกันระหว่างตัวแปรอินพุตและเอาต์พุตไม่เป็นเชิงเส้นโมเดลของคุณจะไม่ชัดเจนอย่างชัดเจนและสัญญาณจำนวนมากจะไม่ถูกจับ อย่างไรก็ตามเมื่อกระบวนการนั้นเป็นที่เข้าใจกันอย่างดีโมเดลพาราเมทริกมีข้อได้เปรียบในการให้สมการอย่างเป็นทางการเพื่อสรุปทุกอย่างซึ่งมีประสิทธิภาพจากมุมมองเชิงทฤษฎี
สำหรับการอภิปรายรายละเอียดเพิ่มเติมโปรดอ่านนี้กระดาษที่ยอดเยี่ยมโดยลีโอเบรแมน