ทำไมค่าสัมประสิทธิ์การถดถอยเชิงเส้นและโลจิสติกไม่สามารถประมาณได้โดยใช้วิธีการเดียวกัน


9

ฉันอ่านในหนังสือการเรียนรู้ของเครื่องว่าสามารถประมาณค่าพารามิเตอร์ของการถดถอยเชิงเส้น (ท่ามกลางวิธีอื่น ๆ ) โดยการไล่ระดับสีแบบลาดชันในขณะที่พารามิเตอร์ของการถดถอยแบบโลจิสติกมักจะประเมินโดยการประมาณโอกาสสูงสุด

เป็นไปได้หรือไม่ที่จะอธิบายให้กับผู้เริ่มต้น (ฉัน) ว่าทำไมเราถึงต้องการวิธีการที่แตกต่างกันสำหรับการถดถอยเชิงเส้น / ลอจิสติก หรือที่รู้จักว่าทำไมไม่ MLE สำหรับการถดถอยเชิงเส้นและทำไมไม่ไล่ระดับความลาดชันสำหรับการถดถอยโลจิสติก?

คำตอบ:


19

คุณกำลังทำให้แอปเปิ้ลสับสนกับส้ม ไม่เป็นไรเพราะทั้งคู่อร่อยดี

การประมาณค่าความน่าจะเป็นสูงสุดเป็นเรื่องเกี่ยวกับสิ่งที่คุณลดลาดเชื้อสายเป็นเรื่องเกี่ยวกับวิธีการที่คุณลดมัน

ทำไมไม่ MLE สำหรับการถดถอยเชิงเส้น?

ในความเป็นจริงแล้วการถดถอยเชิงเส้นจะถูกแก้ไขด้วยการประมาณค่าความน่าจะเป็นสูงสุด มาตรฐาน "ลดผลรวมของข้อผิดพลาดกำลังสอง" แบบมาตรฐานนั้นมีความหมายทางคณิตศาสตร์เทียบเท่ากับการประมาณความน่าจะเป็นสูงสุดโดยใช้การแจกแจงแบบปกติตามเงื่อนไข

ทำไมไม่ไล่ลงทางลาดสำหรับการถดถอยโลจิสติก?

คุณสามารถแก้ปัญหาการถดถอยโลจิสติกได้โดยลดฟังก์ชั่นความน่าจะเป็นโดยใช้การไล่ระดับสี มันเป็นแบบฝึกหัดที่ยอดเยี่ยมและฉันขอแนะนำให้ทุกคนทำอย่างน้อยหนึ่งครั้ง

เชื้อสายการไล่ระดับสีไม่ใช่วิธีมาตรฐาน รางวัลนั้นไปสู่การลดน้ำหนักอย่างน้อยกำลังสองน้อยที่สุด / วิธีของนิวตันซึ่งเป็นการปรับปรุงการลดลงของการไล่ระดับสีที่คำนึงถึงอนุพันธ์อันดับสองเช่นกัน วิธีนี้เพิ่งจะมีคุณสมบัติที่ดีกว่าการไล่ระดับสีมากกว่า แต่ก็ยากที่จะเข้าใจและนำไปใช้


2
ขอบคุณ วิธีการของนิวตันเหมือนกับนิวตันราฟสันหรือไม่? หรือว่าเป็นสิ่งที่แตกต่างกันอย่างไร
Victor

2
ใช่ฉันเชื่อว่าสิ่งเหล่านั้นอ้างถึงแนวคิดเดียวกัน
Matthew Drury
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.