decision_function, predict_proba, และฟังก์ชันทำนายความแตกต่างของปัญหาการถดถอยโลจิสติกคืออะไร


10

ฉันได้อ่านเอกสารเกี่ยวกับ sklearn แล้ว แต่ฉันไม่สามารถเข้าใจวัตถุประสงค์ของฟังก์ชันเหล่านี้ในบริบทของการถดถอยโลจิสติกส์ เพราะdecision_functionมันบอกว่าระยะห่างระหว่างไฮเปอร์เพลนกับอินสแตนซ์การทดสอบ ข้อมูลเฉพาะนี้มีประโยชน์อย่างไร? และสิ่งนี้เกี่ยวข้องกับpredictและpredict-probaวิธีการอย่างไร

คำตอบ:


29

จำได้ว่ารูปแบบการทำงานของการถดถอยโลจิสติกคือ

(x)=11+อี-(β0+β1x1++βkxk)

predict_probaนี่คือสิ่งที่ถูกส่งกลับโดย

คำศัพท์ภายในเลขยกกำลัง

d(x)=β0+β1x1++βkxk

decision_functionคือสิ่งที่ถูกส่งกลับโดย "ไฮเปอร์เพลน" ที่อ้างถึงในเอกสารประกอบคือ

β0+β1x1++βkxk=0

คำศัพท์นี้เป็นโฮลด์จากการสนับสนุนเครื่องเวกเตอร์ สำหรับการถดถอยโลจิสติกไฮเปอร์เพลนนี้เป็นบิตของสิ่งประดิษฐ์เทียมมันเป็นระนาบของความน่าจะเป็นที่เท่ากันโดยที่โมเดลได้กำหนดคลาสเป้าหมายทั้งสองแบบเท่ากัน

predictฟังก์ชันส่งกลับตัดสินใจระดับการใช้กฎ

(x)>0.5

เมื่อมีความเสี่ยงในการ soapboxing predictฟังก์ชั่นนี้มีการใช้งานที่ถูกกฎหมายน้อยมากและฉันมองว่าการใช้มันเป็นสัญญาณของข้อผิดพลาดเมื่อตรวจสอบการทำงานอื่น ๆ ฉันจะไปไกลพอที่จะเรียกมันว่าเป็นข้อผิดพลาดในการออกแบบใน sklearn ตัวเอง ( predict_probaฟังก์ชั่นควรได้รับการเรียกpredictและpredictควรได้รับการเรียกpredict_classถ้ามีอะไรเลย)


ขอบคุณสำหรับคำตอบ @Matthew แต่คุณสามารถอธิบายจุดนี้ให้มากกว่านี้ได้ไหม "สำหรับการถดถอยโลจิสติกไฮเปอร์เพลนนี้เป็นบิตของสิ่งประดิษฐ์เทียมมันเป็นระนาบของความน่าจะเป็นที่เท่ากัน ." ?
เหมือนกัน

คำอธิบายนี้น่าสนใจและเป็นประโยชน์ ฉันหวังว่า sklearn จะอธิบายได้ดีขึ้น สิ่งที่ฉันไม่เข้าใจคือการใช้การรู้คุณค่าของ x ในฟังก์ชันลอจิสติก 1 / (1 + e ^ -x) คืออะไร? สิ่งที่ฉันคิดได้ก็คือใช้ฟังก์ชัน sigmoid ที่แตกต่างกันเช่น x / (1+ | x |) มีอีกไหม? ขอบคุณ!
ldmtwo

โดยทั่วไปหน้าที่การตัดสินใจควรเป็น sigmoid ในการถดถอยโลจิสติก แก้ไข?
3nomis

2
ฉันคิดว่าเหตุผลที่ @Matthew อยู่ในกล่องสบู่ก็คือการใช้ 0.5 เป็นเกณฑ์ในการทำนายนั้นไร้เดียงสา สิ่งแรกที่เราควรทำคือเรียนรู้ที่จะใช้การตรวจสอบข้าม, ROC curves และ AUC เพื่อเลือก threshold c ที่เหมาะสมและใช้เป็นฟังก์ชันการตัดสินใจ f (x)> c
hwrd
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.