เกณฑ์การตัดสินใจเป็นพารามิเตอร์ในการถดถอยโลจิสติกหรือไม่


13

คลาสที่ถูกทำนายจากการถดถอยโลจิสติก (ไบนารี) ถูกกำหนดโดยใช้ขีด จำกัด บนความน่าจะเป็นสมาชิกคลาสที่สร้างโดยโมเดล ตามที่เข้าใจแล้วปกติแล้ว 0.5 จะถูกใช้เป็นค่าเริ่มต้น

แต่การเปลี่ยนเกณฑ์จะเปลี่ยนการจำแนกประเภทที่คาดการณ์ไว้ สิ่งนี้หมายความว่าขีด จำกัด คือพารามิเตอร์มากเกินไปหรือไม่ หากเป็นเช่นนั้นเหตุใดจึงไม่สามารถค้นหากริดเกณฑ์ได้อย่างง่ายดายโดยใช้วิธีการของ scikit-Learn GridSearchCV(เช่นเดียวกับที่คุณทำกับพารามิเตอร์การทำให้เป็นมาตรฐานC)


1
"ตามที่ฉันเข้าใจโดยทั่วไปแล้วจะใช้ 0.5 โดยค่าเริ่มต้น" ขึ้นอยู่กับความหมายของคำว่า "ทั่วไป" ในทางปฏิบัติไม่ควรมีใครทำเช่นนี้
Matthew Drury


อย่างเคร่งครัดคุณไม่ได้หมายถึงการถดถอยแบบลอจิสติกคุณหมายถึงการใช้หนึ่งโลจิสติกรีจีสเตอร์ที่มีเกณฑ์สำหรับการจำแนกไบนารี (คุณยังสามารถฝึกการถดถอยหนึ่งครั้งสำหรับแต่ละคลาสสองคลาสด้วยการสุ่ม
smci

คำตอบ:


12

เกณฑ์การตัดสินใจสร้างการแลกเปลี่ยนระหว่างจำนวนของผลบวกที่คุณคาดการณ์และจำนวนเชิงลบที่คุณทำนาย - เนื่องจากการเพิ่มขีด จำกัด การตัดสินใจจะเป็นการลดจำนวนของผลบวกที่คุณคาดการณ์และจำนวนลบ คุณทำนาย

เกณฑ์การตัดสินใจไม่ใช่พารามิเตอร์ไฮเปอร์ในแง่ของการปรับแต่งโมเดลเนื่องจากไม่ได้เปลี่ยนความยืดหยุ่นของโมเดล

วิธีที่คุณคิดเกี่ยวกับคำว่า "ปรับ" ในบริบทของเกณฑ์การตัดสินใจแตกต่างจากวิธีปรับค่าพารามิเตอร์มากเกินไป การเปลี่ยนและพารามิเตอร์ไฮเปอร์โมเดลอื่น ๆ จะเปลี่ยนโมเดลC(เช่นสัมประสิทธิ์การถดถอยโลจิสติกจะแตกต่างกัน) ในขณะที่การปรับเกณฑ์สามารถทำได้สองสิ่งเท่านั้น: แลกเปลี่ยน TP สำหรับ FN และ FP สำหรับ TN อย่างไรก็ตามโมเดลยังคงเหมือนเดิมเพราะนี่จะไม่เปลี่ยนค่าสัมประสิทธิ์ (เช่นเดียวกับโมเดลที่ไม่มีสัมประสิทธิ์เช่นฟอเรสต์แบบสุ่ม: การเปลี่ยนขีด จำกัด ไม่เปลี่ยนแปลงอะไรเลยเกี่ยวกับต้นไม้) ดังนั้นในแง่ที่แคบคุณถูกต้องแล้วที่จะหาการแลกเปลี่ยนที่ดีที่สุดท่ามกลางข้อผิดพลาด คือ "จูน" แต่คุณไม่ถูกต้องอยู่ในความคิดว่าการเปลี่ยนเกณฑ์มีการเชื่อมโยงกับรูปแบบไฮเปอร์พารามิเตอร์อื่น ๆ GridSearchCVในลักษณะที่มีการเพิ่มประสิทธิภาพโดย

ระบุอีกวิธีหนึ่งการเปลี่ยนเกณฑ์การตัดสินใจสะท้อนถึงตัวเลือกในส่วนของคุณเกี่ยวกับจำนวนบวกและลบที่คุณต้องการ พิจารณาสมมติฐานที่คุณตั้งค่าเกณฑ์การตัดสินใจเป็นค่าที่ไม่น่าเชื่ออย่างสมบูรณ์เช่น -1 ความน่าจะเป็นทั้งหมดนั้นไม่เป็นลบดังนั้นด้วยเกณฑ์นี้คุณจะคาดการณ์ "เชิงบวก" สำหรับการสังเกตทุกครั้ง จากมุมมองที่กำหนดนี่เป็นสิ่งที่ดีมากเพราะอัตราลบติดลบของคุณคือ 0.0 อย่างไรก็ตามอัตราบวกที่ผิดพลาดของคุณนั้นอยู่ที่ระดับรุนแรงมากถึง 1.0 ดังนั้นในแง่นั้นการเลือกเกณฑ์ที่ -1 นั้นแย่มาก

แน่นอนว่าอุดมคติคือการมี TPR เท่ากับ 1.0 และ FPR ที่ 0.0 และ FNR ที่ 0.0 แต่โดยปกติจะเป็นไปไม่ได้ในแอปพลิเคชันในโลกแห่งความเป็นจริงดังนั้นคำถามจึงกลายเป็น "ฉันยินดีรับ FPR เท่าไหร่สำหรับ FPR" และนี่คือแรงจูงใจของเส้นโค้ง


ขอบคุณสำหรับคำตอบ @Sycorax คุณเกือบจะเชื่อฉัน แต่เราไม่สามารถทำให้แนวคิดของ "ฉันยินดีรับ FPR เท่าไหร่สำหรับ FPR" เช่นการใช้เมทริกซ์ต้นทุน หากเรามีเมทริกซ์ราคาก็จะไม่เป็นที่พึงปรารถนาที่จะหาเกณฑ์ที่เหมาะสมผ่านการปรับแต่งตามที่คุณจะปรับพารามิเตอร์ หรือมีวิธีที่ดีกว่าในการหาเกณฑ์ที่เหมาะสมหรือไม่
Nick

1
วิธีที่คุณใช้คำว่า "ปรับ" ที่นี่แตกต่างจากวิธีปรับพารามิเตอร์ไฮเปอร์ การเปลี่ยนและพารามิเตอร์ไฮเปอร์โมเดลอื่น ๆเปลี่ยนแปลงโมเดล (เช่นค่าสัมประสิทธิ์การถดถอยโลจิสติกจะแตกต่างกัน) ในขณะที่การปรับเกณฑ์สามารถทำได้สองสิ่งเท่านั้น: แลกเปลี่ยน TP สำหรับ FN และ FP สำหรับ TN (แต่โมเดลยังคงเหมือนเดิม - ค่าสัมประสิทธิ์เดียวกัน ฯลฯ ) คุณขวาที่คุณต้องการที่จะหาการออกที่ดีที่สุดในข้อผิดพลาด แต่คุณกำลังผิดว่าการปรับแต่งดังกล่าวใช้เวลาภายในสถานที่ CGridSearchCV
Sycorax พูดว่า Reinstate Monica

@Sycorax ไม่ใช่ขีด จำกัด และการสกัดกั้น (คำว่าอคติ) ที่ทำในสิ่งเดียวกัน นั่นคือคุณสามารถให้เกณฑ์คงที่ที่ 0.5 แต่เปลี่ยนการสกัดกั้นตาม; สิ่งนี้จะ "เปลี่ยนแบบจำลอง" (ตามความคิดเห็นล่าสุดของคุณ) แต่จะมีผลเหมือนกันในแง่ของการทำนายแบบไบนารี ถูกต้องหรือไม่ ถ้าเป็นเช่นนั้นฉันไม่แน่ใจว่าความแตกต่างที่เข้มงวดระหว่าง "การเปลี่ยนแบบจำลอง" และ "การเปลี่ยนกฎการตัดสินใจ" นั้นมีความหมายมากในกรณีนี้
อะมีบาพูดว่า Reinstate Monica

@amoeba นี่คือคำพูดที่กระตุ้นแม้ว่า ฉันจะต้องพิจารณามัน ฉันคิดว่าจำนวนเงินที่แนะนำของคุณคือ "รักษาเกณฑ์ไว้ที่ 0.5 และถือว่าการสกัดกั้นเป็นพารามิเตอร์ที่คุณปรับแต่ง" ไม่มีสิ่งใดในทางคณิตศาสตร์ที่จะห้ามไม่ให้คุณทำเช่นนี้ยกเว้นการสังเกตว่าแบบจำลองไม่ได้เพิ่มความเป็นไปได้สูงสุดอีกต่อไป แต่การได้รับ MLE นั้นอาจไม่สำคัญในบางบริบท
Sycorax พูดว่า Reinstate Monica เมื่อ

10

แต่การเปลี่ยนเกณฑ์จะเปลี่ยนการจำแนกประเภทที่คาดการณ์ไว้ สิ่งนี้หมายความว่าขีด จำกัด คือพารามิเตอร์มากเกินไปหรือไม่

ใช่มันทำ sorta มันเป็นพารามิเตอร์หลายมิติของกฎการตัดสินใจของคุณแต่ไม่ใช่การถดถอยพื้นฐาน

หากเป็นเช่นนั้นเหตุใดจึงไม่สามารถค้นหากริดเกณฑ์ได้อย่างง่ายดายโดยใช้วิธี GridSearchCV ของ scikit-learn (เช่นเดียวกับที่คุณทำกับพารามิเตอร์การทำให้เป็นมาตรฐาน C)

นี่เป็นข้อผิดพลาดในการออกแบบใน sklearn แนวปฏิบัติที่ดีที่สุดสำหรับสถานการณ์การจำแนกประเภทส่วนใหญ่คือเพื่อให้เหมาะสมกับตัวแบบต้นแบบ (ซึ่งทำนายความน่าจะเป็น) โดยใช้การวัดคุณภาพของความน่าจะเป็นเหล่านี้ (เช่นการสูญเสียบันทึกในการถดถอยโลจิสติก) หลังจากนั้นเกณฑ์การตัดสินใจเกี่ยวกับความน่าจะเป็นเหล่านี้ควรได้รับการปรับแต่งเพื่อเพิ่มประสิทธิภาพวัตถุประสงค์ทางธุรกิจของกฎการจัดหมวดหมู่ของคุณ ห้องสมุดควรทำให้ง่ายต่อการปรับเกณฑ์การตัดสินใจให้เหมาะสมตามการวัดคุณภาพ แต่ฉันไม่เชื่อว่าจะทำได้ดี

ฉันคิดว่านี่เป็นหนึ่งในสถานที่ที่เข้าใจผิด ห้องสมุดรวมถึงวิธีการในรูปแบบการจัดหมวดหมู่ทั้งหมดที่เกณฑ์ที่predict 0.5วิธีนี้ไม่มีประโยชน์และฉันขอแนะนำอย่างมากว่าไม่ต้องเรียกใช้ เป็นเรื่องน่าเสียดายที่ sklearn ไม่สนับสนุนกระบวนการทำงานที่ดีขึ้น


ฉันยังแบ่งปันความสงสัยของคุณเกี่ยวกับpredictตัวเลือกเริ่มต้นของวิธีการที่ 0.5 เป็นทางลัด แต่GridSearchCVยอมรับscorerวัตถุที่สามารถปรับแต่งโมเดลที่เกี่ยวกับการสูญเสียข้ามเอนโทรปีตัวอย่าง ฉันพลาดจุดของคุณหรือไม่
Sycorax พูดว่า Reinstate Monica

ถูกต้องตกลงกันว่าเป็นแนวปฏิบัติที่ดีที่สุด แต่ไม่สนับสนุนให้ผู้ใช้ปรับแต่งเกณฑ์การตัดสินใจ
Matthew Drury

Gotcha ฉันเข้าใจสิ่งที่คุณหมายถึง!
Sycorax พูดว่า Reinstate Monica

1
@Sycorax พยายามแก้ไขเพื่อชี้แจง!
Matthew Drury
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.