ฉันใช้การถดถอยโลจิสติกรุ่นมาตรฐานเพื่อให้พอดีกับตัวแปรอินพุตของฉันกับตัวแปรเอาต์พุตไบนารี
อย่างไรก็ตามในปัญหาของฉันผลลัพธ์ลบ (0s) มีจำนวนมากกว่าผลบวก (1s) อัตราส่วนคือ 20: 1 ดังนั้นเมื่อฉันฝึกตัวจําแนกเสียงดูเหมือนว่าแม้กระทั่งคุณสมบัติที่แนะนําอย่างยิ่งถึงความเป็นไปได้ของเอาต์พุตเชิงบวกที่ยังคงมีค่าที่ต่ำมาก (ค่าลบสูง) สำหรับพารามิเตอร์ที่สอดคล้องกัน สำหรับฉันดูเหมือนว่าสิ่งนี้เกิดขึ้นเพราะมีตัวอย่างเชิงลบจำนวนมากเกินไปที่ดึงพารามิเตอร์ในทิศทางของพวกเขา
ดังนั้นฉันสงสัยว่าฉันสามารถเพิ่มน้ำหนัก (พูดโดยใช้ 20 แทน 1) สำหรับตัวอย่างที่เป็นบวก สิ่งนี้มีแนวโน้มที่จะได้รับประโยชน์หรือไม่? และถ้าเป็นเช่นนั้นฉันจะเพิ่มน้ำหนักได้อย่างไร (ในสมการด้านล่าง)
ฟังก์ชั่นค่าใช้จ่ายมีลักษณะดังต่อไปนี้:
ความชันของฟังก์ชันต้นทุนนี้ (wrt ) คือ:
ที่นี่ = จำนวนกรณีทดสอบ = เมทริกซ์ฟีเจอร์ = เวกเตอร์เอาท์พุท = ฟังก์ชัน sigmoid = พารามิเตอร์ที่เราพยายามเรียนรู้
ในที่สุดฉันก็วิ่งลงทางลาดเพื่อค้นหาจุดต่ำสุด เป็นไปได้ ดูเหมือนว่าการใช้งานจะทำงานอย่างถูกต้อง