คำถาม
ฉันกำลังดิ้นรนเพื่อทำความเข้าใจว่าการทำนายนั้นจะอยู่ในช่วงเมื่อทำการจำแนกไบนารีด้วยการไล่ระดับสีแบบค่อยเป็นค่อยไป
สมมติว่าเรากำลังทำงานกับปัญหาการจำแนกเลขฐานสองและฟังก์ชันวัตถุประสงค์ของเราคือการสูญเสียบันทึกโดยที่คือตัวแปรเป้าหมายและคือโมเดลปัจจุบันของเรา
เมื่อการฝึกอบรมผู้เรียนที่อ่อนแอต่อไปดังกล่าวว่ารูปแบบใหม่ของเราคือสิ่งที่เป็นกลไกที่ควรจะให้ ? หรืออาจเป็นคำถามที่เกี่ยวข้องมากกว่านี้มีกลไกแบบนี้หรือไม่?
ข้อมูลเพิ่มเติมเกี่ยวกับสิ่งที่ฉันทำ
ฉันกำลังพยายามเพิ่มการไล่ระดับสีโดยใช้ต้นไม้การถดถอย สิ่งที่ฉันทำเพื่อหลีกเลี่ยงมันคือการคูณด้วยปัจจัยc ∈ [ 0 , c max ]เช่นนี้H + c max hไม่ไปต่ำกว่าศูนย์หรือสูงกว่าหนึ่งและฉันเลือกcในช่วงนี้ที่ย่อเล็กสุด ฟังก์ชั่นการสูญเสีย
นี่ทำให้เกิดปัญหาต่อไปนี้: หลังจากรอบฉันมีจุดหนึ่งที่จำแนกอย่างสมบูรณ์และแบ่งที่ดีที่สุดที่มีการผลักลักษณนามในทิศทางของการไล่ระดับสีต้องการผลักดันจุดนี้เหนือจุดหนึ่งซึ่งฉันแน่ใจว่าจะไม่เกิดขึ้นโดย การตั้งค่า 0 ดังนั้นการวนซ้ำครั้งถัดไปทั้งหมดจะเลือกการแบ่งที่เหมือนกันและc = 0 ที่เหมือนกัน
ฉันลองใช้ระเบียบปฏิบัติทั่วไป
- ลดอัตราการเรียนรู้โดยการคูณโดยμ = 0.01 นี่เป็นเพียงความล่าช้าของปัญหา
- การสุ่มตัวอย่างพื้นที่คุณลักษณะ แต่บางจุดนั้นง่ายต่อการจำแนกพวกมันทำเครื่องหมายในเกือบทุกช่องใน "นี่เป็นค่าบวกหรือไม่" รูปแบบและ "การแบ่งที่ดี" เกือบทุกรายการแสดงพฤติกรรมนี้
ผมคิดว่านี่ไม่ได้เป็นปัญหาของพารามิเตอร์และควรจะมีมากขึ้นเสียงวิธีการที่จะแก้ไขปัญหานี้ ฉันไม่ได้ละทิ้งความเป็นไปได้ที่การใช้งานของฉันจะพัง แต่ฉันไม่พบสิ่งใดที่เป็นปัญหานี้
สิ่งที่เราจัดการในบริบทของการสูญเสียโลจิสติกควรเป็นความน่าจะเป็นดังนั้นเราจะหลีกเลี่ยงได้อย่างไร
สัญชาตญาณของฉันคือการวางแบบจำลองที่เรากำลังสร้าง, , ในฟังก์ชัน sigmoid ซึ่งมันถูก จำกัด ไว้ที่[ 0 , 1 ]และฉันเดาว่ามันจะใช้ได้ แต่ฉันอยากรู้ว่ามีวิธีแก้ปัญหาอื่นหรือไม่ เนื่องจากการเพิ่มระดับความลาดชันดูเหมือนจะใช้อย่างประสบความสำเร็จในงานการจำแนกประเภทจึงควรมีโซลูชัน "ที่ถูกต้อง" (เช่นพร้อมด้วยเหตุผล)