ฉันมีคำถามที่คล้ายกันเมื่ออ่านเอกสารจากการยื่นอื่น ๆ และถามคำถามมากมายที่เกี่ยวข้องกับสิ่งนี้เช่นคำถามนี้ในชุมชนการทำเหมืองข้อมูลด้านการศึกษา:
เหตุใดจึงใช้การสูญเสียความน่าจะเป็นกำลังสองแทนการสูญเสียโลจิสติก
ที่นี่ฉันจะนำเสนอความคิดเห็นส่วนตัวจำนวนมาก
ฉันรู้สึกว่าฟังก์ชั่นการสูญเสียไม่สำคัญมากนักในกรณีใช้งานจริงหลายอย่าง นักวิจัยบางคนอาจรู้เพิ่มเติมเกี่ยวกับการสูญเสียกำลังสองและการสร้างระบบของมันมันยังทำงานได้และแก้ปัญหาโลกแห่งความจริง นักวิจัยอาจไม่เคยรู้จักการสูญเสียโลจิสติกหรือการสูญเสียบานพับและต้องการลอง นอกจากนี้พวกเขาอาจไม่สนใจที่จะหาแบบจำลองคณิตศาสตร์ที่ดีที่สุด แต่ต้องการแก้ปัญหาจริงที่ไม่มีใครพยายามแก้ไขก่อน
นี่เป็นอีกตัวอย่าง: ถ้าคุณตรวจสอบคำตอบสำหรับคำถามของฉันพวกเขาทั้งหมดคล้ายกัน อะไรคือผลกระทบของการเลือกฟังก์ชั่นการสูญเสียที่แตกต่างกันในการจัดประเภทเป็นประมาณ 0-1 การสูญเสีย
ความคิดเพิ่มเติม: การวิจัยการเรียนรู้ด้วยเครื่องอาจใช้เวลามากในการเลือกรุ่นและวิธีการปรับโมเดลให้เหมาะสม เนื่องจากนักวิจัยการเรียนรู้ของเครื่องอาจไม่มีความสามารถในการรวบรวมข้อมูลเพิ่มเติม / รับมาตรการเพิ่มเติม และงานของนักวิจัยการเรียนรู้ของเครื่องกำลังได้รับคณิตศาสตร์ที่ดีกว่าไม่แก้ปัญหาในโลกแห่งความเป็นจริงโดยเฉพาะ
ในทางกลับกันในโลกแห่งความเป็นจริงถ้าข้อมูลดีกว่ามันจะเต้นทุกสิ่ง ดังนั้นการเลือกโครงข่ายประสาทเทียมหรือฟอเรสต์แบบสุ่มอาจไม่สำคัญมากนัก ทุกรุ่นมีความคล้ายคลึงกับบุคคลที่ต้องการใช้การเรียนรู้ของเครื่องเป็นเครื่องมือในการแก้ปัญหาในโลกแห่งความจริง บุคคลที่ไม่สนใจในการพัฒนาคณิตศาสตร์หรือเครื่องมืออาจใช้เวลามากขึ้นในการใช้ความรู้เกี่ยวกับโดเมนเฉพาะเพื่อทำให้ระบบดีขึ้น
ตามที่ฉันพูดถึงในความคิดเห็น และถ้าหากใครมีความเลอะเทอะกับคณิตศาสตร์เขา / เธอก็ยังสามารถสร้างสิ่งที่ใช้ได้