ฟังก์ชั่นที่คุณเสนอมีความแปลกประหลาดเมื่อผลรวมขององค์ประกอบเป็นศูนย์
สมมติว่าเวกเตอร์ของคุณคือ{3}] เวกเตอร์นี้มีผลรวมเป็น 0 ดังนั้นจึงไม่มีการหาร ฟังก์ชั่นไม่แตกต่างที่นี่[ - 1 , 13, 23]
นอกจากนี้หากองค์ประกอบอย่างใดอย่างหนึ่งของเวกเตอร์เป็นลบ แต่ผลรวมเป็นค่าที่ไม่ใช่ศูนย์ผลลัพธ์ของคุณจะไม่น่าจะเป็น
สมมติว่าเวกเตอร์ของคุณคือ2] นี่มีผลรวมเป็น 1 ดังนั้นการใช้ผลการทำงานของคุณในซึ่งไม่ใช่เวกเตอร์ความน่าจะเป็นเพราะมันมีองค์ประกอบเชิงลบและองค์ประกอบที่เกิน 1[ - 1 , 0 , 2 ][ - 1 , 0 , 2 ]
จากมุมมองที่กว้างขึ้นเราสามารถกระตุ้นรูปแบบที่เฉพาะเจาะจงของฟังก์ชั่น softmax จากมุมมองของการขยายการถดถอยโลจิสติกแบบไบนารีไปยังกรณีของผลลัพธ์สามหมวดหรือมากกว่านั้น
การทำสิ่งต่าง ๆ เช่นการรับค่าสัมบูรณ์หรือกำลังสองตามที่แนะนำในความคิดเห็นหมายความว่าและมีความน่าจะเป็นที่คาดการณ์เช่นเดียวกัน วิธีการแบบนี้จะไม่ได้ระบุ โดยคมชัดเป็นบวกต่อเนื่องและสำหรับจริงทั้งหมดดังนั้นผล softmax คือ (1) เวกเตอร์น่าจะเป็นและ (2) รูปแบบโลจิสติกพหุนามมีการระบุ- xxexp ( x ) xประสบการณ์( x )x