เหตุใดการเปิดใช้งานที่ไม่อยู่กึ่งกลางจึงไม่เกิดปัญหาในการกระจายข้อความ?


26

ฉันอ่านที่นี่ต่อไปนี้:

  • เอาท์พุท sigmoid จะไม่เป็นศูนย์เป็นศูนย์กลาง สิ่งนี้ไม่เป็นที่พึงปรารถนาเนื่องจากเซลล์ประสาทในชั้นถัดไปของการประมวลผลในเครือข่ายประสาท (เพิ่มเติมในเร็ว ๆ นี้) จะได้รับข้อมูลที่ไม่ได้อยู่กึ่งกลาง เรื่องนี้มีผลกระทบต่อการเปลี่ยนแปลงในระหว่างการสืบเชื้อสายการไล่ระดับสีเพราะถ้าข้อมูลที่เข้ามาในเซลล์ประสาทเป็นบวกเสมอ (เช่นx>0 elementwise ใน )) จากนั้นการไล่ระดับน้ำหนักที่ จะระหว่าง backpropagation ทั้งหมดเป็นบวกหรือลบทั้งหมด (ขึ้นอยู่กับความชันของการแสดงออกทั้งหมด =WTx+W) สิ่งนี้สามารถแนะนำพลวัตซิกซิกซิกที่ไม่พึงประสงค์ในการปรับปรุงการไล่ระดับสีสำหรับตุ้มน้ำหนัก อย่างไรก็ตามโปรดสังเกตว่าเมื่อมีการเพิ่มการไล่ระดับสีเหล่านี้ข้ามชุดข้อมูลการปรับปรุงขั้นสุดท้ายสำหรับตุ้มน้ำหนักอาจมีสัญญาณตัวแปรซึ่งจะช่วยบรรเทาปัญหานี้ได้บ้าง ดังนั้นนี่เป็นความไม่สะดวก แต่มีผลกระทบรุนแรงน้อยกว่าเมื่อเทียบกับปัญหาการเปิดใช้งานอิ่มตัวด้านบน

ทำไมจะมีทั้งหมด (elementwise) นำไปสู่การบวกทั้งหมดหรือการไล่ระดับสีทั้งหมดในทางลบต่อ ?x>0W



2
ฉันยังมีคำถามเดียวกันกับการดูวิดีโอ CS231n
สถานีรถไฟใต้ดินจับคู่

คำตอบ:


28

=ΣWผมxผม+
ddWผม=xผม
dLdWผม=dLdddWผม=dLdxผม

xผม>0dLdWผมdLd


W1W2

หากเป้าหมายของเราเกิดขึ้นที่ภาคตะวันออกเฉียงเหนือเราสามารถไปในรูปแบบซิกแซกเพื่อไปที่นั่นได้เหมือนกับที่จอดรถคู่ขนานในพื้นที่แคบ ๆ (ให้อภัยรูปวาดของฉัน)

ป้อนคำอธิบายรูปภาพที่นี่

ดังนั้นฟังก์ชั่นการเปิดใช้งานทั้งหมดที่เป็นบวกหรือลบทั้งหมด (relu, sigmoid) อาจเป็นเรื่องยากสำหรับการปรับให้เหมาะสมแบบไล่ระดับสี เพื่อแก้ปัญหานี้เราสามารถทำให้ข้อมูลปกติเป็นศูนย์ได้โดยไม่ต้องเป็นศูนย์เช่นเดียวกับการทำให้เป็นมาตรฐานแบบกลุ่ม / ชั้น

=ΣWผม(xผม+ผม).
dLdWผม=dLd(xผม-ผม)
xผม


โปรดแก้ไขให้ฉันถ้าฉันผิด แต่ไม่ควรเปลี่ยนค่าของ dL / df เป็น x เช่น xT เนื่องจากเราจะใช้แนวคิดของ Jacobin ที่นี่
chinmay

WTx+LWx

ใช่มันเป็นตัวพิมพ์ใหญ่จากจุดสิ้นสุดของฉัน ฉันหมายถึง df / dw .... แต่ฉันคิดว่ามันขึ้นกับเวกเตอร์ x และถ้ามันเป็นเวกเตอร์แถวหรือเวกเตอร์คอลัมน์
chinmay

dL/d

1
@floyd hi ฉันเพิ่งเพิ่มการอัปเดตสำหรับคำถามของคุณ
dontlo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.