บล็อกการเรียนรู้ที่เหลือคืออะไรในบริบทของเครือข่ายที่หลงเหลืออยู่ลึกในการเรียนรู้อย่างลึก


12

ฉันกำลังอ่านการเรียนรู้ส่วนที่เหลือลึกเพื่อการจดจำรูปภาพและฉันมีปัญหาในการทำความเข้าใจกับความมั่นใจ 100% สิ่งที่บล็อกส่วนเหลือตกค้างคำนวณ อ่านกระดาษของพวกเขาพวกเขามีรูปที่ 2:

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งแสดงให้เห็นถึงสิ่งที่บล็อกส่วนที่เหลือควรจะเป็น การคำนวณของส่วนที่เหลือเป็นเพียงบล็อกเดียวกับ:

y=σ(W2σ(W1x+b1)+b2+x)

หรือมันเป็นอย่างอื่น?

ในคำอื่น ๆ อาจจะพยายามที่จะตรงกับสัญกรณ์ของกระดาษคือ:

F(x)+x=[W2σ(W1x+b1)+b2]+x

มันเป็นเรื่องจริงเหรอ?

โปรดสังเกตว่าหลังจากการรวมกลุ่มวงกลมคำว่า ReLU จะปรากฏบนกระดาษดังนั้นผลลัพธ์ของบล็อกส่วนที่เหลือ (ซึ่งฉันแทนด้วย ) ควรเป็น:y

σ(F(x)+x)=σ([W2σ(W1x+b1)+b2]+x)

มีเพิ่มเติม Relu ไม่ใช่เชิงเส้นหนึ่ง\σ


is x is positive relu (x) = x
Ray Tayek

คำตอบ:


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.