ดรอปเอาท์( กระดาษคำอธิบาย ) ตั้งค่าเอาต์พุตของเซลล์ประสาทบางตัวให้เป็นศูนย์ ดังนั้นสำหรับ MLP คุณอาจมีสถาปัตยกรรมต่อไปนี้สำหรับชุดข้อมูล Iris flower :
4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax)
มันจะทำงานเช่นนี้:
ด้วย , , , , (ละเว้นอคติเพื่อเห็นแก่ simplictiy) W 1 ∈ R 50 × 4 D ∈ { 0 , 1 } 50 × 1 W 2 ∈ R 20 × 50 W 3 ∈ R 20 × 3
ด้วยและ
เมื่อการทำงานคูณ point-wise กับ (ดูผลิตภัณฑ์ Hadamard )
ดังนั้นเราเพียงแค่สุ่มตัวอย่างเมทริกซ์ในแต่ละครั้งและทำให้การออกกลางคันกลายเป็นการคูณของโหนดด้วย 0
แต่สำหรับซีเอ็นเอ็นมันไม่ชัดเจนสำหรับฉันว่าจะถูกปล่อยออกไปอย่างแน่นอน ฉันเห็นความเป็นไปได้สามประการ:
- การปล่อยแผนที่คุณลักษณะที่สมบูรณ์ (ดังนั้นเคอร์เนล)
- ปล่อยองค์ประกอบหนึ่งของเคอร์เนล (แทนที่องค์ประกอบของเคอร์เนลด้วย 0)
- วางองค์ประกอบหนึ่งของแผนที่คุณลักษณะ
โปรดเพิ่มการอ้างอิง / อ้างถึงคำตอบของคุณ
ความคิดของฉัน
ฉันคิดว่าลาซานญ่านั้น (3) (ดูรหัส ) นี่อาจเป็นวิธีที่ง่ายที่สุดในการติดตั้ง อย่างไรก็ตามใกล้ความคิดดั้งเดิมอาจจะ (1)
ดูเหมือนว่าจะคล้ายกับ Caffe (ดูรหัส ) สำหรับ tensorflow ผู้ใช้จะต้องตัดสินใจ ( รหัส - ฉันไม่แน่ใจว่าเกิดอะไรขึ้นเมื่อnoise_shape=None
ผ่าน)
มันควรจะเป็นอย่างไร
(2) และ (3) ไม่สมเหตุสมผลนักเนื่องจากมันจะทำให้เครือข่ายเพิ่มค่าคงที่ในตำแหน่งพิเศษซึ่งอาจไม่เป็นที่ต้องการ ดังนั้น (1) เป็นตัวแปรเดียวที่สมเหตุสมผล แต่ฉันไม่แน่ใจว่าจะเกิดอะไรขึ้นถ้าคุณใช้การเริ่มต้นใช้งาน