เครือข่ายส่วนใหญ่ที่ฉันเคยเห็นมีชั้นหนาแน่นหนึ่งหรือสองชั้นก่อนหน้าชั้น softmax สุดท้าย
- มีวิธีใดในการเลือกจำนวนและขนาดของเลเยอร์หนาแน่น
- เลเยอร์หนาแน่นสองเลเยอร์เป็นตัวแทนมากกว่าหนึ่งสำหรับพารามิเตอร์จำนวนเดียวกันหรือไม่
- ควรจะออกกลางคันก่อนแต่ละชั้นที่หนาแน่นหรือแค่ครั้งเดียว?