การออกกลางคันของ LSTM ชั้นใด


11

ควรใช้หลายชั้นLSTMพร้อมกับดรอปเอาท์หรือไม่แนะนำให้วางออกกลางคันบนเลเยอร์ที่ซ่อนอยู่ทั้งหมดรวมถึงเอาท์พุทเลเยอร์หนาแน่น ในกระดาษของฮินตัน (ซึ่งเสนอให้ออกกลางคัน) เขาแค่วางกลางคันลงบนชั้นที่หนาแน่นเท่านั้น แต่นั่นเป็นเพราะชั้นในที่ซ่อนอยู่นั้นเป็นรูปธรรม

เห็นได้ชัดว่าฉันสามารถทดสอบรูปแบบเฉพาะของฉัน แต่ฉันสงสัยว่ามีฉันทามติเกี่ยวกับเรื่องนี้หรือไม่?


3
มีการอภิปรายที่ดีเกี่ยวกับการออกกลางคันในเครือข่ายซ้ำในบทความนี้หากคุณสนใจ: arxiv.org/abs/1512.05287 Gal, Yarin และ Zoubin Ghahramani "แอปพลิเคชั่น dropout ที่มีเหตุผลในเชิงทฤษฎี ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 2016.
redhqs

2
ดูเหมือนว่าจะยืนยันสิ่งที่ @Media กล่าวไว้ด้านล่าง
BigBadMe

คำตอบ:


12

ฉันไม่ต้องการเพิ่มการเลื่อนออกในLSTMเซลล์ด้วยเหตุผลที่เฉพาะเจาะจงและชัดเจน LSTMsดีสำหรับระยะยาว แต่สิ่งสำคัญเกี่ยวกับพวกเขาก็คือพวกเขาไม่เก่งในการท่องจำหลายสิ่งพร้อมกัน ตรรกะของการดรอปเอาท์คือการเพิ่มสัญญาณรบกวนให้กับเซลล์ประสาทเพื่อไม่ให้ขึ้นอยู่กับเซลล์ประสาทใด ๆ เมื่อเพิ่มการเลื่อนออกสำหรับLSTMเซลล์มีโอกาสที่จะลืมสิ่งที่ไม่ควรลืม ดังนั้นCNNsฉันชอบที่จะใช้แบบเลื่อนออกในชั้นหนาแน่นหลังจากที่LSTMชั้น


1
ฉันเข้าใจสิ่งที่คุณกำลังพูดและมันก็สมเหตุสมผล แต่แล้วทำไม LSTM ใช้งานเซลล์ใน Keras หรือ Tensorflow ให้ความสามารถในการระบุการออกกลางคัน (และการออกกลางคันซ้ำ) ถ้ามันจะทำลายวิธี LSTM ควรจะ ฟังก์ชั่น?
BigBadMe

3
ในCNNsก็เป็นที่ยอมรับอย่างสมบูรณ์ไม่ใช้พวกเขาในชั้นแปลงเนื่องจากจำนวนเล็ก ๆ ของน้ำหนักในชั้นความสับสน ในLSTMsทางกลับกันจำนวนน้ำหนักไม่เล็ก ดังที่ฉันได้กล่าวไว้ในงานที่มีหลายสิ่งหลายอย่างที่ต้องจดจำฉันพยายามที่จะไม่ใช้การออกกลางคัน แต่มันก็เหมือนกับกรณีของคำกริยาที่คุณไม่ได้พึ่งพามากฉันคิดว่ามันไม่เลว มันเป็นประสบการณ์ของฉัน อาจมีคำตอบอื่น ๆ สำหรับโดเมนแอปพลิเคชันที่แตกต่างกัน
สื่อ

1
คำอธิบายที่ยอดเยี่ยมทั้งสองตอบ! (+ 1)
Aditya

5

ไม่มีฉันทามติที่สามารถพิสูจน์ได้ในทุกรุ่นของโมเดล

การคิดว่าการออกกลางคันเป็นรูปแบบของการทำให้เป็นมาตรฐานเท่าไรที่จะใช้ (และที่ใด) จะขึ้นอยู่กับชนิดและขนาดของชุดข้อมูลรวมถึงความซับซ้อนของแบบจำลองที่คุณสร้างขึ้น (ขนาดใหญ่)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.