ดังนั้นสิ่งที่จับกับ LSTM?


12

ฉันกำลังขยายความรู้ของฉันเกี่ยวกับแพคเกจ Keras และฉันใช้เครื่องมือกับรุ่นที่มีอยู่ ฉันมีปัญหาการจำแนกเลขฐานสองแบบ NLP ที่ฉันพยายามแก้ไขและใช้โมเดลที่แตกต่างกัน

หลังจากทำงานกับผลลัพธ์และอ่านเพิ่มเติมเกี่ยวกับ LSTM มากขึ้นดูเหมือนว่าวิธีการนี้ดีกว่าสิ่งอื่น ๆ ที่ฉันได้ลอง (ในชุดข้อมูลหลายชุด) ฉันคิดกับตัวเองอยู่เสมอว่า "ทำไม / เมื่อไหร่คุณจะไม่ใช้ LSTM" การใช้ประตูเพิ่มเติมซึ่งเป็นของ LSTM ทำให้ฉันมีความรู้สึกสมบูรณ์แบบหลังจากมีบางรุ่นที่ต้องทนทุกข์ทรมานจากการไล่ระดับสีที่หายไป

ดังนั้นสิ่งที่จับกับ LSTM? พวกเขาไม่ทำดีที่ไหน ฉันรู้ว่าไม่มีสิ่งเช่นอัลกอริทึม "หนึ่งขนาดเหมาะกับทุกคน" ดังนั้นจึงต้องมีข้อเสียของ LSTM


ลองใช้ GRU พวกเขาเป็นเหมือน LSTM แต่ต้องการหน่วยความจำน้อยลงและฝึกได้เร็วขึ้น
Vivek Khetan

คำตอบ:


11

คุณถูกต้องที่ LSTM ทำงานได้ดีมากสำหรับปัญหาบางอย่าง แต่ข้อเสียบางประการคือ:

  • LSTM ใช้เวลาในการฝึกฝนนานกว่า
  • LSTM ต้องการหน่วยความจำเพิ่มเพื่อฝึกฝน
  • LSTM ง่ายต่อการปรับตัว
  • การออกกลางคันทำได้ยากกว่าใน LSTM
  • LSTM มีความไวต่อการกำหนดน้ำหนักแบบสุ่มที่แตกต่างกัน

สิ่งเหล่านี้เมื่อเปรียบเทียบกับโมเดลที่ง่ายกว่าเช่น 1D conv net

สามรายการแรกเป็นเพราะ LSTMs มีพารามิเตอร์มากกว่า


3
ตกลงและฉันคิดว่า overfitting (aka ทั่วไปที่ไม่ดี) อาจเป็นความเสี่ยงที่ใหญ่ที่สุด ตรวจสอบให้แน่ใจว่าคุณมีกลยุทธ์ที่ดีสำหรับการตรวจสอบความถูกต้องของแบบจำลอง
ทอม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.