คำถามติดแท็ก lstm

4
วิธีการเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และจำนวนของเซลล์หน่วยความจำใน LSTM
ฉันกำลังพยายามหางานวิจัยที่มีอยู่เกี่ยวกับวิธีเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และขนาดของ RNN ที่ใช้ LSTM มีบทความที่ตรวจสอบปัญหานี้หรือไม่เช่นเซลล์หน่วยความจำควรใช้เท่าไร? ฉันคิดว่ามันทั้งหมดขึ้นอยู่กับแอปพลิเคชันและในบริบทที่มีการใช้แบบจำลอง แต่งานวิจัยบอกว่าอย่างไร

5
เครือข่ายประสาทสามารถนำมาใช้ในการทำนายจำนวนสุ่มหลอกต่อไปได้หรือไม่
มันเป็นไปได้ที่จะเลี้ยงเครือข่ายประสาทที่ส่งออกจากเครื่องกำเนิดไฟฟ้าจำนวนสุ่มและคาดหวังว่ามันเรียนรู้คร่ำเครียด (หรือเครื่องกำเนิดไฟฟ้า) ฟังก์ชั่นเพื่อที่จะสามารถคาดการณ์สิ่งที่จะเป็นต่อไปสร้างตัวเลขสุ่มหลอก ? สิ่งนี้มีอยู่แล้วใช่ไหม หากการวิจัยได้ทำไปแล้วในเรื่องนี้หรือบางสิ่งที่เกี่ยวข้อง (จากการทำนายตัวเลขสุ่มหลอก) ทุกคนสามารถชี้ให้ฉันไปยังแหล่งข้อมูลที่ถูกต้องได้หรือไม่? ขณะนี้ฉันกำลังดูห้องสมุดนี้และลิงก์ที่เกี่ยวข้อง https://github.com/Vict0rSch/deep_learning/tree/master/keras/recurrent

2
วิธีการฝึกอบรม chatbot
ฉันต้องการที่จะเริ่มการทดลองกับเครือข่ายประสาทและเป็นปัญหาของเล่นฉันต้องการฝึกอบรมหนึ่งเพื่อแชทเช่นใช้บอทแชทเช่น cleverbot ไม่ฉลาดเท่าไร ฉันมองไปรอบ ๆ เพื่อดูเอกสารบางอย่างและฉันพบว่าบทช่วยสอนทั่วไปเกี่ยวกับงานทั่วไป สิ่งที่ฉันค้นพบเพียงแค่เปิดเผยผลลัพธ์โดยไม่ให้ข้อมูลเชิงลึกเกี่ยวกับการใช้งาน สิ่งที่ทำทำมันค่อนข้างตื้น (หน้าเอกสารคู่มือเทนเซอร์ไหลใน seq2seq ขาด imho) ตอนนี้ฉันรู้สึกว่าฉันอาจเข้าใจหลักการมากกว่าหรือน้อยกว่า แต่ฉันไม่แน่ใจและฉันก็ไม่แน่ใจด้วยว่าจะเริ่มอย่างไร ดังนั้นฉันจะอธิบายว่าฉันจะจัดการกับปัญหาได้อย่างไรและฉันต้องการคำติชมเกี่ยวกับวิธีการแก้ปัญหานี้โดยบอกฉันว่าฉันเข้าใจผิดตรงไหนและอาจมีลิงค์ไปยังคำอธิบายโดยละเอียดและความรู้เชิงปฏิบัติเกี่ยวกับกระบวนการ ชุดข้อมูลที่ฉันจะใช้สำหรับงานนี้คือการถ่ายโอนข้อมูลประวัติการใช้งาน Facebook และ Whatsapp ทั้งหมดของฉัน ฉันไม่รู้ว่ามันจะใหญ่แค่ไหน แต่อาจจะยังไม่ใหญ่พอ ภาษาเป้าหมายไม่ใช่ภาษาอังกฤษดังนั้นฉันจึงไม่รู้จะรวบรวมตัวอย่างการสนทนาที่มีความหมายได้อย่างรวดเร็ว ฉันจะสร้างเวกเตอร์ที่คิดจากแต่ละประโยค ยังไม่รู้ความจริง ฉันพบตัวอย่างที่ดีสำหรับ word2vec บนเว็บไซต์ deeplearning4j แต่ไม่มีสำหรับประโยค ฉันเข้าใจว่าคำว่าเวกเตอร์ถูกสร้างขึ้นอย่างไรและทำไม แต่ฉันไม่สามารถหาคำอธิบายที่ครบถ้วนสมบูรณ์สำหรับเวกเตอร์ประโยคได้ การใช้เวกเตอร์ความคิดเป็นอินพุตและเอาต์พุตฉันจะฝึกโครงข่ายประสาท ฉันไม่รู้ว่ามันควรมีกี่เลเยอร์และอันไหนต้องเป็นเลเยอร์ lstm จากนั้นควรมีโครงข่ายใยประสาทเทียมอื่นที่สามารถแปลงเวกเตอร์คิดเป็นลำดับของอักขระที่เขียนประโยค ฉันอ่านว่าฉันควรใช้การขยายเพื่อชดเชยความยาวประโยคที่แตกต่างกัน แต่ฉันพลาดวิธีเข้ารหัสอักขระ (codepoints เพียงพอหรือไม่)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.