คำถามติดแท็ก recurrent-neural-networks

4
วิธีการเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และจำนวนของเซลล์หน่วยความจำใน LSTM
ฉันกำลังพยายามหางานวิจัยที่มีอยู่เกี่ยวกับวิธีเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และขนาดของ RNN ที่ใช้ LSTM มีบทความที่ตรวจสอบปัญหานี้หรือไม่เช่นเซลล์หน่วยความจำควรใช้เท่าไร? ฉันคิดว่ามันทั้งหมดขึ้นอยู่กับแอปพลิเคชันและในบริบทที่มีการใช้แบบจำลอง แต่งานวิจัยบอกว่าอย่างไร

1
เครื่องจักร Boltzmann สามารถเก็บรูปแบบได้มากกว่า Hopfield net หรือไม่?
นี่คือจากเบต้าที่ปิดสำหรับ AI โดยคำถามนี้ถูกโพสต์โดยผู้ใช้หมายเลข 47 เครดิตทั้งหมดสำหรับพวกเขา ตามที่วิกิพีเดีย , เครื่องจักร Boltzmann สามารถมองได้ว่าเป็นคู่สุ่มที่สร้างขึ้นมาจากตาข่าย Hopfield ทั้งสองเป็นเครือข่ายประสาทที่เกิดขึ้นอีกที่สามารถฝึกให้เรียนรู้รูปแบบบิต จากนั้นเมื่อนำเสนอด้วยรูปแบบบางส่วนสุทธิจะดึงรูปแบบที่สมบูรณ์แบบเต็ม เครือข่าย Hopfield ได้รับการพิสูจน์แล้วว่ามีความจุ 0.138 (เช่นสามารถเรียกใช้เวกเตอร์ประมาณ 138 บิตจากการจัดเก็บสำหรับทุก ๆ 1,000 โหนดเฮิรตซ์ 1991) ในฐานะที่เป็นเครื่อง Boltzmann สุ่มฉันเข้าใจว่ามันจะไม่จำเป็นต้องแสดงรูปแบบเดียวกันเสมอเมื่อพลังงานที่แตกต่างระหว่างรูปแบบการจัดเก็บหนึ่งและอื่น ๆ ที่คล้ายกัน แต่เนื่องจากความไม่แน่นอนนี้อาจช่วยให้สามารถจัดเก็บรูปแบบที่หนาแน่นขึ้น แต่ไม่มีการรับประกันว่าคุณจะได้รับรูปแบบ "ใกล้เคียงที่สุด" ในแง่ของความแตกต่างของพลังงาน สิ่งนี้จะเป็นจริงหรือไม่? หรือ Hopfield net จะสามารถเก็บรูปแบบเพิ่มเติมได้หรือไม่?

2
เครือข่ายประสาทกำเริบคืออะไร?
อย่างแปลกใจที่เรื่องนี้ไม่ได้ถามมาก่อนอย่างน้อยฉันก็ไม่พบอะไรนอกจากคำถามที่เกี่ยวข้องอย่างคลุมเครือ ดังนั้นเครือข่ายประสาทกำเริบคืออะไรและสิ่งที่เป็นข้อได้เปรียบของพวกเขามากกว่า NNs ปกติ?

4
รูปแบบที่มีศักยภาพในการแทนที่เครือข่ายประสาทในอนาคตอันใกล้คืออะไร?
มีแบบจำลองที่เป็นไปได้ที่มีศักยภาพในการแทนที่โครงข่ายประสาทเทียมในอนาคตอันใกล้นี้หรือไม่? และเราต้องการมันด้วยหรือไม่ อะไรคือสิ่งที่แย่ที่สุดเกี่ยวกับการใช้โครงข่ายประสาทเทียมในแง่ของประสิทธิภาพ?

2
วิธีการฝึกอบรม chatbot
ฉันต้องการที่จะเริ่มการทดลองกับเครือข่ายประสาทและเป็นปัญหาของเล่นฉันต้องการฝึกอบรมหนึ่งเพื่อแชทเช่นใช้บอทแชทเช่น cleverbot ไม่ฉลาดเท่าไร ฉันมองไปรอบ ๆ เพื่อดูเอกสารบางอย่างและฉันพบว่าบทช่วยสอนทั่วไปเกี่ยวกับงานทั่วไป สิ่งที่ฉันค้นพบเพียงแค่เปิดเผยผลลัพธ์โดยไม่ให้ข้อมูลเชิงลึกเกี่ยวกับการใช้งาน สิ่งที่ทำทำมันค่อนข้างตื้น (หน้าเอกสารคู่มือเทนเซอร์ไหลใน seq2seq ขาด imho) ตอนนี้ฉันรู้สึกว่าฉันอาจเข้าใจหลักการมากกว่าหรือน้อยกว่า แต่ฉันไม่แน่ใจและฉันก็ไม่แน่ใจด้วยว่าจะเริ่มอย่างไร ดังนั้นฉันจะอธิบายว่าฉันจะจัดการกับปัญหาได้อย่างไรและฉันต้องการคำติชมเกี่ยวกับวิธีการแก้ปัญหานี้โดยบอกฉันว่าฉันเข้าใจผิดตรงไหนและอาจมีลิงค์ไปยังคำอธิบายโดยละเอียดและความรู้เชิงปฏิบัติเกี่ยวกับกระบวนการ ชุดข้อมูลที่ฉันจะใช้สำหรับงานนี้คือการถ่ายโอนข้อมูลประวัติการใช้งาน Facebook และ Whatsapp ทั้งหมดของฉัน ฉันไม่รู้ว่ามันจะใหญ่แค่ไหน แต่อาจจะยังไม่ใหญ่พอ ภาษาเป้าหมายไม่ใช่ภาษาอังกฤษดังนั้นฉันจึงไม่รู้จะรวบรวมตัวอย่างการสนทนาที่มีความหมายได้อย่างรวดเร็ว ฉันจะสร้างเวกเตอร์ที่คิดจากแต่ละประโยค ยังไม่รู้ความจริง ฉันพบตัวอย่างที่ดีสำหรับ word2vec บนเว็บไซต์ deeplearning4j แต่ไม่มีสำหรับประโยค ฉันเข้าใจว่าคำว่าเวกเตอร์ถูกสร้างขึ้นอย่างไรและทำไม แต่ฉันไม่สามารถหาคำอธิบายที่ครบถ้วนสมบูรณ์สำหรับเวกเตอร์ประโยคได้ การใช้เวกเตอร์ความคิดเป็นอินพุตและเอาต์พุตฉันจะฝึกโครงข่ายประสาท ฉันไม่รู้ว่ามันควรมีกี่เลเยอร์และอันไหนต้องเป็นเลเยอร์ lstm จากนั้นควรมีโครงข่ายใยประสาทเทียมอื่นที่สามารถแปลงเวกเตอร์คิดเป็นลำดับของอักขระที่เขียนประโยค ฉันอ่านว่าฉันควรใช้การขยายเพื่อชดเชยความยาวประโยคที่แตกต่างกัน แต่ฉันพลาดวิธีเข้ารหัสอักขระ (codepoints เพียงพอหรือไม่)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.