คำถามติดแท็ก reinforcement-learning

2
การเขียนโปรแกรมบรรทัดต่อไปนี้หุ่นยนต์ด้วยการเรียนรู้การเสริมแรง
ฉันกำลังพิจารณาการเขียนโปรแกรมบรรทัดต่อไปนี้หุ่นยนต์โดยใช้อัลกอริทึมเสริมการเรียนรู้ คำถามที่ฉันครุ่นคิดคือฉันจะหาอัลกอริทึมเพื่อเรียนรู้การนำทางผ่านเส้นทางใด ๆ ได้อย่างไร? หลังจากที่ได้ติดตามSutton & Barto Bookเพื่อเรียนรู้การเสริมแรงฉันได้แก้ปัญหาการออกกำลังกายที่เกี่ยวข้องกับสนามแข่งที่ตัวแทนรถเรียนรู้ที่จะไม่ออกนอกเส้นทางและควบคุมความเร็ว อย่างไรก็ตามปัญหาการออกกำลังกายนั้นมีตัวแทนให้เรียนรู้วิธีการติดตามเส้นทางที่ฝึกมา มันอยู่ในขอบเขตของการเรียนรู้การเสริมกำลังเพื่อให้หุ่นยนต์นำทางไปตามเส้นทางที่กำหนดหรือไม่? ไม่ตัวแทนอย่างต้องมีแผนที่ของวงจรการแข่งขันหรือเส้นทางหรือไม่? ฉันสามารถใช้พารามิเตอร์อะไรในพื้นที่ของรัฐได้บ้าง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.