หนังสือเกี่ยวกับการเสริมแรงการเรียนรู้


10

ฉันพยายามทำความเข้าใจการเรียนรู้การเสริมแรงมานานแล้ว แต่อย่างใดฉันไม่สามารถจินตนาการวิธีการเขียนโปรแกรมสำหรับการเรียนรู้การเสริมแรงเพื่อแก้ปัญหาโลกกริด คุณช่วยแนะนำหนังสือเรียนซึ่งจะช่วยสร้างแนวความคิดที่ชัดเจนของการเรียนรู้เสริมแรงได้ไหม?



โปรดอ้างอิงถึง openai เป็นสถานที่ที่ดีในการเรียนรู้การเสริมแรงการเรียนรู้จากงูใหญ่โดยทั่วไป
Vineet Kothari

คำตอบ:


7

ที่นี่คุณมีข้อมูลอ้างอิงที่ดีเกี่ยวกับการเรียนรู้การเสริมแรง:

คลาสสิก

Sutton RS, Barto AG การเรียนรู้การเสริมแรง: การแนะนำ Cambridge, Mass: หนังสือแบรดฟอร์ด; พ.ศ. 2541 322 หน้า

ร่างสำหรับรุ่นที่สองมีให้บริการฟรี: http://incompleteideas.net/book/the-book-2nd.html

รัสเซล / นอร์วิคบทที่ 21:

Russell SJ, Norvig P, Davis E. ปัญญาประดิษฐ์: วิธีการที่ทันสมัย อัปเปอร์แซดเดิลริเวอร์, นิวเจอร์ซีย์: Prentice Hall; 2010

ทางเทคนิคเพิ่มเติม

Szepesvári C. อัลกอริทึมสำหรับการเรียนรู้การเสริมแรง การสังเคราะห์การบรรยายเรื่องปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง 2010 4 (1): 1-103 http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP การเขียนโปรแกรมแบบไดนามิกและการควบคุมที่เหมาะสมที่สุด ฉบับที่ 4 Belmont, Mass.: Athena Scientific; พ.ศ. 2550 1270 ตอนที่ 6, vol 2 มีให้ฟรี: http://web.mit.edu/dimitrib/www/dpchapter.pdf

สำหรับการพัฒนาล่าสุด

Wiering M, Van Otterlo M, บรรณาธิการ เสริมการเรียนรู้ เบอร์ลิน, ไฮเดลเบิร์ก: สปริงเกอร์เบอร์ลินไฮเดลเบิร์ก; 2012พร้อมใช้งานจาก: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, JP, Reynolds HJD, Thornton JR, et al. การตัดสินใจภายใต้ความไม่แน่นอน: ทฤษฎีและการประยุกต์ 1 ฉบับ Cambridge, Massachusetts: The MIT Press; 2558. 352 น.

การเรียนรู้การเสริมแรงแบบหลายตัวแทน

Buşoniu L, Babuška R, Schutter BD การเรียนรู้การเสริมแรงหลายตัวแทน: ภาพรวม ใน: Srinivasan D, Jain LC, บรรณาธิการ นวัตกรรมในระบบและแอพพลิเคชั่นหลายตัวแทน - 1. ไฮเดลเบิร์กสปริงเกอร์เบอร์ลิน; พ. ศ. 2553 183-221 วางจำหน่ายจาก: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

ชวาร์ตษ์ HM การเรียนรู้เครื่องหลายตัวแทน: วิธีการเสริมแรง โฮโบเคนมลรัฐนิวเจอร์ซีย์: ไวลีย์; 2014

วิดีโอ / หลักสูตร

ฉันขอแนะนำหลักสูตร David Silver ใน YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


7

มีหลักสูตรออนไลน์ฟรีเกี่ยวกับการเสริมแรงการเรียนรู้โดย Udacity ตรวจสอบ: การเรียนรู้ของเครื่อง: การเรียนรู้เสริม


น่ากล่าวถึงว่าปัญหาโลกกริดถูกนำเสนอเป็นส่วนหนึ่งของหลักสูตรนั้น
Neil Slater

ใช่ได้เห็นแล้ว แต่ไม่เพียงพอที่จะเขียนรหัสเดียวกัน
girl101

4

ฉันสนุกกับReinforcement Leraning: การแนะนำโดย Richard Sutton มันให้มุมมองการรวมที่ดีมากใน RL แม้ว่าจะไม่ได้กล่าวถึงแนวทางใหม่ล่าสุด (จากปี 1998)


ที่จริงผมอยากจะเห็นปัญหาตารางโลกถูกแก้ไขโดยการคำนวณบนปากกาและกระดาษเพราะที่จะช่วยให้ฉันเข้าใจแนวคิดเว้นแต่ฉันสามารถเข้าใจแนวคิดฉันไม่สามารถรหัส (พิเศษค่าซ้ำ)
girl101

1

คุณสามารถตรวจสอบหนังสือของฉัน - การเรียนรู้การเสริมแรงด้วย Pythonซึ่งอธิบายการเรียนรู้การเสริมแรงจากศูนย์จนถึงขั้นสูงของอัลกอริทึมการเรียนรู้การเสริมแรงแบบล้ำลึก

รหัสทั้งหมดพร้อมกับคำอธิบายมีอยู่แล้วใน repo GitHub ของฉัน https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.