ฉันสนใจ(ลึก) เสริมสร้างการเรียนรู้ (RL) ก่อนลงดำน้ำในสาขานี้ฉันควรเรียนในGame Theory (GT)หรือไม่?
วิธีGTและRLเกี่ยวข้อง?
ฉันสนใจ(ลึก) เสริมสร้างการเรียนรู้ (RL) ก่อนลงดำน้ำในสาขานี้ฉันควรเรียนในGame Theory (GT)หรือไม่?
วิธีGTและRLเกี่ยวข้อง?
คำตอบ:
ในการเสริมการเรียนรู้ (RL) เป็นเรื่องปกติที่จะจินตนาการถึงกระบวนการตัดสินใจมาร์คอฟ (MDP) พื้นฐาน จากนั้นเป้าหมายของ RL คือการเรียนรู้นโยบายที่ดีสำหรับ MDP ซึ่งมักระบุเพียงบางส่วนเท่านั้น MDP สามารถมีวัตถุประสงค์ที่แตกต่างกันได้เช่นยอดรวมค่าเฉลี่ยหรือรางวัลลดราคาโดยที่ส่วนลดที่ได้รับเป็นข้อสันนิษฐานที่พบบ่อยที่สุดสำหรับ RL มีการขยายการเรียนรู้ของ MDP ที่ดีต่อผู้เล่นสองคน (เช่นเกม) การตั้งค่า; เห็นเช่น
Filar, Jerzy และ Koos Vrieze กระบวนการตัดสินใจของมาร์คอฟที่สามารถแข่งขันได้ Springer Science & Business Media, 2012
มีทฤษฎีพื้นฐานที่ใช้ร่วมกันโดย MDPs และส่วนขยายของพวกเขาไปยังเกมสองผู้เล่น (zero-sum) รวมถึงเช่นทฤษฎีบทจุดคงที่ Banach, การวนซ้ำของค่า การเชื่อมต่ออย่างใกล้ชิดระหว่าง MDP (และ RL) และประเภทของเกมเฉพาะเหล่านี้:
ทฤษฎีเกมค่อนข้างมีส่วนร่วมในบริบทของการเรียนรู้การเสริมแรงแบบหลายตัวแทน (MARL)
ลองดูที่เกมสุ่มหรืออ่านบทความการวิเคราะห์ Stochastic ทฤษฎีเกมสำหรับ Multiagent เสริมสร้างการเรียนรู้
ฉันไม่เห็นว่า GT เป็นข้อกำหนดเบื้องต้นสำหรับ RL อย่างไรก็ตามมันให้ส่วนขยายที่ดีกับตัวพิมพ์หลายตัว
RL: เอเจนต์เดียวได้รับการฝึกฝนให้แก้ปัญหาการตัดสินใจมาร์คอฟ (MDPS) GT: เจ้าหน้าที่สองคนผ่านการฝึกอบรมเพื่อแก้ปัญหาเกม การเรียนรู้การเสริมแรงแบบหลายเอเจนต์ (MARL) สามารถใช้แก้ปัญหาสำหรับเกมสุ่ม
หากคุณสนใจแอปพลิเคชันตัวแทนเดียวของ RL ในการเรียนรู้อย่างลึกซึ้งคุณไม่จำเป็นต้องไปเรียนหลักสูตร GT ใด ๆ สำหรับตัวแทนสองคนขึ้นไปคุณอาจจำเป็นต้องรู้เทคนิคของเกมในทางทฤษฎี