ฉันสงสัยว่าจะฝึกโครงข่ายประสาทสำหรับเกมกระดานแบบกลมเช่นโอเอกซ์หมากรุกความเสี่ยงหรือเกมอื่น ๆ การเคลื่อนย้ายครั้งต่อไปโดยการอนุมานนั้นค่อนข้างตรงไปตรงมาโดยป้อนสถานะของเกมเป็นอินพุตและใช้เอาต์พุตเป็นตัวย้ายสำหรับผู้เล่นปัจจุบัน อย่างไรก็ตามการฝึกอบรม AI เพื่อจุดประสงค์นั้นดูเหมือนจะไม่ตรงไปตรงมาเพราะ:
- อาจไม่มีการจัดเรตถ้าการย้ายครั้งเดียวทำได้ดีหรือไม่ดังนั้นการฝึกท่าเดียวจะไม่เป็นทางเลือกที่เหมาะสม
- การใช้สถานะเกม (อินพุต) และการเคลื่อนไหว (เอาท์พุต) ของเกมทั้งหมดเพื่อฝึกอบรมเครือข่ายประสาทดูเหมือนจะไม่ใช่ตัวเลือกที่ถูกต้องเนื่องจากการเคลื่อนไหวภายในเกมที่หายไปอาจไม่ดีนัก
ดังนั้นฉันจึงสงสัยว่าจะฝึกโครงข่ายประสาทเทียมสำหรับเกมกระดานแบบกลมได้อย่างไร ฉันต้องการสร้างเครือข่ายประสาทเทียมสำหรับโอเอกซ์โดยใช้เมตริกซ์