ใช่. มันเป็นไปได้
ภาพรวมของคำถาม
เป้าหมายการออกแบบของระบบดูเหมือนว่าจะได้รับความได้เปรียบเชิงกลยุทธ์ที่ชนะโดยการใช้หนึ่งหรือมากกว่าเครือข่ายเทียมร่วมกับเครื่องยนต์เล่นการ์ดเกม
คำถามที่แสดงให้เห็นถึงการรับรู้ทั่วไปของพื้นฐานของเกมเล่นตามที่ระบุในและ Morgenstern ฟอน Neuman ของทฤษฎีเกม
- ที่จุดที่เฉพาะเจาะจงในระหว่างการเล่นเกมผู้เล่นอาจจะต้องดำเนินการย้าย
- มีชุดตัวเลือกการย้ายที่ จำกัด ตามกฎของเกม
- กลยุทธ์บางอย่างสำหรับการเลือกการย้ายสร้างระเบียนที่ชนะสูงกว่าการเล่นเกมหลายเกมกว่ากลยุทธ์อื่น ๆ
- เครือข่ายประดิษฐ์สามารถใช้ในการสร้างกลยุทธ์การเล่นเกมที่ได้รับชัยชนะบ่อยครั้งกว่าการเลือกย้ายแบบสุ่ม
คุณสมบัติอื่น ๆ ของการเล่นเกมอาจหรืออาจไม่ชัดเจน
- ในแต่ละจุดย้ายจะมีสถานะของเกมซึ่งจำเป็นสำหรับองค์ประกอบใด ๆ ที่เกี่ยวข้องในการปรับปรุงความสำเร็จในการเล่นเกม
- นอกเหนือจากการไม่ทราบว่าฝ่ายตรงข้ามจะป้านในเกมไพ่แล้วคำสั่งลับของไพ่แบบสับสามารถแนะนำผู้เล่นเสมือนที่เทียบเท่ากับการเคลื่อนไหวของการสุ่ม
- ในเกมผู้เล่นตั้งแต่สามเกมขึ้นไปการส่งสัญญาณของคู่ค้าหรือพันธมิตรที่มีศักยภาพสามารถเพิ่มองค์ประกอบของความซับซ้อนเพื่อกำหนดกลยุทธ์ของเกมที่ชนะได้ทุกจุด จากการแก้ไขมันไม่ได้ดูเหมือนว่าเกมนี้มีความซับซ้อนเช่นนั้น
- ปัจจัยทางจิตวิทยาเช่นการข่มขู่ยังสามารถมีบทบาทในการชนะการเล่นเกม ไม่ทราบว่าเครื่องยนต์นำเสนอใบหน้าแก่คู่ต่อสู้หรือไม่ดังนั้นคำตอบนี้จะข้ามไป
คำแนะนำวิธีการทั่วไป
มีวิธีการทั่วไปในการแมปทั้งอินพุตและเอาต์พุต แต่มีมากเกินกว่าที่จะอธิบายได้ในคำตอบสแต็ก Exchange นี่เป็นเพียงหลักการพื้นฐานเล็กน้อย
- ควรทำโมเดลทั้งหมดที่สามารถทำได้อย่างชัดเจน ตัวอย่างเช่นแม้ว่าเน็ตเทียมสามารถเรียนรู้วิธีการนับไพ่ในทางทฤษฎี (การติดตามตำแหน่งที่เป็นไปได้ของแต่ละการ์ด) อัลกอริทึมการนับง่าย ๆ สามารถทำได้ดังนั้นใช้อัลกอริทึมที่รู้จักและป้อนผลลัพธ์เหล่านั้นลงในเครือข่ายเทียม อินพุต
- ใช้เป็นอินพุตข้อมูลใด ๆ ที่สัมพันธ์กับเอาต์พุตที่ดีที่สุด แต่อย่าใช้เป็นอินพุตข้อมูลใด ๆ ที่ไม่สามารถสัมพันธ์กับเอาต์พุตที่ดีที่สุด
- เข้ารหัสข้อมูลเพื่อลดความซ้ำซ้อนในเวกเตอร์อินพุตทั้งในระหว่างการฝึกและในระหว่างการเล่นเกมอัตโนมัติ นามธรรมและการวางนัยทั่วไปเป็นสองวิธีทั่วไปในการบรรลุเป้าหมายนี้ การแยกคุณสมบัติสามารถใช้เป็นเครื่องมือในการสรุปหรือสรุป สามารถทำได้ทั้งอินพุตและเอาต์พุต ตัวอย่างคือถ้าในเกมนี้ J> 10 ในลักษณะเดียวกับ A> K, K> Q, Q> J และ 10> 9 แล้วเข้ารหัสไพ่เป็นจำนวนเต็มตั้งแต่ 2 ถึง 14 หรือ 0 ถึง 12 โดย ลบหนึ่ง เข้ารหัสชุดให้เป็น 0 ถึง 3 แทนที่จะเป็นสตริงข้อความสี่ชุด
การรับรู้ภาพนั้นเกี่ยวข้องกับระยะไกลเท่านั้นแตกต่างจากการเล่นเกมการ์ดโดยตรงหากคุณไม่จำเป็นต้องจดจำการ์ดจากภาพภาพในกรณีนี้ LSTM อาจจำเป็นต้องใช้เพื่อดูว่าผู้เล่นคนอื่นเลือกอะไรสำหรับการเคลื่อนไหว การเรียนรู้กลยุทธ์ที่ชนะจะได้รับประโยชน์มากกว่าจากการออกแบบ MLP หรือ RNN หรือหนึ่งในการออกแบบเครือข่ายงานประดิษฐ์
สิ่งที่เครือข่ายประดิษฐ์จะทำและตัวอย่างการฝึกอบรม
บทบาทหลักของเครือข่ายประดิษฐ์ประเภทนี้คือการเรียนรู้ฟังก์ชั่นจากข้อมูลตัวอย่าง หากคุณมีลำดับการย้ายของเกมจริง ๆ นั่นเป็นทรัพย์สินที่ยอดเยี่ยมสำหรับโครงการของคุณ จำนวนมากของพวกเขาจะเป็นประโยชน์อย่างมากสำหรับการฝึกอบรม
วิธีที่คุณจัดเรียงตัวอย่างและวิธีที่คุณติดป้ายกำกับนั้นเป็นสิ่งที่ควรพิจารณา แต่หากไม่มีกฎของเกมไพ่มันเป็นเรื่องยากที่จะกำหนดทิศทางที่เชื่อถือได้ ไม่ว่าจะมีคู่ค้าไม่ว่าจะเป็นคะแนนหรือไม่ก็ตามจำนวนการย้ายไปสู่ชัยชนะและปัจจัยอื่น ๆ อีกมากมายที่ให้พารามิเตอร์ของสถานการณ์ที่จำเป็นในการตัดสินใจ
ศึกษาต่อ
คำแนะนำหลักที่ฉันสามารถให้ได้คือการอ่านไม่ใช่บทความทั่วไปบนเว็บ แต่อ่านหนังสือและเอกสารที่คุณสามารถเข้าใจในหัวข้อข้างต้น จากนั้นหารหัสที่คุณสามารถดาวน์โหลดและลองใช้หลังจากคุณเข้าใจคำศัพท์ที่ดีพอที่จะรู้ว่าจะดาวน์โหลดอะไร
ซึ่งหมายความว่าการค้นหาหนังสือและการค้นหาเชิงวิชาการมีแนวโน้มที่จะนำคุณไปในทิศทางที่ถูกต้องมากกว่าการค้นหาเว็บทั่วไป มีปัญหาที่ตอบยากมากมายในพื้นที่เว็บทั่วไปอธิบายหลักการ AI ด้วยข้อผิดพลาดจำนวนมาก สำนักพิมพ์บทความและหนังสือมีความต้องการความขยันเนื่องจากผู้เขียน