เครื่องจักรที่ทรงพลังในการเอาชนะแชมป์ผู้เล่นโป๊กเกอร์เมื่อเร็ว ๆ นี้มีพลังแค่ไหน?
เครื่องจักรที่ทรงพลังในการเอาชนะแชมป์ผู้เล่นโป๊กเกอร์เมื่อเร็ว ๆ นี้มีพลังแค่ไหน?
คำตอบ:
จากกระดาษ Deep Stack :
นี่ดูเหมือนจะเป็นการฝึกอบรม:
สำหรับเครือข่ายเทิร์นเนอร์มีการเปิดสิบล้านสถานการณ์โป๊กเกอร์ (จากหลังจากแจกไพ่เทิร์นการ์ด) ถูกสร้างและแก้ไขด้วยแกนประมวลผล 6,144 คอร์ของกลุ่มการวิจัย Calcul Quebec MP2 โดยใช้เวลาในการคำนวณมากกว่า 175 ปี สำหรับเครือข่ายฟลอพจะมีการสร้างและแก้ไขสถานการณ์ฟลอพโป๊กเกอร์หนึ่งล้าน (จากหลังจากแจกฟล็อปฟล็อตการ์ด) สถานการณ์เหล่านี้ได้รับการแก้ไขโดยใช้ตัวแก้ข้อ จำกัด เชิงลึกของ DeepStack ด้วยเทิร์นเน็ตเวิร์กที่ใช้สำหรับค่าของการต่อต้านการปลอมแปลงที่รัฐสาธารณะทันทีหลังจากเทิร์นการ์ด เราใช้กลุ่มของ 20 GPUS และครึ่งหนึ่งของเวลาคำนวณปี GPU สำหรับเครือข่ายเสริมนั้นมีการสร้างสถานการณ์สิบล้านรายการและได้รับค่าเป้าหมายโดยการแจกแจงจำนวน flops ที่เป็นไปได้ทั้งหมด 22,100 รายการและเฉลี่ยค่า counterfactual จากเอาต์พุตเครือข่ายของ flop
และนี่สำหรับการเล่นจริง:
การคำนวณการคำนวณซ้ำและการประเมินโครงข่ายประสาทเทียมนั้นนำมาใช้ใน Torch7 (53) และรันบนการ์ดกราฟิก NVIDIA GeForce GTX 1080 การ์ดเดียว
สำหรับการเปรียบเทียบ: AlphaGo รุ่นแจกจ่ายใช้ 1.920 CPUs และ 280 GPUs ให้ทำงาน