คำถามที่ดี.
สิ่งแรกและสำคัญที่สุดคือใน Go deepmind ไม่มีฝ่ายตรงข้ามเหนือมนุษย์ที่จะท้าทาย เครื่องยนต์ Go ไม่ได้อยู่ใกล้กับระดับสูงสุดของผู้เล่นระดับสูงของมนุษย์ ในหมากรุกอย่างไรก็ตามเครื่องยนต์มีคะแนน 500 ELO ที่แข็งแกร่งกว่าผู้เล่นระดับสูงของมนุษย์ นี่คือความแตกต่างอย่างมาก จำนวนของงานที่เข้าสู่เอ็นจิ้นหมากรุกร่วมสมัยกำลังส่าย เรากำลังพูดถึงการเขียนโปรแกรมเป็นล้าน ๆ ชั่วโมงการทำซ้ำหลายแสนครั้ง มันเป็นองค์ความรู้และการทำงานที่ยิ่งใหญ่ การเอาชนะและเหนือกว่าทั้งหมดนั้นใน 4 ชั่วโมงคือการส่าย
ประการที่สองมันไม่ได้ผลมากนักซึ่งเป็นที่น่าแปลกใจสำหรับนักเล่นหมากรุก แต่แทนที่จะเป็นวิธีที่ AlphaZero เล่นหมากรุก มันค่อนข้างน่าขันที่ระบบที่ไม่มีความรู้หรือความเชี่ยวชาญของมนุษย์เล่นเหมือนที่เราทำ เอ็นจิ้นมีชื่อเสียงในการเล่นท่าทางที่ดูน่าเกลียดผู้ที่ขาดความสามัคคี ฯลฯ มันยากที่จะอธิบายให้ผู้เล่นที่ไม่ใช่หมากรุก แต่มันมีสิ่งที่เรียกว่า AlphaZero ไม่เล่นแบบนี้เลย มันมีสไตล์ที่คล้ายมนุษย์มาก ๆ ซึ่งมันครองส่วนของฝ่ายตรงข้ามด้วยการเล่นเชิงกลยุทธ์อย่างลึกล้ำและการเสียสละตำแหน่งอันน่าทึ่ง AlphaZero เล่นในแบบที่เราปรารถนาโดยการรวมความเข้าใจเกี่ยวกับตำแหน่งที่ลึกเข้ากับความแม่นยำของการคำนวณเครื่องยนต์
แก้ไข
โอ้และฉันลืมพูดถึงบางสิ่งเกี่ยวกับผลลัพธ์เอง หากคุณไม่คุ้นเคยกับการเล่นหมากรุกคอมพิวเตอร์มันอาจดูไม่แปลก แต่ก็เป็นเช่นนั้น
ทุกวันนี้ขอบแห่งชัยชนะซึ่งแยกจากเครื่องยนต์ร่วมสมัยชั้นนำนั้นบางเฉียบ ในการแข่งขัน 100 เกมคุณคาดหวังว่าจะเห็นผลลัพธ์เช่น 85 เกมที่ถูกจับ 9 ชัยชนะและการสูญเสีย 6 อย่างเพื่อกำหนดกลไกที่ดีกว่า
อัลฟาเซโร่ชนะ 28 และ 72 เสมอโดยมีการสูญเสียเป็นศูนย์ถูกบดขยี้และไม่สามารถคิดได้อย่างสมบูรณ์จนถึงวินาทีที่มันเกิดขึ้น