การประเมิน Stockfish ที่ไม่ดี


15

นี่คือการศึกษา

NN - NN

อย่างที่คุณเห็น Stockfish ให้ชัยชนะอย่างเด็ดขาดสำหรับสีดำ

ลองดูด้วยตัวคุณเอง

c4 + เป็นท่าที่แพ้ในขณะที่ Ba4 + เป็นท่าที่ถูกต้อง

เกิดอะไรขึ้น? Stockfish ไม่ได้พิจารณาตำแหน่งที่ปิดอยู่เลยใช่ไหม


5
มีหลายตำแหน่งที่ Stockfish ไม่ได้ประเมินอย่างถูกต้อง (รวมถึง endgames ทั่วไปบางตัว)
Qudit

10
เกิดขึ้นตลอดเวลา! มันเป็นซอฟต์แวร์ชิ้นหนึ่งไม่ใช่พระเจ้า
David

4
มันจะทำให้ฉันมีความสุขมากที่ได้เห็นสถานการณ์ในหลอดเลือดดำคล้ายกันซึ่งประเมินผิดโดย AlphaZero หรือ Leela Zero!
leftaroundabout

1
@Qudit: ใช่ ฉันแค่ชี้ให้เห็นว่าคำถามควรเน้นไปที่เรื่องนี้อย่างแม่นยำแทนที่จะเริ่มจากตำแหน่งที่ได้รับ ขออภัยถ้าฉันไม่ได้ทำให้ชัดเจน
TonyK

3
@leftaroundabout misevaluates ลีลาป้อมปราการเวลาเช่นกันเช่นดูตอนท้ายของเกมนี้จาก TCEC Sufi นี้: cd.tcecbeta.club/archive.html?season=15&div=sf&game=31 ในความเป็นจริงเนื้อหา Leela misevaluates ยิ่งกว่า Stockfish เนื่องจากค่อนข้างบ่อยจะมี eval ไม่ใช่ศูนย์ในขณะที่ Stockfish stoically แสดง 0.00 และใช้เวลานานก่อนที่ Leela รู้ตัวว่าฝ่ายตรงข้ามไม่ยอมให้มันชนะ
Allure

คำตอบ:


25

Stockfish ไม่ใช่เกมเล่นหมากรุกที่สมบูรณ์แบบและคุณได้พบตำแหน่งที่ไม่สามารถบอกได้ว่าเป็นการจับสลาก (อย่างน้อยก็จนกว่ากฎการย้าย 50 ครั้งจะเริ่มขึ้นและช่วยในการตัด) ตำแหน่งเหล่านี้เรียกว่า " ป้อมปราการ " คุณสามารถบอกได้ว่าสิ่งนี้เกิดขึ้นเพราะแม้ว่าคุณจะป้อนวิธีการแก้ปัญหา Stockfish ยังคงประเมินตำแหน่งสุดท้ายเป็น -10 หรือมากกว่า ตำแหน่งป้อมปราการเหล่านี้ที่ Stockfish นั้นผิดพลาดนั้นมีอยู่ไม่มากและอยู่ไกล แต่มีอยู่จริงและนี่คือหนึ่งในนั้น

มีความพยายามหลายครั้งในการเขียนรหัสการตรวจจับป้อมปราการใน Stockfish และเครื่องมือทั่วไปอื่น ๆ ที่มีไว้เพื่อจดจำป้อมปราการและหยุดไม่ให้ Stockfish มุ่งหน้าไปหาพวกเขาหากตำแหน่งเหนือกว่า หากคุณมีความคิดที่ชาญฉลาดคุณสามารถเผยแพร่ในวารสารทางวิชาการ (ดูสิ่งพิมพ์ในหมากรุกโปรแกรมหมากรุกวิกิ)


11

มันช่วยให้เข้าใจว่าเครื่องยนต์ไม่ได้ไปตาม "กลยุทธ์" จริงๆเท่าที่พวกเขามองการเคลื่อนไหวหลายอย่างในอนาคตประเมินคะแนนของตำแหน่งและค้นหาชุดการเคลื่อนที่ที่เหมาะสมที่สุด

จุดอ่อนที่ยิ่งใหญ่ของวิธีการนี้คือหากไม่มีสิ่งใดสามารถเกิดขึ้นได้อย่างรวดเร็วเครื่องยนต์จะมีปัญหา สิ่งนี้เคยเป็นปัญหาใหญ่สำหรับ endgames หากคุณมี K + B + P เทียบกับ K + P คุณจะไม่แก้ไขตำแหน่งนั้นในการเคลื่อนไหวเพียงไม่กี่ครั้ง ดังนั้นการแก้ไขคือการเพิ่ม Endgame Tablebases ให้กับเอ็นจิ้น - เพียงแค่ทำการคำนวณตำแหน่ง endgame ล่วงหน้าทุกครั้งและเพิ่มมันเข้าไปในไลบรารีเพื่อให้เอ็นจิ้นใช้ (นี่คือเหตุผลว่าทำไมในแอปหมากรุกราคาถูกส่วนใหญ่คุณจะได้รับชัยชนะโดยการรอดชีวิตจาก endgame: เพราะมันไม่มี endbase tablebase)

แต่ตำแหน่งของคุณคือ (เข้าใจ) จะไม่อยู่ในฐานข้อมูลของเกม endgame ดังนั้นสต็อคฟิชจึงต้องเล่นหลายล้านตำแหน่งการยืด 10 หรือมากกว่านั้นก้าวไปสู่อนาคต ... เพียงเพื่อจะพบว่าในทุก ๆ ส่วนนั้นสีดำนั้นมีความสำคัญมาก แน่นอนว่ามันไม่สามารถเล่นออกได้ ~ 56 การเคลื่อนไหวสำหรับต้นไม้การตัดสินใจที่สมบูรณ์ - ซึ่งเป็นสิ่งที่ต้องพิจารณาเพื่อหาการจับฉลากที่ชัดเจน


0

คำตอบอื่น ๆ ครอบคลุมคำถามนี้ดี แต่เป็นที่น่าสนใจที่ไม่ใช่ทุกโปรแกรมที่ไม่เข้าใจว่านี่คือการวาด ฉันเสียบมันเข้ากับคอมพิวเตอร์ของฉันและในฐานะสมาชิก ChessBase Premium ฉันก็สามารถเข้าถึงเอ็นจิ้นคลาวด์ได้เช่นกัน

หนึ่งในบรรดาคลาวด์เอ็นจิ้นประเมินว่านี่เป็นการวาดอย่างฉับพลัน ฉันแค่หวังว่าจะมีข้อมูลมากกว่าเพียงแค่ "เครื่องมือใหม่"

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.