กลไกคล้ายมนุษย์เพื่อการฝึกฝน


10

ฉันกำลังฝึกอบรมเกม endgame กับ LucasChess (LC) แต่ปัญหานั้นไม่ได้เกี่ยวข้องกับ LC แต่เป็นเครื่องมือหมากรุกทั่วไป

ฉันมีปัญหานี้: ดูภาพ เมื่อฉันย้าย Kh6 ในตำแหน่งนี้เครื่องยนต์ใน LC จะย้าย Ke8 นี่อาจเป็นการย้ายที่สีขาวต้องการการเคลื่อนไหวมากที่สุดจนกว่าจะผสมพันธุ์ตำแหน่ง: w: Kh5, Pg6, Pg4, b: Kf8, สีขาวที่จะย้าย

แต่มันก็เป็นการเคลื่อนไหวที่ทำให้สิ่งต่าง ๆ เป็นเรื่องง่ายสำหรับคนผิวขาว มันจะเป็นเรื่องยากสำหรับสีขาวถ้าดำจะย้าย Kg8 พยายามปิดกั้นโรงรับจำนำจนกว่ามันจะเป็นไปไม่ได้อีกต่อไปและอาจกระตุ้นย้ำ แทนที่จะปิดกั้นสีดำจะพุ่งไปที่ตรงกลาง

ฉันคิดว่าเครื่องยนต์เห็นว่าเมื่อหนีไปที่ใจกลางมันอาจเป็นเพื่อนใน 20 ปีและไม่หนีไปและพยายามปิดกั้นมันอาจเป็นคู่ใน 16 ดังนั้นจึงทำให้การเคลื่อนไหว "ดีที่สุด" ซึ่งระยะทางในการผสมพันธุ์ยาวที่สุด .

แต่นี่ไม่ใช่มนุษย์ที่ดีที่สุดอย่างการเคลื่อนไหว เพราะมันทำให้ง่ายขึ้นสำหรับคนขาวที่จะจำนำ มันล้างความเป็นไปได้ทั้งหมดสำหรับสีขาวเพื่อทำผิดพลาดและด้วยวิธีนี้มันจะเป็นส่วนสำคัญของผลการฝึกอบรม

ฉันได้เห็นพฤติกรรมนี้ในตอนจบจำนำเกือบทั้งหมดไม่เพียงแค่นี้ และในตอนจบอื่น ๆ

เอ็นจิ้นทั้งหมดที่ฉันพยายามแสดงให้เห็นถึงพฤติกรรมนี้ (Komodo, Stockfish, Gull, Gaviota, ผลไม้)

ดังนั้นคำถามของฉันคือ: คุณรู้จักเครื่องยนต์ฟรีหรือการตั้งค่าบางอย่างสำหรับเครื่องยนต์ที่เล่น endgames เหมือนมนุษย์พยายามที่จะบล็อก pawns ให้นานที่สุดเท่าที่จะทำได้แทนที่จะหนีไปที่ราชาหรือไม่

ปรับปรุง: konsolas พบเครื่องยนต์ (ลีลาหรือ LC0) ซึ่งถือว่าตำแหน่งที่กำหนดได้เป็นอย่างดีและอื่น ๆ ที่ครั้งแรกที่ผมได้รับการยอมรับคำตอบของเขาเป็นคำตอบ ในระหว่างที่ฉันทดสอบ Lc0 มากขึ้นและได้ข้อสรุปว่ามันไม่สามารถใช้งานได้อย่างสมบูรณ์สำหรับการฝึกอบรมการเล่นเกมเพราะมันเล่นตอนจบที่โหดร้ายที่สุด เมื่อยอมรับคำตอบฉันไม่สามารถจินตนาการได้เลยว่าเอ็นจิ้นการเล่นเกม endgames แย่มาก

ดังนั้นฉันต้องการที่จะชี้แจงคำถามของฉัน: คุณรู้ว่าเครื่องยนต์ฟรีหรือการตั้งค่าบางอย่างสำหรับเครื่องยนต์ที่มีการเคลื่อนไหว 1s หรือต่ำกว่าโดยไม่จำเป็นต้องมีการ์ดกราฟิกเล่น endgames เหมือนมนุษย์พยายามบล็อกเบี้ยให้นานที่สุดแทน หนีไปกับกษัตริย์ไปที่ศูนย์?

Lc0 ที่มีอวนปัจจุบันหรืออวนของ dkappe นั้นไม่ผ่านการรับรองเนื่องจากเกมเหล่านี้ส่วนใหญ่เล่นเกม endgames อย่างน่ากลัวและไม่เหมือนมนุษย์บนพีซีที่ไม่มีกราฟิกการ์ด และจากทุกสิ่งที่ฉันได้อ่านกราฟิกการ์ดจะไม่ช่วยในการเล่นเกม

อัปเดต 2: ฉันต้องการชี้แจงว่าไม่เพียง แต่ตำแหน่งด้านบน แต่ยังมีคนอื่นอีกมากมาย เอนจิ้นเล่นการเคลื่อนไหวซึ่งทำให้ระยะทางในการผสมพันธุ์ใหญ่ที่สุดโดยสมมติว่าการเล่นที่สมบูรณ์แบบของคู่ต่อสู้ ตัวอย่าง 8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9, ดูภาพที่สอง เอ็นจิ้นเล่น Kf3 ซึ่งทำให้เป็นเรื่องง่ายสำหรับว. วชิรสิ่งที่ B ควรเล่นคือ Kg1 และตอนนี้มันยากสำหรับ W ที่จะชนะ W ต้องรู้หรือพบว่าเขาต้องยอมให้บีเป็นราชินี8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9


2
ปัญหาเดียวกันนี้บางครั้งเกิดขึ้นเมื่อฝึกฝนกลวิธีเกี่ยวกับ lichess บ่อยครั้งที่เครื่องยนต์จะไม่เล่นการป้องกันการทดสอบมากที่สุดเช่นเดียวกับการเล่นที่ดีที่สุดมันด้อยกว่าการป้องกันที่หักล้างได้ง่าย
Qudit

1
ไม่มีความผิด ... แต่ 1.Kh6 Kg8 2.g7 นั้นค่อนข้างตรงไปตรงมา
Jossie Calderon

@ Jossie C .: ใช่ถ้าคุณรู้ประเภทของตำแหน่งถ้าคุณรู้ว่าการดึงนั้นซ่อนอยู่หลังมุม แต่ในตำแหน่งที่คล้ายกัน (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8/8/8/8/8/8/8/8/8/8/8 - 8 2 Kg8 จะเปิดโอกาสให้ White ทำผิด g5 ได้หรือไม่? ด้วยการดึง หากคุณรู้ตำแหน่งที่ดีคุณจะไม่ทำผิดพลาด ... แต่คุณก็ไม่จำเป็นต้องฝึกท่าแบบนี้ แต่ถ้าคุณชอบฝึกตำแหน่งนี้และคุณจะไม่วิ่งเข้ามาระหว่างการฝึกคุณไม่ได้เรียนรู้อะไรมากมาย ยิ่งแย่ไปกว่านั้น จากนั้นคุณได้เรียนรู้ว่าไม่มีอะไรที่ต้องระวังที่นี่
Wickie

ภาคผนวก: (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8 วัตต์ - - 2 2) ไม่ใช่ POS ที่คล้ายกันมันเป็น POS ดั้งเดิมของฉัน
Wickie

1
วิธีหนึ่งในการ 'แก้ปัญหา' ปัญหานี้คือการบังคับให้คอมพิวเตอร์หยุดค้นหาที่ระดับความลึกเพียงเล็กน้อยกว่าระดับความลึกการค้นหาที่มีประสิทธิภาพของคุณเองเล็กน้อย ด้วยวิธีนี้จะไม่น่าพลาดสิ่งที่คุณเห็น แต่จะไม่ย้ายด้วยเหตุผลเท่านั้นที่สามารถมองเห็น
user21820

คำตอบ:


5

เอนจิ้นอัลฟ่าเบต้าในตำแหน่ง endgame หลายแห่งจะหาคู่ได้อย่างรวดเร็วและดังนั้นจะเลือกย้ายที่ยืดคู่สำหรับยาวที่สุด

เครื่องมือที่ใช้ Monte Carlo Tree Search เลือกแถวที่มีโอกาสชนะ / วาดมากที่สุด ตัวอย่างเช่นLc0ซึ่งเป็นเอ็นจิ้นเครือข่ายประสาทที่ใช้ MCTS แนะนำ Kg8 ตามที่คุณต้องการในตำแหน่งของคุณ:

NN - NN
1 ... Kg8 2. Kh6 Kh8 3. Kg5 Kg7 4. Kf5 Kg8 5. Kf6 Kf8

Lc0 ไม่ได้เล่นเกม endgames เช่นเดียวกับเอนจิ้น alpha-beta แต่มันมีแนวโน้มที่จะเล่นในลักษณะที่เป็นมนุษย์มากกว่า

ฉันขอแนะนำให้ดูที่ Komodo 12 MCTS ซึ่งอาจแสดงพฤติกรรมประเภทนี้เช่นกัน


อันที่จริงฉันได้เพิ่ม Lc0 ด้วยน้ำหนัก 36089 และมันเล่นเกม endgames นั้นดีกว่าเครื่องมืออื่น ๆ ที่ฉันเคยลอง (และฉันลองอีกหลายสิบครั้ง) ในทางกลับกันก็ไม่ทราบวิธีการผสมพันธุ์กับ KQ-Q ดังนั้นจึงอาจไม่ใช่เครื่องมือที่ดีที่สุดสำหรับการฝึกอบรมการเล่นเกม อย่างไรก็ตามคำถามเดิมของฉันได้รับคำตอบแล้ว
Wickie

1
@ วิคกี้ KQ-Q คืออะไร?
Pedro A

@Pedro KQ-Q เป็นข้อผิดพลาดข้างฉัน ฉันหมายถึง KQ-K ราชาและราชินีต่อต้านกษัตริย์
Wickie

2
คุณกำลังพูดเรื่องอะไรอยู่? ลีลาสามารถผสมพันธุ์ 100% ของเวลาด้วย KQ กับ K มันสามารถทำสิ่งนี้ได้นานกว่าหนึ่งปี: docs.google.com/spreadsheets/d/?hl=th
NoseKnowsAll

1
@NoseKnowsAll ใช่มันสามารถแต่งงานกับ KQ-K ได้อย่างสบาย ๆ ถ้าคุณมีประสาทที่ต้องรอ 30 การเคลื่อนไหวหรือนานกว่านั้น อย่างน้อยด้วยการกำหนดค่าของฉัน (ไม่มีกราฟิกการ์ด, 1 วินาทีเคลื่อนไหว, core duo cpu 2.4 GHz), อวนทั้งหมดที่ฉันได้ลองเล่นอย่างน่ากลัวในเกม endgame ฉันเป็นตะคริวที่ท้องโดยดูที่พวกเขา ฉันลอง 36089 และ dkappes เครือข่ายกลั่น 11258-48x5, 11258-64x6 และ 11258-80x7
Wickie

1

Freechess.org มีบอทชื่อว่า endgamebot ที่คุณสามารถเล่นได้

มันรู้ถึง endgames 6 คน


3
แต่มันเล่นเหมือนมนุษย์ซึ่งเป็นคำถามของ OP หรือไม่?
Glorfindel

@Glorfindel: ใช่
Jossie Calderon

@ Jossie Calderon: ฉันต้องการที่จะลอง ฉันมีบัญชี fics และ BabasChess ฉันจะฝึกตำแหน่งที่แน่นอนด้วยบอทนี้ได้อย่างไร ( ช่วยบอต หรือ ช่วย endgamebotไม่มีผลลัพธ์)
Wickie

@ Jossie Calderon: ฉันได้พบตัวเองแล้วบอกความช่วยเหลือ endgamebot
Wickie

2
@ Jossie Calderon: มันไม่ได้ :-( หลังจากวันที่ 1 Kh6, Kg8 เปิดความเป็นไปได้สำหรับความผิดพลาด g5 สีขาวด้วยการดึง endgamebot เล่น Ke7 ที่นั่นโดยทั่วไปหนีไปที่ศูนย์
Wickie

0

มันขึ้นอยู่กับโปรแกรมหมากรุกที่ใช้ LC ตอนนี้เอ็นจิ้นเล่นคล้ายกันมากกับการเคลื่อนไหวของมนุษย์ดาวน์โหลด stockfish 9 และแนบ LC คุณจะเล่นในสิ่งที่เขาเล่น นอกจากนี้ยังมีจุดสำคัญอีกจุดหนึ่งบางครั้งแอพการฝึกอบรมใช้การเคลื่อนไหวในตัวเพื่อเล่นด้วยดังนั้นต้องแน่ใจว่าเอนจิ้นกำลังเล่นอยู่และไม่เพียงแค่ตอบการเคลื่อนไหวจากสัญกรณ์


ฉันได้ลองใช้เครื่องมือมากมายใน LC แล้วทุกคนก็แสดงพฤติกรรมของราชาผู้หลบหนี นอกเหนือจาก Leela หรือ Lc0 ซึ่งมีข้อบกพร่องอื่น ๆ
Wickie
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.