การประยุกต์ใช้ MCTS / UCT


10

MCTS / UCTเป็นวิธีการค้นหาทรีเกมที่ใช้อัลกอริทึมโจรเพื่อเลือกโหนดที่มีแนวโน้มในการสำรวจ เกมจะเล่นจนจบแบบสุ่มและโหนดที่นำไปสู่การชนะมากขึ้นจะได้รับการสำรวจอย่างหนักมากขึ้น อัลกอริทึมโจรรักษาความสมดุลระหว่างการสำรวจโหนดที่มีอัตราการชนะสูงและการสำรวจโหนดที่ไม่รู้จัก (และในรูปแบบที่บริสุทธิ์ไม่จำเป็นต้องใช้ฟังก์ชั่นการประเมินแบบฮิวริสติก) โปรแกรมบนพื้นฐานของเทคนิคทั่วไปนี้ได้บรรลุผลที่น่ารักในคอมพิวเตอร์ไป

มีการใช้การค้นหา monte-carlo โดยใช้ bandit ในการแก้ไขปัญหาการค้นหาอื่น ๆ หรือไม่? ตัวอย่างเช่นมันจะเป็นวิธีที่มีประโยชน์ในการประมาณโซลูชันสำหรับ MAX-SAT, BKP หรือปัญหาการเพิ่มประสิทธิภาพ combinatorial อื่น ๆ หรือไม่ มีลักษณะเฉพาะของปัญหา (โครงสร้าง / สถิติ / ฯลฯ ) ที่จะแนะนำว่าแนวทางโจรจะมีประสิทธิภาพหรือไม่?

มีปัญหาเกี่ยวกับการกำหนดที่ทราบกันแล้วหรือไม่ซึ่งอาจต้านทานวิธีโจรโดยสิ้นเชิงเนื่องจากลักษณะของพื้นที่การแก้ปัญหา?

คำตอบ:


7

นี่ไม่ใช่คำตอบที่สมบูรณ์ แต่มีข้อสังเกตเบื้องต้นเกี่ยวกับการใช้สิ่งนี้กับ MAX-SAT

7/8x=0x=1x=0x=17/87/8

7/8NP7/8ฮิวริสติกที่คุณใช้แม้ว่าคุณจะคาดเดาได้อย่างสมบูรณ์แบบ แต่ก็ยังมีสูตรที่ไม่น่าพอใจที่การย้อนรอยจะสรุปได้ว่ามันไม่น่าพอใจหลังจากหลายขั้นตอนชี้แจง ขอบเขตที่ต่ำกว่าของความยาวของการพิสูจน์ความละเอียดให้ผลลัพธ์เหล่านี้ หนึ่งการอ้างอิงคือ:

Pavel Pudlák, Russell Impagliazzo: ขอบเขตล่างสำหรับอัลกอริทึม DLL สำหรับ k-SAT (เวอร์ชั่นเบื้องต้น) SODA 2000: 128-136


3

สำหรับคำถามที่ว่าคุณลักษณะใดที่ทำให้เกิดปัญหาคลาดเคลื่อนไปกับวิธีการยึดฐานโจรบทความนี้จะอธิบายพฤติกรรมของ UCT ในพื้นที่การค้นหาต่างๆ:

http://www.cs.cornell.edu/~raghu/Raghuram_Ramanujan_files/mcts11.pdf

ขอแสดงความนับถือคาเมรอน


2

กระดาษสำรวจล่าสุดนี้แสดงรายการการใช้ MCTS กับปัญหาการค้นหาและการเพิ่มประสิทธิภาพอื่น ๆ นอกเหนือจากเกมในหัวข้อ 7.8:

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

สำหรับโดเมนที่มีความทนทานต่อวิธีการที่ใช้โจรโดยสิ้นเชิงฉันไม่ได้ตระหนักถึงสิ่งใดเลย หมากรุกเป็นสิ่งที่มองข้ามจากวรรณกรรมของ MCTS อาจเป็นเพราะ "กับดัก" ที่ทำร้ายการค้นหา แต่ก็อาจเป็นเพราะความจริงที่ว่าผู้เล่นหมากรุกคอมพิวเตอร์เป็นเพียงการปรับให้เหมาะสมและดีในทุกวันนี้ว่าวิธีการใหม่ ๆ บุ๋มกับพวกเขา

ขอแสดงความนับถือคาเมรอน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.