Ai: การเรียนรู้กับการวางกลยุทธ์


16

ฉันมีทฤษฎีเกี่ยวกับ AI ที่ฉันต้องการจะเขียน "whitepaper" เกี่ยวกับ ความแตกต่างที่ฉันต้องการสำรวจใน AI คือการเรียนรู้และการวางกลยุทธ์ คำถามของฉันคือฉันจะอ่านเนื้อหาอื่นเกี่ยวกับเรื่องนี้ได้ที่ไหน

ขอยกตัวอย่างหมากรุก เรามาดูหมากรุก AI ว่าเป็นต้นไม้ใหญ่ซึ่งการจับยูนิตศัตรูเพิ่มมูลค่าของหน่วยนั้นใน "คะแนนการเคลื่อนที่" สำหรับการตัดสินใจนั้น การจับตัวจำนำนั้นอาจจะมี 1 จุดอัศวิน 4 คะแนนตัวโกง 5 คะแนนเป็นต้น

การวางกลยุทธ์จะเป็นแบบ AI เพื่อใช้คะแนนเหล่านี้และกำหนดท่าต่อไป; เช่น. เมื่อมีการเคลื่อนไหวที่เป็นไปได้สิบแบบให้เลือกคะแนนที่ดีที่สุดเมื่อสิ้นสุดการเคลื่อนไหวสามครั้ง

การเรียนรู้จะใช้การสังเกตเชิงสถิติเพื่อกำหนดค่าเหล่านั้น หากคุณเล่นเกม 100 เกม AI อาจตัดสินว่าการจับตัวประกันคือ 2 คะแนนและอัศวินมีค่า 7 คะแนนในขณะที่เกมโกงมีค่าเพียง 3 คะแนนเท่านั้น (อิงจาก 100 เกม)

ความแตกต่างนี้มีอยู่ในวรรณคดีหรือไม่และถ้าเป็นเช่นนั้นฉันจะอ่านได้ที่ไหน

แก้ไข:ไม่มีใครรู้เกมหมากรุก (ที่มีซอร์สโค้ดดีกว่า) ที่ใช้วิธีการนี้หรือไม่? บางทีChess960 @ Home ?


3
เสียงเหมือนการผสมผสานของทฤษฎีเกมพร้อมกับ 'คะแนน' ที่ปรับให้เข้ากับการเรียนรู้ตามยุคสมัย
ชะลอตัวลง

คำตอบ:


15

สิ่งที่คุณเรียกว่าการวางกลยุทธ์มักเรียกว่าการค้นหาในชุมชน AI มันครอบคลุมอัลกอริทึมง่าย ๆ เช่น A * และDFSและวิธีการในการออกแบบฮิวริสติกสำหรับการค้นหาที่มีข้อมูลเช่น A *

สิ่งที่คุณเรียกการเรียนรู้ที่เรียกว่าการเรียนรู้เครื่องแบ่งออกเป็นการเรียนรู้ภายใต้การดูแล , การเรียนรู้ใกล้ชิดและเรียนรู้การเสริมแรง น่าจะเป็นพื้นที่ที่สำคัญที่สุดที่จะเป็นเกมที่โปรแกรมทางพันธุกรรม , เครือข่ายประสาทและการสนับสนุนเครื่องเวกเตอร์และเครือข่ายแบบเบย์ แต่การเรียนรู้ของเครื่องเป็นสิ่งที่ใหญ่โตและนี่เป็นเพียงชุดเล็ก ๆ ของเครื่องมือที่ใช้ศึกษา

หากคุณสนใจวิธีการ AI แบบต่าง ๆ ฉันขอแนะนำให้คุณใช้หนังสือเรียนจริงเช่นAI: A Modern Approachแทนที่จะอ่าน Wikipedia


1
+1 สำหรับแนวทางที่ทันสมัย หนังสือที่ยอดเยี่ยม แม้ว่าฉันไม่เห็นด้วยกับประโยชน์ของเครือข่ายประสาทเทียมในเกม (แถบขาวดำ)
Ray Dey

ฉันไม่ได้บอกว่ามันมีประโยชน์ แต่สำคัญ พวกมันถูกใช้ในหลาย ๆ เกมและเทคนิค AI มากมายนั้นอิงกับพวกมันหรือเปรียบเทียบกับพวกมัน ซึ่งต่างจากเทคนิคการจัดกลุ่มข้อมูลซึ่งฉันใช้บ่อยอย่างไม่น่าเชื่อ แต่ฉันไม่คิดว่าฉันจะเห็นอะไรที่ซับซ้อนเกินกว่าความแปรปรวนแบบ k ในเกม

นั่นยุติธรรมพอฉันยอมรับว่าพวกเขาเป็นพื้นที่ที่เหมาะสมที่สุดในการเล่นเกม แต่พวกเขาต้องการงานนิดหน่อย
Ray Dey

มีวิธีที่สาม (หรือ "การวางกลยุทธ์") ที่เรียกว่า Expert Systems ซึ่งโดยทั่วไปคุณจะพบอัลกอริทึมแบบอิงกฏซึ่งอาจไม่ต้องการแผนผังการค้นหาเลยเพียงแค่เป็นชุดของคำถาม
Ian Schreiber

1
@Ian: ฉันคุ้นเคยกับระบบผู้เชี่ยวชาญ แต่พวกเขาไม่ใช่ชุดของ if-thens ในความเป็นจริงแล้วระบบผู้เชี่ยวชาญที่ทันสมัยมีการใช้งานโดยใช้เครื่องมือที่ฉันอธิบายไว้ข้างต้นซึ่งอาจใช้การเรียนรู้ของเครื่องเพื่อช่วยวัดกฎการอนุมานที่เป็นไปได้หรือค้นหาโดยใช้การส่งต่อหรือย้อนกลับ บางทีคุณอาจกำลังคิดถึงต้นไม้ตัดสินใจ แต่แม้กระทั่งต้นไม้เหล่านั้นมักถูกสร้างและปรับแต่งโดยการเรียนรู้ของเครื่องจักรและสำรวจเส้นทางที่หลากหลายโดยใช้การค้นหา

1

คุณควรอ่านแน่นอน AI วิธีการที่ทันสมัย หนังสือเล่มนี้ค่อนข้างแพง แต่คุณไม่สามารถพูดคุยเกี่ยวกับ AI อย่างจริงจังจนกว่าคุณจะได้งานที่ต้องทำ รุ่นที่ 2 ก็ดีเหมือนกันกับรุ่นที่ 3 ดังนั้นหากคุณสามารถหารุ่นที่ 2 ที่ราคาถูกกว่าได้

หากคุณต้องการเรียนรู้ด้วยเครื่องจริงๆ หนังสือของ Dr. Mitchellมีข้อมูลเชิงลึกมาก

โชคไม่ดีที่มีอุปสรรคมากมายในการเข้าเรียนในสถาบันการศึกษาของ AI แต่มันจะไม่ช่วยคุณหรือคนอื่น ๆ ถ้าคุณตีพิมพ์กระดาษสีขาวที่ใช้คำศัพท์ (ผิด) ที่ไม่ซ้ำกันและกล่าวถึงเทคนิคที่เป็นที่รู้จักกันดีในวงการวิชาการ

ด้านการเรียนรู้พฤติกรรมของคู่ต่อสู้เพื่อพัฒนาตนเองมีรายการเด่น ๆ หลายรายการ ตัวกรองสแปมที่ดีทำได้แค่นี้ คุณควรตรวจสอบ Paper Rock Scissors AI สิ่งที่ทำให้ PRS ไม่เหมือนใครคือมันง่ายและไม่มีการค้นหาที่เกี่ยวข้อง (AKA strategizing) วิธีเดียวที่ AI สามารถเอาชนะมนุษย์ได้คือการเรียนรู้การตั้งค่าของเขาและใช้ประโยชน์จากพวกเขา

ตรวจสอบบอต PRS AI ที่สร้างโดย NYTimes


ดี แต่ไม่ใช่สิ่งที่ฉันกำลังมองหา คำตอบของ Joe Wreschnig นั้นเป็นสิ่งที่ฉันต้องการ - คำศัพท์ของสิ่งที่ฉันต้องการวิจัย / เขียนเกี่ยวกับ นอกจากนี้ฉันไม่ได้ใหญ่ในศัพท์และการวิจัยเชิงทฤษฎี; ฉันควรเขียนห้องสมุดที่นำกลับมาใช้ซ้ำได้และแจกจ่ายเพื่อให้ผู้คนสามารถใช้งานได้
ashes999
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.