การค้นหาความแปลกใหม่ทำงานอย่างไร


16

ในบทความนี้ผู้เขียนอ้างว่าแนวทางวิวัฒนาการโดยความแปลกใหม่เพียงอย่างเดียว (โดยไม่มีเป้าหมายชัดเจน) สามารถแก้ปัญหาได้ดีกว่าการใช้เป้าหมายที่ชัดเจน กล่าวอีกนัยหนึ่งการใช้การวัดความแปลกใหม่เป็นฟังก์ชั่นการออกกำลังกายสำหรับอัลกอริทึมทางพันธุกรรมทำงานได้ดีกว่าฟังก์ชั่นการออกกำลังกายตามเป้าหมาย เป็นไปได้อย่างไร?

คำตอบ:


7

ดังที่อธิบายไว้ในคำตอบสำหรับคำถามAI SEนี้ GAs คือ 'พอใจ' มากกว่า 'เครื่องมือเพิ่มประสิทธิภาพ' และมีแนวโน้มที่จะไม่สำรวจพื้นที่ "รอบนอก" ของพื้นที่ค้นหา ค่อนข้างประชากรมีแนวโน้มที่จะจัดกลุ่มในพื้นที่ที่ 'ค่อนข้างดี' ตามฟังก์ชั่นการออกกำลังกาย

ในทางตรงกันข้ามฉันเชื่อว่าความคิดนั้นเป็นความแปลกใหม่ที่ทำให้เกิดการออกกำลังกายแบบไดนามิกที่มีแนวโน้มที่จะผลักดันประชากรออกจากพื้นที่ที่ค้นพบก่อนหน้านี้


6

การค้นหาแบบแปลกใหม่เลือกสำหรับ "พฤติกรรมแบบใหม่" โดยคำจำกัดความบางอย่างขึ้นอยู่กับโดเมนของความแปลกใหม่ ตัวอย่างเช่นความแปลกใหม่ในโดเมนการแก้เขาวงกตอาจเป็น "ความแตกต่างของการสำรวจเส้นทาง" ในที่สุดเครือข่ายที่ใช้เส้นทางที่เป็นไปได้ทุกเส้นทางผ่านเขาวงกตจะพบและคุณสามารถเลือกที่เร็วที่สุด สิ่งนี้จะทำงานได้ดีกว่า "เป้าหมาย" ไร้เดียงสาเช่นระยะห่างจากเป้าหมายซึ่งอาจส่งผลให้ออพติม่าท้องถิ่นที่ไม่เคยแก้ปัญหาเขาวงกตได้อย่างง่ายดาย

จากวัตถุประสงค์ที่ถูกละทิ้ง: วิวัฒนาการผ่านการค้นหาสิ่งแปลกใหม่ (เน้นที่เหมือง):

ในการค้นหาสิ่งแปลกใหม่แทนที่จะวัดความก้าวหน้าโดยรวมด้วยฟังก์ชั่นวัตถุประสงค์ดั้งเดิมวิวัฒนาการใช้ตัวชี้วัดความแปลกใหม่ทางพฤติกรรมที่เรียกว่าตัวชี้วัดความแปลกใหม่ ผลการค้นหาที่ชี้นำโดยตัวชี้วัดดังกล่าวดำเนินการอย่างชัดเจนว่าการวิวัฒนาการตามธรรมชาติทำอะไรอยู่เฉยๆคือค่อยๆสะสมรูปแบบใหม่ที่ขึ้นบันไดที่ซับซ้อน
ตัวอย่างเช่นในโดเมนการเคลื่อนที่แบบสองเท้าความพยายามเริ่มต้นอาจล้มเหลว ตัวชี้วัดความแปลกใหม่จะให้รางวัลเพียงแค่ล้มลงในวิธีที่แตกต่างโดยไม่คำนึงว่ามันจะเข้าใกล้พฤติกรรมวัตถุประสงค์หรือไม่ ในทางตรงกันข้ามฟังก์ชั่นวัตถุประสงค์อาจให้รางวัลอย่างชัดเจนว่าการตกลงมาไกลที่สุดซึ่งน่าจะไม่นำไปสู่เป้าหมายสุดท้ายของการเดินเท้าและเป็นตัวอย่างของการหลอกลวงที่เหมาะสมที่สุด ในทางตรงกันข้ามในการค้นหาสิ่งแปลกใหม่ชุดของอินสแตนซ์จะถูกเก็บไว้ซึ่งแสดงถึงการค้นพบที่แปลกใหม่ที่สุด ค้นหาเพิ่มเติมจากนั้นก็กระโดดออกจากพฤติกรรมตัวแทนเหล่านี้ หลังจากที่ไม่กี่วิธีที่จะมีการค้นพบในฤดูใบไม้ร่วง, วิธีเดียวที่จะได้รับรางวัลคือการหาพฤติกรรมที่ไม่ตกทันที ด้วยวิธีนี้ความซับซ้อนของพฤติกรรมเพิ่มขึ้นจากล่างขึ้นบนในที่สุดหากต้องการทำสิ่งใหม่ผู้ที่เดินผ่านจะต้องประสบความสำเร็จในการเดินไกลแม้ว่ามันจะไม่ใช่เป้าหมายก็ตาม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.