แหล่งที่มาสำหรับทฤษฎีเกมวิวัฒนาการขั้นตอน


15

ฉันใช้คำชื่อในแง่ที่หลวมมาก

มีงานจำนวนมากเกี่ยวกับทฤษฎีเกมวิวัฒนาการรวมถึงพื้นฐานทางคณิตศาสตร์ ฉันแนะนำ "เกมวิวัฒนาการและพลวัตประชากร" แต่ยังไม่ได้เจาะลึก

นอกจากนี้ยังมีงานจำนวนมากเกี่ยวกับทฤษฎีเกมอัลกอริทึมซึ่งเป็นหัวข้อยอดนิยมในเว็บไซต์นี้

สิ่งที่ฉันต้องการเห็นก็คืองานที่ทำให้เกิดความซับซ้อนในการคำนวณหรือข้อความเกี่ยวกับการลู่เข้าเกี่ยวกับการเปลี่ยนแปลงทางวิวัฒนาการ

ตัวอย่าง (เขียนอย่างหลวม ๆ ):

  1. เมื่อพิจารณาจากประชากรและโครงการวิวัฒนาการเราสามารถทำให้ความน่าจะเป็นที่จะเกิดขึ้นกับการเพิ่มประสิทธิภาพของประชากรในระยะยาว (เทียบกับบุคคลที่ดีที่สุดที่ผลิตได้หรือไม่) สิ่งนี้ดูเหมือนจะเกี่ยวข้องอย่างมากกับผู้เชี่ยวชาญและปัญหาโจร สิ่งที่เกี่ยวกับการตั้งค่า nonstationary?
  2. เนื่องจากกลุ่มประชากรของสปีชีส์ต่าง ๆ ที่มีปฏิสัมพันธ์ในสภาพแวดล้อมของพวกเขาเล่นเกมที่มีผู้เล่นหลายคนค่อนข้างมากสิ่งที่เราสามารถพูดได้เกี่ยวกับความมั่นคงในที่สุดของกลยุทธ์หรือการกระจายกลยุทธ์ของพวกเขา
  3. ในสภาพแวดล้อมใด ๆ ที่มี "niches" มากมาย (เป็นวิธีการใช้ถ้อยคำที่เกินจริงฉันเข้าใจ) ไม่ว่าจะเป็นความสัมพันธ์โดยตรงกับสภาพแวดล้อมหรือในแง่ของความสัมพันธ์กับสายพันธุ์อื่น ๆ ข้ามซอกเหล่านี้
  4. ปัญหาใด ๆ ที่ฉันไม่ได้ถาม แต่ควร - ฉันมาที่นี้ด้วย AGT, TCS, Algorithms ทางพันธุกรรมทฤษฎีเกมวิวัฒนาการหรือภูมิหลังชีววิทยาของประชากร ฉันถามคำถามจากมุมมองการเพิ่มประสิทธิภาพ / การเรียนรู้ของเครื่อง / สถิติซึ่งอาจผิดหรือไม่สมบูรณ์

คำตอบ:


11

นี่เป็นหนึ่งในหัวข้อที่ฉันค้นหามานานแล้ว อย่างไรก็ตามพวกเขาดูเหมือนจะไม่แพร่หลายทั้งหมด คนที่ทำงานเกี่ยวกับชีววิทยาเชิงทฤษฎีและเศรษฐศาสตร์ที่ใช้ EGT มักจะยึดติดกับทฤษฎีระบบพลวัตและไม่สวมเลนส์อัลกอริทึม ดังนั้นผลลัพธ์ส่วนใหญ่เป็นรูปแบบ AMath / Physics และไม่ใช่ของอัลกอริธึมและสไตล์คณิตศาสตร์แบบแยก หากคุณยินดีที่จะดำเนินการตามแนวทางของระบบแบบไดนามิกนั่นคือการสำรวจโดย Hofbauer และ Sigmund ซึ่งสั้นกว่าและล่าสุดกว่าหนังสือของพวกเขา (ฉันพูดถึงมันและความคิดเห็นที่ผ่านมาในคำตอบก่อนหน้า )

หนึ่งในสถานที่จำลองพลวัตถูกนำมาใช้ในผลลัพธ์ที่เกี่ยวข้องกับความซับซ้อนคือโดย Marcello Pelillo และผู้เขียนร่วมเป็นฮิวริสติกสำหรับการแก้ปัญหา max-clique (ลด max-clique การเขียนโปรแกรมสมการกำลังสองแก้การเขียนโปรแกรมกำลังสอง :

[1] Immanuel M. Bomze และ Marcello Pelillo [2000] "การประมาณค่าน้ำหนักสูงสุดโดยใช้ตัวจำลองแบบจำลอง" ธุรกรรม IEEE บนโครงข่ายประสาทเทียม 11 (6)

[2] Marcello Pelillo และ Andrea Torsello [2006] "พลวัตเกม Payoff-Monotonic และปัญหาคิกสูงสุด" การคำนวณทางประสาท 18: 1215-1258

Σ2PΣ2P

[3] Kousha Etessami และ Andreas Lochbihler [2008] "ความซับซ้อนในการคำนวณของกลยุทธ์ที่มีความเสถียรเชิงวิวัฒนาการ" วารสารนานาชาติของทฤษฎีเกม , 37 (1): 93-113 (พร้อมใช้งานครั้งแรกในปี 2547 ตามรายงานเทคโนโลยีของ ECCC TR04-055)

[4] Vincent Conitzer [2013] "ความซับซ้อนในการคำนวณที่แน่นอนของกลยุทธ์ที่มีความเสถียรเชิงวิวัฒนาการ" 9 การประชุมบนเว็บและอินเทอร์เน็ตเศรษฐศาสตร์ (ไวน์) ( pdf )

คำถาม EGT ที่น่าสนใจมากมายในวันนี้เป็นเรื่องเกี่ยวกับเกมบนกราฟและแม้ว่าจะมีผลลัพธ์ของระบบแบบไดนามิกที่น่าสนใจเช่น (โปรดดูคำถามนี้สำหรับส่วนขยายของวิธีการนี้):

[5] Hisashi Ohtsuki และ Martin Nowak [2006] "สมการจำลองแบบบนกราฟ" _ วารสารชีววิทยาเชิงทฤษฎี _, 243 (1), 86-97 ( ลิงก์ , บล็อกโพสต์ )

งานส่วนใหญ่ผ่านการสร้างแบบจำลองโดยใช้ตัวแทน (ดูคำตอบนี้สำหรับบริบทการสร้างแบบจำลองการแพร่กระจายของโรค) แบบจำลองเหล่านี้มักจะให้การต้อนรับกับความซับซ้อนและคำสั่งการรวมกันมากขึ้น ดูหนังสือต่อไปนี้สำหรับข้อมูลเพิ่มเติม:

[6] Yoav Shoham และ Kevin Leyton-Brown [2009], "ระบบหลายหน่วย: อัลกอริธึม, ทฤษฎีเกม, และรากฐานเชิงตรรกะ", สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์

ฉันคิดว่าการเรียนรู้ด้วยเครื่องจักรเป็นวิธีที่ตรงไปตรงมาในการเข้าถึง EGT เนื่องจากเป็นจุดกึ่งกลางที่เป็นธรรมชาติระหว่างฟิสิกส์ที่เกี่ยวข้อง (กลศาสตร์เชิงสถิติ) และวิทยาศาสตร์คอมพิวเตอร์ สิ่งนี้ได้ทำไปแล้วฉันจะใช้เวลาสักหน่อยเพื่อค้นหาการอ้างอิงที่ดี แต่เป็นการอ้างอิงแบบสุ่ม (ซึ่งแสดงให้เห็นว่าคน EGT ได้พิจารณาแนวคิดความสมดุลอื่น ๆ ที่เป็นที่นิยมเช่นดุลยภาพที่มีความสัมพันธ์):

[7] Sergiu Hart และ Andreu Mas-Colell [2000], "ขั้นตอนการปรับตัวง่าย ๆ ที่นำไปสู่สมดุลที่สัมพันธ์กัน", Econometrica 68 (5): 1127-1150

[8] Antonella Ianni [2001], "ดุลยภาพการเรียนรู้ที่มีความสัมพันธ์ในเกมประชากร", คณิตศาสตร์สังคมศาสตร์ 42 (3): 271-294

[9] Ludek Cigler และ Boi Faltings [2011], "การเข้าถึงความสมดุลผ่านการเรียนรู้แบบหลายตัวแทน", AAMAS 2011: 509-516

ฉันหวังว่าคนอื่นจะให้คำตอบที่เฉพาะเจาะจงมากขึ้นเนื่องจากนี่เป็นคำถามที่ฉันอยากรู้มากขึ้น


5

อย่างที่คนอื่นพูดมีน้อยกว่าที่คุณคาดหวัง เอกสารที่เกี่ยวข้องสองสัมผัส:

"น้ำหนักแบบทวีคูณในเกมประสานงานและทฤษฎีวิวัฒนาการ"โดย Chastain, Livnat, Papadimitriou และ Vazirani บทความนี้ระบุว่าพลวัตวิวัฒนาการ (ในรูปแบบง่าย ๆ ) เทียบเท่ากับเกมการประสานงานระหว่างยีนที่กำลังเล่นกับอัลกอริทึมการเรียนรู้น้ำหนัก multiplicative พวกเขาวิเคราะห์ตัวแปรของยีน 2 ตัวในรูปแบบที่ง่ายขึ้น

หมายเหตุ: ขั้นตอนวิธีการคูณน้ำหนักเป็นแบบไดนามิกธรรมชาติที่รู้จักกันมาบรรจบกันเพื่อสมดุลของแนชในเกมศูนย์รวมเกมที่มีศักยภาพ nonatomic, และอื่น ๆ (ดูเช่นFreund และ Schapire )

"ราคาของความโกลาหลอนาธิปไตย"โดยจุง Ligett, Pruhs และตัวฉันเอง (จากเมื่อไม่นานมานี้) ที่นี่เราศึกษาสถานะเสถียรของเกมซึ่งเกี่ยวข้องกับ ESS เราไม่ต้องกังวลเกี่ยวกับความซับซ้อนในการค้นหาพวกเขา แต่เราแสดงให้เห็นว่าในบางเกมราคาอนาธิปไตยต่ำกว่าชุดดุลยภาพที่มีเสถียรภาพแบบสุ่มเมื่อเปรียบเทียบกับ Nash equilibria โดยพลการ


-1

ผมได้เรียนรู้จากโรงเรียน Ashlock สิ่งใหญ่ที่ฉันได้รับก็คือมันมีประโยชน์อย่างไรn2 ตารางผลลัพธ์ระหว่างตัวแทนและใช้ K-Means เพื่อจัดกลุ่มแถวออกเป็นกลุ่มกลยุทธ์สำหรับการวิเคราะห์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.