ทฤษฎีเกมอัลกอริทึม - แนวคิดดุลยภาพที่ไม่เป็นมาตรฐาน?


11

ฉันเริ่มการศึกษาทฤษฎีเกมอัลกอริทึมและดูเหมือนว่าแนวคิดเรื่องความสมดุลมักจะเกิดขึ้นจากจุดคงที่ในกราฟ อย่างไรก็ตามมีคนดูแนวคิดสมดุลทางเลือกเช่นวงจร จำกัด ? ฉันสามารถจินตนาการได้ว่าวงจร จำกัด ที่ "รัดแน่น" - นั่นคือวงจรในกราฟที่มีความยาวน้อยมาก - ถือได้ว่าเป็นสิ่งที่ "ใกล้" กับคำจำกัดความมาตรฐานของดุลยภาพ

ฉันพยายามขุดไปรอบ ๆ Google Scholar แต่เพื่อประโยชน์เล็กน้อย

คำตอบ:


10

อย่างที่ฉันชอบบางครั้งเรียกว่า "Coarse Correlated Equilibrium" นี่เป็นชุด จำกัด ของพลวัต "No-Regret" ที่มีประสิทธิภาพ

สิ่งเหล่านี้มีคุณสมบัติที่ดีหลายประการไม่น้อยไปกว่าที่พวกเขาสามารถเข้าถึงได้โดยการเปลี่ยนแปลงที่มีประสิทธิภาพการแยกคู่และรวมถึง Nash equilibria เป็นกรณีพิเศษ สิ่งที่อาจทำให้พวกเขาค่อนข้างคล้ายกับสิ่งที่คุณถามคือพลังการเรียนรู้เหล่านี้ไม่จำเป็นต้องมาบรรจบกันเป็นจุดคงที่ - แน่นอนพวกมันอาจวนไปตลอดกาล อย่างไรก็ตามมันก็มักจะเป็นไปได้ที่จะผูกมัดการบรรจบกันอย่างรวดเร็วของสวัสดิการสังคมภายใต้การเปลี่ยนแปลงเหล่านี้ (เช่นราคาของอนาธิปไตยเพื่อความสมดุลหยาบหยาบ) และอะไรเพิ่มเติมบ่อยครั้งที่สวัสดิการสังคมจะไม่เลวร้ายยิ่งกว่าสมดุลสมดุลหยาบกว่า Nash สมดุล

เอกสารที่เกี่ยวข้องบางส่วน:

http://portal.acm.org/citation.cfm?id=1374430

http://portal.acm.org/citation.cfm?id=1536414.1536485

http://portal.acm.org/citation.cfm?id=1536487


15

คุณอาจกำลังมองหาสิ่งที่ต้องการ Sink Equilibria (เริ่มจากhttp://arxiv.org/abs/0902.0382 ) - แต่ความยาวรอบจะไม่ได้รับการพิจารณา


อ่าสวยงาม คำว่า "ดุลยภาพของอ่างล้างมือ" คือสิ่งที่ฉันกำลังมองหา ขอบคุณ!
Henry Yuen

4

นี่อาจไม่ใช่สิ่งที่คุณกำลังมองหา แต่เป็นไปได้ที่จะกำหนดสมดุลของแนชโดยประมาณที่เป้าหมายคือการค้นหาสถานะเพื่อให้ยูทิลิตี้ของผู้เล่นใกล้เคียงกับที่กำหนดโดย equlibrium ของแนช Noam Nisan มีโพสต์ที่ดีเกี่ยวกับเรื่องนี้ (และเนื่องจากเขาออกไปเที่ยวที่นี่เป็นบางครั้งเขาน่าจะได้คำตอบที่ดีกว่าสำหรับคุณ)


4

โจเซฟวาย. Halpern จากคอร์เนลล์ได้กล่าวสุนทรพจน์ที่ CUNY Graduate Centre ในหัวข้อ: Beyond Nash Equilibrium: แนวคิดการแก้ปัญหาสำหรับศตวรรษที่ 21 บางทีงานของเขาอาจเป็นที่สนใจของคุณ

http://web.cs.gc.cuny.edu/~kgb/seminar.html


ลิงค์นี้ใช้งานไม่ได้สำหรับฉัน?
András Salamon

กระดาษที่ Halpern เขียนและอาจเป็นพื้นฐานสำหรับการพูดคุยของเขาอยู่ที่นี่: cs.cornell.edu/home/halpern/abstract.html#beyond
Joseph Malkevitch

3

หวังว่านี่จะไม่ใช่คำตอบที่ไม่มากเกินไปเพราะมันจะดูคำถามนี้จากประเด็นของทฤษฎีเกมวิวัฒนาการ (EGT) แทนที่จะเป็น AGT

ทฤษฎีเกมเป็นสูตรดั้งเดิมโดย von Neumann และ Morgenstern เป็นทฤษฎีที่ไม่เปลี่ยนแปลง ดังนั้นแนวคิดสมดุลยอดนิยมจำนวนมาก (Nash, Correlated และอื่น ๆ ) จึงเป็นแบบสแตติก เพื่อพูดคุยเกี่ยวกับดุลยภาพที่ไม่คงที่เราต้องแนะนำการเปลี่ยนแปลงบางอย่าง AGT มักทำสิ่งนี้โดยการพิจารณาตัวแทน (อัลกอริทึม) ที่เฉพาะเจาะจงซึ่งอาจนำไปใช้ในการตัดสินใจ

อีกทางเลือกหนึ่งที่ EGT ใช้คือการพิจารณาพลวัตประชากรของตัวแทนจำนวนมากที่มีการตัดสินใจที่ง่ายมาก สิ่งนี้มักจะสร้างพลวัตที่ไม่ใช่เชิงเส้นในประชากรและวาง EGT เป็นส่วนหนึ่งของระบบแบบไดนามิก ดังนั้นคุณจะเริ่มเห็นแนวคิดเรื่องสมดุลของระบบไดนามิกเช่นวงจร จำกัด หรือตัวดึงดูดความวุ่นวายที่ผุดขึ้นมาเป็นแนวคิดสมดุล สภาวะสมดุลแบบไม่คงที่เหล่านี้ได้รับการศึกษาอย่างดีใน EGT แม้ว่าบ่อยครั้งที่การวิเคราะห์นั้นมาจากระบบไดนามิกและไม่ใช่อัลกอริทึม

หากคุณสนใจ EGT จุดเริ่มต้นมาตรฐาน (และเข้าถึงได้) คือการสำรวจของ Hofbauer และ Sigmund ในปี 2003 " เกมวิวัฒนาการแห่งการเปลี่ยนแปลง "

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.