คุณสมบัติ Submodularity ในเกมแออัด?


15

ให้Gเป็นn -players และm -elements เกมแออัด

สำหรับสมดุลeแสดงโดย

SUP(e)≜<sup1(e),sup2(e),,supn(e)>

ที่มีการสนับสนุนของผู้เล่นที่เล่น (ชุดของกลยุทธ์ที่เล่นด้วยความน่าจะเป็นเชิงบวก)supi(e)iei

นอกจากนี้เรายังบอกว่า iffนั่นคือผู้เล่นทุกคนในสุ่มการกระทำของเขาในส่วนย่อย การกระทำของเขาจะได้รับเลือกให้เล่นe'SUP(e)SUP(e)i[n]:supi(e)supi(e)ee

หนึ่งคำจำกัดความสุดท้ายคือต้นทุนทางสังคม,ซึ่งถูกกำหนดให้เป็นผลรวมของต้นทุนสำหรับผู้เล่นSC(e)

Letสอง (อาจผสม) equilibriums สำหรับGe,eG

ไม่บ่งบอกถึง ?

SUP(e)SUP(e)
SC(e)SC(e)


คุณหมายถึงหรือไม่ โดยสัญชาตญาณเราจะคิดว่าการมุ่งเน้นที่ความสมดุลจะมีองค์ประกอบน้อยกว่าจะนำไปสู่องค์ประกอบที่มีความแออัดมากขึ้น SC(e)SC(e)
แพร่หลาย

@ แพร่หลาย - ฉันคิดว่ามันค่อนข้างตรงกันข้าม ผู้เล่นแต่ละคนมีสมาธิในองค์ประกอบที่น้อยลงซึ่งหมายความว่าผู้เล่นน้อยลงจะใช้แต่ละองค์ประกอบ ความจริงที่ว่าผู้เล่นแต่ละคนตอนนี้เลือกชุดย่อยขององค์ประกอบและนี่คือความสมดุลอาจหมายถึงสังคมได้รับจากมัน (มิฉะนั้นดูเหมือนว่าผู้เล่นมีแนวโน้มที่จะเบี่ยงเบนกลับไปใช้องค์ประกอบเพิ่มเติม)
RB

ขึ้นอยู่กับฟังก์ชั่นค่าใช้จ่าย (ล่าช้า) เกมดังกล่าวมีการระบุอย่างไม่สมบูรณ์เนื่องจากการจ่ายเงิน (ค่าใช้จ่าย) ขาดไป
Sander Heinsalu

คำตอบ:


2

เรื่องนี้เป็นโดยทั่วไปไม่เป็นความจริง หนึ่งสามารถแสดงให้เห็นว่ามันเป็นความจริงในกรณีที่และ 2 นี่ฉันแสดงตัวอย่างเคาน์เตอร์เมื่อและ 2m = 2 n = 3 m = 2n=2m=2n=3m=2

ความคิดเห็นสั้น ๆ เราสามารถเรียบเรียงคำถามใหม่ด้วยคำพูด: ทำสมดุลของแนชนั่นคือ "สุ่มมากขึ้น" (กับ e ) มีประสิทธิภาพน้อยลงหรือไม่ อย่างสังหรณ์ใจเมื่อมีการเล่นกลยุทธ์ที่หลากหลายมากขึ้นผลลัพธ์ที่ได้รับนั้นสุ่มมากขึ้นและไม่มีประสิทธิภาพมากนักเนื่องจากขาดการประสานงานระหว่างตัวแทน เมื่อตัวแทนเล่นกลยุทธ์ที่บริสุทธิ์เราสามารถคิดได้ว่าเราจะลดปัญหาการประสานงานเนื่องจากเราพิจารณาถึงดุลยภาพของแนช สัญชาตญาณนี้ไม่ถือถ้าเรื่องที่เป็นเท็จที่ผมจะแสดงเมื่อ n = 3และม. = 2een=3m=2

แสดงว่าและBเป็นการกระทำที่เป็นไปได้สองอย่าง ฟังก์ชั่นการหน่วงเวลามีการกำหนดดังต่อไปนี้: d A ( 1 ) = 5 , d A ( 2 ) = 7 , d A ( 3 ) = 10และd B ( 1 ) = 1 , d B ( 2 ) = 6 , d B ( 3 ) = 7 มันหมายความว่าเมื่อไหร่ABdA(1)=5dA(2)=7dA(3)=10dB(1)=1dB(2)=6dB(3)=7ตัวแทน xเล่น A (resp. B ) พวกเขาได้รับผลตอบแทน - d A ( x ) (resp. - d B ( x ) ) เกมนี้เป็นเกมที่มีความแออัด (สมมาตร) ตราบใดที่ฟังก์ชั่นความล่าช้าเพิ่มขึ้นxABdA(x)dB(x)

กําหนดเป็นสมดุลเมื่อ 1 ตัวแทนเล่นและตัวแทน 2 เล่นB กำหนดE 'เป็นสมดุลเมื่อ 1 ตัวแทนมักจะเล่นBและ 2 คนอื่น ๆ เล่นกับความน่าจะμ = 2 / 3และBมีความน่าจะเป็น1 - μ = 1 / 3 มันสอดคล้องกับคุณสมบัติ ของยูพี( E ) s ยูพี( E ' )eABeBAμ=2/3B1μ=1/3sup(e)sup(e)

อันดับแรกเราแสดงว่าคือสมดุลของแนช เอเจนต์ที่เล่นAกำลังเพิ่มผลตอบแทนของเธอสูงสุดเนื่องจากกลยุทธ์ของผู้เล่นอื่นเมื่อเลือกAนั้นดีกว่าการเลือกB , d A ( 1 ) < d B ( 3 ) (เช่น5 < 7 ) ตัวแทนทั้งสองที่เล่นBกำลังเล่นอย่างเหมาะสมหากd B ( 2 ) < d A ( 2 ) (เช่น6 < 7 ) อีeAABdA(1)<dB(3)5<7BdB(2)<dA(2)6<7eจึงเป็นสมดุลของแนชและค่าใช้จ่ายทางสังคมของมันคือ .dA(1)+2dB(2)=17=1539

ประการที่สองเราแสดงว่าเป็นดุลยภาพของแนช บนมือข้างหนึ่งตัวแทนผู้เล่นBเป็นการเพิ่มของเธอผลตอบแทนเมื่อทั้งสองคนอื่นเล่นกลยุทธ์ผสมถ้าเธอจะดีกว่าเล่นBกว่า, ( 1 - μ ) 2 d B ( 3 ) + 2 μ ( 1 - μ ) d B ( 2 ) + μ 2 d B ( 1 ) < ( 1 - μ )eBBA เช่น 1

(1μ)2dB(3)+2μ(1μ)dB(2)+μ2dB(1)<(1μ)2dA(1)+2μ(1μ)dA(2)+μ2dA(3)
ซึ่งเป็นเรื่องจริง ในทางกลับกันตัวแทนแต่ละคนที่เล่นกลยุทธ์ผสมนั้นไม่สนใจในการเลือกAหรือBหาก μdA(2)+(1-μ)dA(1)=μdB(2)+(1-μ)dB(3) เช่น19195+497+4910<197+496+491AB
μdA(2)+(1μ)dA(1)=μdB(2)+(1μ)dB(3)
. eคือสมดุลของแนชและต้นทุนทางสังคมคือ (1-μ)2[3dB(3)]+2μ(1-μ)[dA(1)+2dB(2)]+μ2[2dA(2)+dB(1)193=193e ซึ่งเท่ากับ 1
(1μ)2[3dB(3)]+2μ(1μ)[dA(1)+2dB(2)]+μ2[2dA(2)+dB(1)]
.1921+4917+4915=1499

สุดท้ายเราได้แสดงให้เห็นว่าแต่S C ( E ) > S C ( E ' ) ความสมดุลของกลยุทธ์แนชส่งผลให้ต้นทุนทางสังคมต่ำกว่ากลยุทธ์ที่บริสุทธิ์sup(e)sup(e)SC(e)>SC(e)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.