คำถามติดแท็ก game-theory

ทฤษฎีเกมเป็นการศึกษาสถานการณ์ของการโต้ตอบเชิงกลยุทธ์ระหว่างผู้เล่นสองคนหรือมากกว่านั้นซึ่งมีชุดของกฎที่กำหนดไว้ล่วงหน้าและผลลัพธ์ที่เกี่ยวข้องกับการเลือกแต่ละทาง

3
วิธีทำความเข้าใจ 'เกณฑ์ที่ใช้งานง่าย' อย่างสังหรณ์ใจ?
เกณฑ์ที่ใช้งานง่ายโดย Cho และ Kreps คือการปรับแต่งเพื่อย่อชุดสมดุลย์แบบเบย์ที่สมบูรณ์แบบในเกมส่งสัญญาณ ตัวอย่างง่ายๆและเข้าใจง่ายที่จะอธิบายเกณฑ์นี้จะเป็นอย่างไร สมมติว่านักศึกษาระดับปริญญาตรีใด ๆ ควรจะสามารถชื่นชมการปรับแต่งได้อย่างง่ายดายผ่านตัวอย่าง

4
สมดุลของแนชนำไปสู่การค้นพบทางเศรษฐกิจที่สำคัญหรือไม่?
The Nash Equilibrium นำเสนอมุมมองใหม่เกี่ยวกับปัญหาทางเศรษฐกิจและได้รับรางวัลโนเบลอนุสรณ์ทางเศรษฐศาสตร์ในปี 1994 นับตั้งแต่การสร้าง The Nash Equilibrium ได้ถูกนำไปใช้กับ "ความสัมพันธ์ระหว่างประเทศ" โดยเฉพาะสำหรับสงครามและการแข่งขันอาวุธ แต่ Nash Equilibrium นำไปสู่การค้นพบทางเศรษฐกิจที่สำคัญหรือไม่? ฉันเคยได้ยินข่าวลือเรื่อง Nash Equilibrium ที่ถูกนำไปใช้กับการดำเนินงานของธนาคารและวิกฤตการณ์ทางการเงินอื่น ๆ แต่ไม่มีอะไรให้สำรอง

1
คุณสมบัติ Submodularity ในเกมแออัด?
ให้GGGเป็นnnn -players และmmm -elements เกมแออัด สำหรับสมดุลeeeแสดงโดยSUP(e)≜<sup1(e),sup2(e),…,supn(e)>SUP(e)≜<sup1(e),sup2(e),…,supn(e)>SUP(e)\triangleq ที่มีการสนับสนุนของผู้เล่นที่เล่น (ชุดของกลยุทธ์ที่เล่นด้วยความน่าจะเป็นเชิงบวก)supi(e)supi(e)sup_i(e)iiieeeiii นอกจากนี้เรายังบอกว่า iffนั่นคือผู้เล่นทุกคนในสุ่มการกระทำของเขาในส่วนย่อย การกระทำของเขาจะได้รับเลือกให้เล่นe'SUP(e)⊆SUP(e′)SUP(e)⊆SUP(e′)SUP(e)\subseteq SUP(e')∀i∈[n]:supi(e)⊆supi(e′)∀i∈[n]:supi(e)⊆supi(e′)\forall i\in[n]: sup_i(e)\subseteq sup_i(e')eeee′e′e' หนึ่งคำจำกัดความสุดท้ายคือต้นทุนทางสังคม,ซึ่งถูกกำหนดให้เป็นผลรวมของต้นทุนสำหรับผู้เล่นSC(e)SC(e)SC(e) Letสอง (อาจผสม) equilibriums สำหรับGe,e′e,e′e,e'GGG ไม่บ่งบอกถึง ?SUP(e)⊆SUP(e′)SUP(e)⊆SUP(e′)SUP(e)\subseteq SUP(e')SC(e)≤SC(e′)SC(e)≤SC(e′)SC(e) \leq SC(e')

3
มีทฤษฎีที่ทำให้“ โศกนาฏกรรมสาธารณะ” เป็นโมฆะหรือไม่?
รัฐ Wikipedia : โศกนาฏกรรมของคอมมอนส์เป็นทฤษฎีเศรษฐศาสตร์โดยการ์เร็ตต์ฮาร์ดินตามที่ประชาชนทำหน้าที่อย่างอิสระและมีเหตุผลตามความสนใจของแต่ละคนประพฤติตนตรงกันข้ามกับผลประโยชน์ที่ดีที่สุดของทั้งกลุ่มในระยะยาว อย่างสังหรณ์ใจดูเหมือนว่าถูกต้องว่าผลประโยชน์ของตัวเองจะนำไปสู่การใช้เกินกว่าสมมติฐานที่ว่าคนอื่นจะทำเช่นเดียวกัน มีทฤษฎีโต้กลับที่รุนแรงที่ยืนยันว่าผู้คนจะทำในสิ่งที่ "ดีที่สุดย่อย" เพื่อให้ชุมชนดีขึ้นหรือไม่?


5
อธิบายกลยุทธ์ที่หลากหลายสำหรับเกมนัดเดียว
ในการแนะนำแบบคลาสสิกเกี่ยวกับทฤษฎีเกมแบบไม่ร่วมมือกลยุทธ์ผสมสำหรับผู้เล่นได้รับการสอนเป็นการกระจายพื้นที่กลยุทธ์สำหรับผู้เล่น การกระจายนั้นให้ความน่าจะเป็น (กล่าวคือชุดกลยุทธ์แบบแยก) ซึ่งผู้เล่นควรเล่นกลยุทธ์ในสมดุลของแนช อย่างไรก็ตามความน่าจะเป็นที่จะเกิดความคิดเกี่ยวกับความถี่และสิ่งเหล่านี้หมายถึงส่วนของเกมที่ผู้เล่นควรเล่นกลยุทธ์ในระยะยาว อย่างไรก็ตามการตั้งค่าเป็นเกมแบบ one-shot และนี่คือความขัดแย้ง เราจะแก้ไขข้อขัดแย้งได้อย่างไรเมื่ออธิบายว่ากลยุทธ์แบบผสมคืออะไร

0
ฉันสามารถปรับแต่งชุดสมดุลในเกมส่งสัญญาณไปยังผลลัพธ์ที่เหมาะสมที่สุดของผู้ส่งได้หรือไม่?
คำถามหลัก:ฉันได้อ่านเกี่ยวกับเกมการสื่อสารเป็นอย่างมากและฉันสงสัยว่ามีเกณฑ์ที่ดีในการเลือกระหว่างสองสมดุล -ish ฉันคิดว่าดุลยภาพที่แยกออกมาเป็นดุลยภาพการประสานงานระหว่างประเภทต่างๆ ดังนั้นหากเราอนุญาตให้การประสานงานประเภทนี้ประสบความสำเร็จทำไมเราไม่อนุญาตให้พวกเขาประสานงานกับดุลยภาพผู้ส่งที่ดีที่สุด กล่าวคือถ้ามีดุลยภาพลำดับเดียวที่ผู้ส่งทุกคนทำได้ดีกว่าในดุลยภาพที่เหลือ มีข้อโต้แย้งอะไรในการเลือกดุลยภาพนี้ พิจารณาเกมการสื่อสารต่อไปนี้ การจ่ายเงินของผู้รับคือหมายเลขที่สองในคู่ ผู้ส่งมีหกประเภทโดยให้ผลตอบแทนเป็นองค์ประกอบแรกของคู่ ฉันจะแสดงให้เห็นว่ามีความสมดุลรวมกันและอย่างน้อยสองแยกบางส่วน ฉันสงสัยว่าเทคนิคชนิดใดที่สามารถใช้ในการโต้แย้งเพื่อแยกสมดุล หนึ่งคือผู้ส่งที่ดีที่สุดและอื่น ๆ ที่เป็นผู้รับที่ดีที่สุด typeBtypeLtypeRtypeLLtypeRRtypeHActionB(0,3)(0,2)(0,2)(0,1)(0,1)(0,0)ActionL(1,2)(1,3)(1,2)(1,2)(1,0)(1,0.9)ActionR(1,2)(1,2)(1,3)(1,0)(1,2)( 1 ,0.9)ActionLL( 2),1)( 2),0)( 2),2.25)( 2),3)( 2),1)( 2 , 3.1 )A c t i o nR R( 2 , 1 )( 2 , 2.25 )( 2 , 0 )( 2 , 1 )( 2 , …

5
เครื่องมือสร้างภาพข้อมูลสำหรับทฤษฎีเกม: แผนผังเกม
มีหลายวิธีในการวาดเกมต่อเนื่อง 'ด้วยมือ' โดยการวาดเกมฉันหมายถึงสิ่งนี้: แสดงคะแนนการตัดสินใจของผู้เล่นการกระทำที่มีอยู่และการจ่ายเงิน มีวิธีใดบ้างที่ฉันสามารถทำได้ใน R หรือภาษาการเขียนโปรแกรมระดับสูงที่คล้ายกัน? เพื่อความแม่นยำ: ฉันไม่ต้องการพล็อตสมการทางเรขาคณิตฉันต้องการกำหนดโครงสร้าง (ผู้เล่นคะแนนการเชื่อมต่อการจ่ายเงิน) และกำหนดโปรแกรม ฉันกำลังเรียกดูแพคเกจ 'igraph' แต่ฉันมีปัญหาในการติดฉลากดังนั้นฉันจึงสงสัยว่ามีวิธีที่ดีกว่านี้หรือไม่
12 game-theory  r 

2
เศรษฐศาสตร์แห่งการลืม
ฉันสนใจที่จะรู้เหตุผลทางเศรษฐกิจของการลืมในด้านต่าง ๆ ตัวอย่างคือสีเขียวและพอร์เตอร์ (1984) เพื่อสนับสนุนกลุ่มพันธมิตรสมาชิกพันธมิตรมีแรงจูงใจที่จะลืมความเบี่ยงเบนในอดีตอันไกลโพ้น อีกอย่างหนึ่งคือEkmekciy (2011)ซึ่งแสดงให้เห็นว่าระบบการให้คะแนนทำงานได้ดีขึ้นถ้าหยุดเผยแพร่การประพฤติมิชอบเมื่อพวกเขาโตพอ นอกจากนี้ยังมีการต้อนรับวรรณกรรมในระดับที่เป็นนามธรรมมากขึ้นเช่นผลที่น่าพึงพอใจต่อสังคมในเกมแบบไดนามิกตัวแทนบางคนถูก จำกัด ด้วยกลยุทธ์ที่ไม่หยุดนิ่ง

2
คำจำกัดความของ“ ความสมดุลของผู้นำสแตเทลเบิร์กคืออะไร”
ฉันได้พบกับแนวคิดเรื่องสมดุลของ "ดุลยภาพของผู้นำแบบกองซ้อน" ในขณะที่อ่านการแข่งขันในสายผลิตภัณฑ์ (AER, Brander และ Eaton (1984) พวกเขากล่าวว่า "เรากำหนดกลยุทธ์ Stackelberg เป็นหนึ่งซึ่งเกี่ยวข้องกับการเกิดปฏิกิริยาร่วมสมัยของคู่แข่ง ในการกำหนดกลยุทธ์ของตนเอง "คำจำกัดความนั้นไม่ได้ช่วยฉันจริงๆ พวกเขายังพูดถึงว่าแนวคิดสมดุลนี้เป็นอีกวิธีหนึ่งในการตีความรูปแบบ Stackelberg ดั้งเดิม (ซึ่งฉันรู้) ใครบ้างมีการอ้างอิงหรือคำอธิบาย? แน่นอนว่า Google จะแสดงผลลัพธ์ในเกมผู้ตามผู้นำเท่านั้น

4
Osborne, Nash equilibria และความถูกต้องของความเชื่อ
ใน Osborne's An An Introduction to Game Theory Nash ดุลยภาพได้อธิบายไว้ดังนี้ (หน้า 21–22): ครั้งแรกผู้เล่นแต่ละคนเลือกการกระทำของเธอตามรูปแบบของการเลือกที่มีเหตุผลให้ความเชื่อของเธอเกี่ยวกับการกระทำของผู้เล่นคนอื่น ประการที่สองความเชื่อของผู้เล่นทุกคนเกี่ยวกับการกระทำของผู้เล่นคนอื่นนั้นถูกต้อง ดูเหมือนว่าสำหรับฉันแล้วคำจำกัดความนี้ไม่เทียบเท่ากับคำจำกัดความของสมดุลของแนชอย่างสมบูรณ์ในฐานะโปรไฟล์กลยุทธ์ที่กลยุทธ์ของผู้เล่นแต่ละคนเป็นการตอบสนองที่ดีที่สุดต่อกลยุทธ์ของผู้อื่น คำจำกัดความทั่วไปไม่ได้เกี่ยวกับความเชื่อดังนั้นจึงอนุญาตให้มีความเป็นไปได้ที่ความเชื่ออาจไม่ถูกต้อง เพื่อเป็นไปได้เล็กน้อยพิจารณา Dilemma ของนักโทษ สมมติว่าผู้เล่นแต่ละคนเชื่อว่าผู้เล่นคนอื่นจะไม่ยอมรับ เนื่องจากการรับสารภาพเป็นกลยุทธ์ที่โดดเด่นผู้เล่นแต่ละคนจะยังคงสารภาพ ดังนั้นการกระทำจึงเป็นดุลยภาพของแนชแม้ว่าความเชื่อของผู้เล่นจะตรงกันข้ามกับการกระทำที่เกิดขึ้นจริง ฉันถูกต้องในความเข้าใจนี้หรือไม่ว่าคำจำกัดความของออสบอร์นนั้นมีลักษณะอื่นที่ไม่ใช่ดุลยภาพของแนช?

1
เมื่อใดที่การปรับสมดุลของ Divine Equilibrium ตรงกับดุลยภาพ Perfect Sequential เมื่อใด
ในเกมส่งสัญญาณดูเหมือนว่าการปรับแต่ง Cho Kreps (เกณฑ์ที่ใช้งานง่าย) คือการปรับแต่งเพื่อกำจัดสมดุลที่ไม่ดีตามลำดับ ความสมดุลของพระเจ้าและความสมดุลตามลำดับที่สมบูรณ์แบบก็เป็นสิ่งที่น่าสนใจเช่นกัน ดูเหมือนว่าโดยทั่วไปแล้วสิ่งเหล่านี้จะถูกนำไปเปรียบเทียบกับ Cho Kreps มีตัวอย่างที่น่าสนใจใดบ้างที่เปรียบเทียบความแตกต่างระหว่างความสมบูรณ์แบบต่อเนื่องและสมดุลอันศักดิ์สิทธิ์? ฉันไม่เคยเห็นแนวคิดทั้งสองพูดคุยกัน

1
Google กำหนดราคาสินค้าใน Google Play อย่างไร
ฉันเป็นนักวิจัยวิทยาศาสตร์คอมพิวเตอร์ที่มีประสบการณ์ทำงานในจุดตัดของเศรษฐศาสตร์และการคำนวณ โปรดยกโทษให้ฉันหากคำถามนี้ดูเหมือนว่าไม่เหมาะสมสำหรับผู้ดูแลระบบ ขณะนี้ฉันกำลังศึกษารูปแบบการกำหนดราคาที่แตกต่างกันและศึกษาวิธี "ที่เหมาะสม" หรือราคาเพื่อขายสินค้า ฉันสังเกตเห็นว่าบน Google Play มีภาพยนตร์ที่สามารถเช่าหรือซื้อได้ นอกจากนี้สำหรับภาพยนตร์ที่มีชื่อเสียงที่คล้ายกันฉันสังเกตเห็นว่ามักจะมีความแตกต่างอย่างมากในราคาของพวกเขา (ประมาณ 10 ยูโร) ตามอัตภาพหนึ่งดูที่การกระจายการประเมินค่าสำหรับรายการ อย่างไรก็ตามนั่นจะไม่อธิบายความแตกต่างในค่าใช้จ่ายนี้ อาจมีปัญหาในการซื้อลิขสิทธิ์ด้วย อย่างไรก็ตามโดยทั่วไป บริษัท เช่น Google กำหนดราคารายการดิจิทัลเหล่านี้อย่างไร พวกเขาอัปเดตราคาเหล่านี้เป็นประจำตามข้อมูลการขายหรือไม่ มีงานก่อนหน้าเกี่ยวกับวิธีการอย่างใดอย่างหนึ่งสามารถไปเกี่ยวกับการทำเช่นนี้? ฉันแค่มองหาเส้นทางดังนั้นความช่วยเหลือใด ๆ ที่ชื่นชมอย่างมาก

1
มีทฤษฎีบทพื้นบ้านสำหรับเกมซ้ำ ๆ บนเครือข่ายหรือไม่?
เกมบนเครือข่ายได้รับการศึกษาอย่างกว้างขวางอย่างไรก็ตามฉันไม่สามารถหาทฤษฎีบทพื้นบ้านสำหรับเกมบนเครือข่ายได้ มีหนึ่งหรือสามารถได้มาจากทฤษฎีบทพื้นบ้านที่มีอยู่แล้ว? สำหรับเกมบนเครือข่ายผมหมายถึงเกมที่ผลตอบแทนของเกมบนเวทีนั้นขึ้นอยู่กับการกระทำของเพื่อนบ้านโดยตรงในเครือข่าย ตัวอย่างง่ายๆสำหรับเกมส่วนใหญ่ (ซึ่งผลตอบแทนขึ้นอยู่กับจำนวนของเพื่อนบ้านที่เล่นในแบบเดียวกับที่คุณเป็น) หรือภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษที่เล่นกับเพื่อนบ้านแต่ละคน

3
การรวมและจำนวน บริษัท
คุณจะตอบคำถามต่อไปนี้อย่างไร? คุณทำงานให้กับ CEO ของ บริษัท ขนาดใหญ่ เขากล่าวกับคุณว่า"ในประสบการณ์ของฉันการสมรู้ร่วมคิดมีโอกาสน้อยที่จะยั่งยืนเมื่อจำนวน บริษัท ในตลาดเพิ่มขึ้นแสดงให้เห็นถึงสิ่งนี้โดยใช้รูปแบบการแข่งขันของเบอร์แทรนด์ "

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.