คำถามติดแท็ก gt.game-theory

คำถามเชิงทฤษฎีที่เกี่ยวข้องกับวิทยาศาสตร์คอมพิวเตอร์และทฤษฎีเกม

2
ความซับซ้อนของเกมข้อมูลบางส่วน จำกัด
เมื่อพิจารณาจากผลรวมของศูนย์ข้อมูลผลรวมเกมที่มีขอบเขตเพียงไม่กี่รัฐเท่านั้น ซึ่งผลลัพธ์ที่เป็นไปได้คือ [แพ้, วาด, ชนะ] ด้วยค่า [-1,0, + 1] ตามลำดับ ความซับซ้อนของการประมาณค่าของเช่นนั้นคืออะไร เกมเสริมภายใน ?ϵϵ\epsilon โดยเฉพาะอย่างยิ่งฉันไม่สามารถคิดอัลกอริทึมใด ๆสำหรับการทำเช่นนั้น ส่วนที่เหลือของโพสต์นี้ทุ่มเทเพื่อให้คำอธิบาย ปัญหาอย่างละเอียดยิ่งขึ้น ดังนั้นหากคุณสามารถทราบได้ว่าคำถามที่ด้านบนสุด ของโพสต์นี้มีความหมายว่าอย่างไรจึงไม่มีเหตุผลที่คุณจะอ่านส่วนที่เหลือของโพสต์นี้ ได้รับเครื่องตัดสินกับรัฐ , ด้วยสถานะเริ่มต้นที่กำหนดs 0 , รัฐs a ซึ่งเป็นคู่คะแนนคือ[ - 1 , + 1 ] , รัฐs bซึ่งมีคะแนนเป็นคู่[ + 1 , - 1 ] , และสถานะของแบบฟอร์ม{1,2,3,...,S}{1,2,3,...,S}\{1,2,3,...,S\}s0s0s_0sasas_a[−1,+1][−1,+1][-1,+1]sbsbs_b[+1,−1][+1,−1][+1,-1] โดยที่:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table][p1_info,p2_info,num_of_choices,player_to_move,next_state_table][\mbox{p1_info,p2_info,num_of_choices,player_to_move,next_state_table}] player_to_move∈{1,2}player_to_move∈{1,2}\mbox{player_to_move} \in \{1,2\} เป็นฟังก์ชั่นจาก { …

3
การใช้ตัวเลขเซอร์เรียลสำหรับเกม
มีการก่อสร้างที่ดีมากโดยคอนเวย์ของตัวเลขเซอร์เรียล พวกเขาคือ "ตัวเลข" ที่มีทั้งจำนวนจริงและเลขลำดับสั่งทั้งหมดและมีคุณสมบัติทั้งหมดของเขตข้อมูล (ยกเว้นพวกเขาไม่ได้ฟอร์มชุด แต่ชั้นเรียน) ดูตัวอย่างPDFหรือWikipediaสำหรับการแนะนำ พวกเขาสามารถวางนัยทั่วไปมากขึ้นเพื่อที่เรียกว่า "เกม" ซึ่งได้รับการแนะนำให้รู้จักกับการศึกษาเกม combinatorial แรงบันดาลใจดั้งเดิมของ Conway คือการวิเคราะห์เกม Goโดยเฉพาะเกม endgame นั้นเหมาะอย่างยิ่งที่จะสร้างแบบจำลองด้วย "เกมเซอร์เรียล" คำถามของฉันคือคุณรู้หรือไม่ว่ามีใครใช้วิธีนี้ใน AI (เช่นผู้เล่นคอมพิวเตอร์) เพื่อปรับปรุงระดับของเกม ฉันสนใจเป็นพิเศษในกรณีของ Go แต่คนอื่น ๆ ด้วย ถ้าไม่มีมีอุปสรรคหรือเหตุผลว่าทำไมมันจึงไม่ใช่ความคิดที่ดี?

2
ยากแค่ไหนที่จะนับจำนวน optima ท้องถิ่นสำหรับปัญหาใน PLS
สำหรับปัญหาการค้นหาในท้องถิ่นพหุนามเรารู้ว่าต้องมีวิธีแก้ปัญหาอย่างน้อยหนึ่งโซลูชั่น (เหมาะสมที่สุดในท้องถิ่น) อย่างไรก็ตามอาจมีวิธีแก้ปัญหาอื่นอีกมากมายยากแค่ไหนที่จะนับจำนวนโซลูชันสำหรับปัญหาที่เกิดจากการใช้ PLS ฉันสนใจปัญหาการตัดสินใจเป็นพิเศษ: อินสแตนซ์ของปัญหาที่ทำให้ PLS นี้สมบูรณ์มีวิธีแก้ไขสองทางหรือไม่? ความซับซ้อนนั้นขึ้นอยู่กับปัญหาที่เราเลือกไว้หรือไม่ ถ้าเป็นเช่นนั้นฉันจะสนใจ2SAT แบบถ่วงน้ำหนักเป็นพิเศษ (ดังที่นิยามไว้ใน [SY91] และ [Rou10]) ฉันรู้ว่าการนับจำนวนโซลูชั่นที่น่าพอใจสำหรับ 2SAT นั้นเป็น # P-complete แต่เมื่อดูอย่างแรกดูเหมือนว่า Optima ในท้องถิ่นของน้ำหนัก 2SAT และโซลูชันสำหรับ 2SAT นั้นไม่มีอะไรเหมือนกันทั้งหมด ฉันก็รู้ว่าสำหรับ PPAD ลูกพี่ลูกน้องของ PLS [CS02] แสดงให้เห็นว่าการนับจำนวนของ Nash equilibria คือ # P-hard นี่เป็นการชี้ให้เห็นว่าปัญหาที่คล้ายคลึงกันของ PLS เช่นการนับจำนวนดุลยภาพเชิงกลยุทธ์ล้วนๆในเกมแออัดก็ยากเช่นกัน อ้างอิง [CS02] Conitzer, V. และ Sandholm, T. (2002) ผลลัพธ์ที่ซับซ้อนเกี่ยวกับสมดุลของแนช …

5
ทฤษฎีเกมอัลกอริทึม - แนวคิดดุลยภาพที่ไม่เป็นมาตรฐาน?
ฉันเริ่มการศึกษาทฤษฎีเกมอัลกอริทึมและดูเหมือนว่าแนวคิดเรื่องความสมดุลมักจะเกิดขึ้นจากจุดคงที่ในกราฟ อย่างไรก็ตามมีคนดูแนวคิดสมดุลทางเลือกเช่นวงจร จำกัด ? ฉันสามารถจินตนาการได้ว่าวงจร จำกัด ที่ "รัดแน่น" - นั่นคือวงจรในกราฟที่มีความยาวน้อยมาก - ถือได้ว่าเป็นสิ่งที่ "ใกล้" กับคำจำกัดความมาตรฐานของดุลยภาพ ฉันพยายามขุดไปรอบ ๆ Google Scholar แต่เพื่อประโยชน์เล็กน้อย

2
ซึ่งครอบครัวของกราฟเป็นทั่วไปภูมิศาสตร์ใน ?
ในฐานะที่เป็น @Marzio กล่าวถึงเกมต่อไปนี้เป็นที่รู้จักกันทั่วไปภูมิศาสตร์ รับกราฟและจุดเริ่มต้น , เกมถูกกำหนดดังนี้:G=(V,E)G=(V,E)G=(V,E)v∈Vv∈Vv \in V ในแต่ละเทิร์น (ผู้เล่นสองคนสลับกัน) ผู้เล่นเลือกแล้วเกิดสิ่งต่อไปนี้:u∈N(v)u∈N(v)u\in N(v) vvvเช่นเดียวกับทุกขอบถูกลบออกจากGGGG u→vu→vu\to v (เช่นvvvได้รับการปรับปรุงให้เป็นจุดยอดuuu ) ผู้เล่นที่ถูกบังคับให้เลือก "ปลายตาย" (เช่นจุดสุดยอดที่ไม่มีขอบออก) กราฟครอบครัวใดเป็นกลยุทธ์ที่ดีที่สุดที่คำนวณได้ในเวลาพหุนาม ตัวอย่างเช่นมันง่ายที่จะเห็นว่าถ้าGGGเป็น DAG เราสามารถคำนวณกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นได้อย่างง่ายดาย

1
ความซับซ้อนของเกมนี้คืออะไร?
นี่เป็นข้อสรุปทั่วไปของคำถามก่อนหน้าของฉันคำถามก่อนหน้านี้ Let MMMเป็นพหุนามเวลาเครื่องกำหนดว่าสามารถถามคำถามบาง oracle เริ่มแรกAว่างเปล่า แต่สามารถเปลี่ยนแปลงได้หลังจากเกมที่จะอธิบายไว้ด้านล่าง ให้xเป็นสตริงAAAAAAxxx พิจารณาเกม Alice และ Bob ต่อไปนี้ ในขั้นต้นอลิซและบ็อบมีmAmAm_AและmBmBm_Bดอลลาร์ตามลำดับ Alice ต้องการMA(x)=1MA(x)=1M^A(x)=1และ Bob ต้องการMA(x)=0MA(x)=0M^A(x)=0 0 ในทุกขั้นตอนของเกมผู้เล่นสามารถเพิ่มสตริงyyyลงในAAA ; ค่าใช้จ่ายนี้f(y)f(y)f(y)ดอลล่าร์โดยที่f:{0,1}∗→Nf:{0,1}∗→Nf: \{0,1\}^* \to \mathbb{N}เป็นฟังก์ชันคำนวณเวลาแบบพหุนาม นอกจากนี้ผู้เล่นสามารถพลาดขั้นตอนของเขาหรือเธอ การเล่นสิ้นสุดลงหากผู้เล่นทั้งสองใช้เงินทั้งหมดหรือหากผู้เล่นบางคนพลาดขั้นตอนที่เขาหรือเธออยู่ในตำแหน่งแพ้ (ซึ่งกำหนดโดยมูลค่าปัจจุบันของMA(x)MA(x)M^A(x) ) คำถาม:ปัญหาของการกำหนดผู้ชนะของเกมนี้สำหรับ M,f,x,mA,mBM,f,x,mA,mBM, f, x, m_A, m_Bคือ EXPSPACE - งานที่เสร็จสมบูรณ์หรือไม่ โปรดทราบว่าMMMสามารถถาม (สำหรับที่อยู่) เพียงสตริงของความยาวพหุนามเพื่อให้มีความรู้สึกที่อลิซหรือบ๊อบที่จะเพิ่มสายอีกต่อไปมากขึ้นที่จะไม่มี ดังนั้นปัญหานี้อยู่ในEXPSPACE AAAAAA ในคำถามก่อนหน้าของฉันการเพิ่มทุกสตริงลงในAAAค่าใช้จ่ายหนึ่งดอลลาร์ (เช่นf≡1f≡1f \equiv 1 ) จากนั้น (ตามที่แสดงโดยLance Fortnow …

1
เกมนี้เป็นเกมที่สมบูรณ์แบบหรือเปล่า?
Let เป็นพหุนามเวลาเครื่องกำหนดว่าสามารถถามคำถามบาง oracle เริ่มแรกAว่างเปล่า แต่สามารถเปลี่ยนแปลงได้หลังจากเกมที่จะอธิบายไว้ด้านล่าง ให้xเป็นสตริงMMMAAAAAAxxx พิจารณาเกม Alice และ Bob ต่อไปนี้ ในขั้นต้นอลิซและบ็อบมีและm Bดอลลาร์ตามลำดับ อลิซต้องการM ( x ) = 1และบ๊อบต้องการM ( x ) = 0ม.AmAm_Aม.BmBm_BMA( x ) = 1MA(x)=1M^A(x)=1MA( x ) = 0MA(x)=0M^A(x)=0 ในทุกขั้นตอนของเกมผู้เล่นสามารถเพิ่มหนึ่งสตริงใน ; ราคานี้หนึ่งดอลลาร์ นอกจากนี้ผู้เล่นสามารถพลาดขั้นตอนของเขาหรือเธอAAA การเล่นสิ้นสุดลงหากผู้เล่นทั้งสองใช้เงินทั้งหมดหรือหากผู้เล่นบางคนพลาดขั้นตอนเมื่อเขาหรือเธออยู่ในตำแหน่งแพ้ (ซึ่งกำหนดโดยมูลค่าปัจจุบันของ )MA( x )MA(x)M^A(x) คำถาม:ปัญหาของการกำหนดผู้ชนะของเกมนี้สำหรับคือM, x , mA, มBM,x,mA,mBM, x, m_A, m_B EXPSPACE …

1
ความสมดุลในเกมที่หยุดชะงัก
พิจารณาเกมที่มีผู้เล่น 2 คนดังต่อไปนี้: ธรรมชาติสุ่มเลือกโปรแกรม ผู้เล่นแต่ละคนเล่นหมายเลขใน [0, อินฟินิตี้] รวมเพื่อตอบสนองต่อการเคลื่อนไหวของธรรมชาติ ใช้จำนวนขั้นต่ำของผู้เล่นและเรียกใช้โปรแกรมสำหรับ (ไม่เกิน) ว่าหลายขั้นตอน (ยกเว้นว่าผู้เล่นทั้งคู่เลือกอินฟินิตี้) หากโปรแกรมหยุดทำงานผู้เล่นที่เล่นหมายเลขต่ำสุดจะได้รับ 1 แต้ม หากโปรแกรมไม่หยุดผู้เล่นคนนั้นจะเสีย 1 คะแนน ผู้เล่นที่เล่นเป็นจำนวนไม่น้อยได้รับ 0 คะแนนและผู้เล่นทั้งสองได้รับ 0 ถ้าพวกเขาเล่นอนันต์ (กรณีมุมอาจได้รับการจัดการด้วยวิธีใดก็ตามที่รักษาจิตวิญญาณของปัญหาได้ดีที่สุด - เช่นความหมายกึ่งอัตโนมัติตอนบนอาจเป็นประโยชน์) คำถาม: เกมนี้มีสมดุลของแนชที่คำนวณได้หรือไม่? หากไม่มีข้อกำหนดการคำนวณผู้เล่นแต่ละคนจะเล่นตามจำนวนขั้นตอนที่แน่นอนซึ่งโปรแกรมหยุด (หรือไม่มีที่สิ้นสุดหากไม่หยุด) หากคุณลองโต้แย้งตามแนวทแยงมุมตามปกติสำหรับปัญหาการหยุดพักคุณจะพบว่ามีความสมดุลในกลยุทธ์ที่หลากหลายดังนั้นวิธีการที่ชัดเจนจึงไม่สามารถใช้งานได้ทันที อาจจะมีวิธีการปรับแต่งบางอย่าง? ในทางตรงกันข้ามความเท่าเทียมกันของสนามปิดจริงหมายความว่าเกมที่ จำกัด ด้วยการจ่ายผลตอบแทนที่คำนวณได้มีความสมดุลที่คำนวณได้ เกมนี้ไม่ได้ จำกัด แต่พื้นที่กลยุทธ์ถูกปิดและการคำนวณผลตอบแทนดังนั้นอาจใช้เล่ห์เหลี่ยมเดียวกันกับทฤษฎีบทของ Glicksberg หรือบางสิ่งในเส้นเลือดนั้น? ปัญหาคือหากไม่มีความต้องการในการคำนวณความสมดุลอยู่ในกลยุทธ์ที่บริสุทธิ์ดังนั้นความพยายามใด ๆ ที่จะพิสูจน์การมีอยู่ของความสมดุลที่คำนวณได้โดยใช้การดำรงอยู่ของความสมดุลที่คำนวณได้อาจจะต้องอธิบายว่าทำไมสมดุลถูกลดระดับจากบริสุทธิ์ ดูเหมือนว่าจะเป็นปัญหาที่ผู้คนอาจไม่เคยตอบคำถามนี้มาก่อน แต่อาจมองสิ่งที่คล้ายกัน ฉันไม่สามารถพลิกผันได้มากนัก แต่ถ้าใครรู้เรื่องของวิญญาณกรุณาแจ้งให้เราทราบ! แรงจูงใจ: มีปรีชาญาณทั่วไปที่การอ้างอิงตนเองเป็นบล็อกหลักในการคำนวณ - …

3
การปรับแต่งการประมาณค่าแบบคู่สำหรับการวิเคราะห์เครือข่าย
เมื่อพิจารณาการโต้ตอบกับเครือข่ายมักจะยากที่จะคำนวณพลวัตเชิงวิเคราะห์และใช้การประมาณ การประมาณค่าเฉลี่ยฟิลด์มักจบลงด้วยการเพิกเฉยต่อโครงสร้างเครือข่ายโดยสมบูรณ์และแทบจะไม่เป็นสิ่งที่ดีนัก การประมาณที่เป็นที่นิยมคือการประมาณคู่ซึ่งพิจารณาความสัมพันธ์ที่เกิดขึ้นระหว่างโหนดที่อยู่ติดกัน การประมาณนั้นแน่นอนถ้าเราพิจารณากราฟของ Cayley และดีมากถ้าเราดูกราฟแบบสุ่มผิดปกติ ในทางปฏิบัติก็ยังมีการประมาณที่ดีสำหรับกรณีเมื่อเรามีกราฟสุ่มที่มีการศึกษาระดับปริญญาเฉลี่ยและการกระจายตึงตัวของการศึกษาระดับปริญญารอบkน่าเสียดายที่เครือข่ายและการโต้ตอบจำนวนมากที่น่าสนใจไม่ได้ถูกสร้างแบบจำลองโดยกราฟเหล่านี้ พวกเขามักจะเป็นแบบอย่างที่ดีโดยกราฟที่มีการแจกแจงระดับที่แตกต่างกันมาก (เช่นเครือข่ายที่ไม่มีมาตราส่วนเป็นต้น) โดยมีค่าสัมประสิทธิ์การจัดกลุ่มเฉพาะ (และสูง) หรือระยะทางสั้นที่สุดโดยเฉพาะเส้นทางสั้น (ดูเพิ่มเติมAlbert & Barabasi 2001 ) .kkkkkkkkk มีการปรับแต่งการประมาณค่าคู่ที่ทำงานได้ดีสำหรับเครือข่ายประเภทนี้หรือไม่? หรือมีการประมาณการวิเคราะห์อื่น ๆ ตัวอย่างของการโต้ตอบบนเครือข่าย ฉันคิดว่าฉันจะยกตัวอย่างสิ่งที่ฉันหมายถึงโดยการโต้ตอบบนเครือข่าย ฉันจะรวมตัวอย่างที่ค่อนข้างทั่วไปจากทฤษฎีเกมวิวัฒนาการ คุณสามารถนึกถึงแต่ละโหนดว่าเป็นเอเจนต์ (โดยปกติจะแสดงเพียงแค่กลยุทธ์) ที่เล่นเกมแบบคงที่บางคู่กับเอเจนต์อื่นที่มีขอบ ดังนั้นเครือข่ายที่กำหนดพร้อมกับการกำหนดกลยุทธ์ให้แต่ละโหนดจะสร้างผลตอบแทนสำหรับแต่ละโหนด จากนั้นเราจะใช้การจ่ายผลตอบแทนเหล่านี้และโครงสร้างเครือข่ายเพื่อพิจารณาการกระจายของกลยุทธ์ระหว่างโหนดสำหรับการทำซ้ำครั้งถัดไป (ตัวอย่างทั่วไปอาจใช้สำหรับแต่ละตัวแทนเพื่อคัดลอกเพื่อนบ้านที่มีการจ่ายผลตอบแทนสูงสุดหรือตัวแปรที่น่าจะเป็น) คำถามที่เรามักจะสนใจสอดคล้องกับการรู้จำนวนตัวแทนของแต่ละกลยุทธ์และวิธีการที่การเปลี่ยนแปลงการทำงานล่วงเวลา บ่อยครั้งที่เรามีการกระจายที่มั่นคง (ซึ่งเราต้องการทราบหรือโดยประมาณ) หรือบางครั้ง จำกัด รอบหรือแม้แต่สัตว์แปลกใหม่ หากเราทำการประมาณค่าเฉลี่ยของฟิลด์ในโมเดลประเภทนี้เราจะใช้รับสมการจำลองแบบเป็นแบบไดนามิกซึ่งจะละเว้นโครงสร้างเครือข่ายอย่างโจ่งแจ้งและแม่นยำสำหรับกราฟที่สมบูรณ์เท่านั้น หากเราใช้การประมาณแบบคู่ (เช่นOhtsuki & Nowak 2006 ) เราจะได้รับการเปลี่ยนแปลงที่แตกต่างกันเล็กน้อย (จริง ๆ แล้วจะเป็นการจำลองแบบพลวัตด้วยเมทริกซ์ผลตอบแทนที่ปรับเปลี่ยนซึ่งการปรับเปลี่ยนขึ้นอยู่กับระดับของกราฟและข้อมูลเฉพาะของขั้นตอนการอัปเดต) ซึ่งตรงกับการจำลองที่ดีสำหรับกราฟสุ่ม แต่ไม่เหมาะสำหรับเครือข่ายอื่น ๆ …

3
ปัญหาการเลือกคำหลักในการประมูลการตลาดผ่านเครื่องมือค้นหา
ก่อนอื่นฉันก็ยังไม่แน่ใจว่าคำถามนี้เหมาะสำหรับคำถามนี้หรือไม่ดังนั้นฉันจะไม่โกรธถ้าผู้ชมคิดว่าไม่ใช่กรณีนี้ ... ในการตลาดเสิร์ชเอ็นจิ้นมีปัญหาหลายอย่างที่น่าสนใจ การออกแบบกลไกการประมูลที่ยุติธรรม (และให้ผลกำไร) และการคำนวณกลยุทธ์การเสนอราคาที่ดีที่สุดภายใต้ทรัพยากรทางการเงินที่มีขอบเขตเป็นสองตัวอย่างของปัญหาที่น่าสนใจ (และบันทึกไว้อย่างดี) ปัญหาที่น่าสนใจอีกประการหนึ่งคือการเลือกหนึ่งในคำหลัก: วิธีเลือกคำหลักที่ให้ผลกำไรมากที่สุด (ไม่มีลิงก์ไปยังจำนวนเงินที่มีอยู่หรือไปยัง "หัวข้อ" ของคำหลัก) "กำไร" สามารถให้รายได้ที่ดีที่สุดหรือกำไรที่ดีที่สุด ปัญหาเหล่านี้เกี่ยวข้องกับความไม่แน่นอน: ไม่ทราบอัตราการคลิกผ่านของคำหลักอัตราการแปลงไม่เป็นที่รู้จักเช่นกัน คุณรู้หรือไม่ว่างานด้านทฤษฎีบางอย่างเกี่ยวข้องกับปัญหานี้หรือไม่?

3
อัลกอริทึมสำหรับการคำนวณสมดุลของ Nash
ฉันค้นหาฟอรัมเพื่อดูว่ามีการถามก่อนหน้านี้หรือไม่และในขณะที่มีการพูดถึงทฤษฎีเกมอัลกอริทึมฉันก็ไม่พบปัญหานี้ ฉันพยายามคิดว่าอัลกอริทึมที่รู้จักกันดีที่สุดสำหรับการคำนวณโดยประมาณ (กลยุทธ์แบบผสม) Nash equilibria ในเกม n-person จำกัด แน่นอนอัลกอริทึมนี้จะเป็น PPAD ฉันสนใจความเร็ว / ประสิทธิภาพมากกว่าความแม่นยำที่สมบูรณ์แบบของอัลกอริทึม ขอบคุณฟิลิป

1
เกมจ้างเลขานุการ
นี้เป็นส่วนขยายของคลาสสิกปัญหาเลขานุการ ในเกมการจ้างงานคุณมีชุดของผู้สมัครC={c1,…,cN}C={c1,…,cN}\mathcal C=\{c_1,\ldots,c_N\}และเรียงลำดับความสามารถของผู้ปฏิบัติงานแต่ละคน Wlog เราคิดว่ามีฝีมือดีที่สุดตามด้วยเป็นต้นc1c1c_1c2c2c_2 ลำดับของการสัมภาษณ์ผู้สมัครถูกสุ่มอย่างสม่ำเสมอและเป็นที่รู้จัก (อย่างชัดเจน) กับนายจ้าง ตอนนี้สมมติว่าคุณมีตลาดกับผู้ว่าจ้าง 2 ราย ในทุก ๆ รอบผู้สมัครใหม่กำลังสัมภาษณ์ทั้งสอง บริษัท (เรียกพวกเขาว่า ) ระหว่างการสัมภาษณ์ทั้งและสังเกตการเรียงลำดับบางส่วนของผู้สมัครที่ผ่านมาทั้งหมดรวมถึงผู้ให้สัมภาษณ์ปัจจุบัน บริษัท ต่างๆ (อิสระ) ตัดสินใจว่าจะจ้างผู้สมัครในวันนี้หรือไม่A,BA,BA,BAAABBB น่าเสียดายสำหรับมันไม่สามารถแข่งขันทางการเงินกับข้อเสนอของดังนั้นหากทั้งคู่ขยายข้อเสนอสำหรับคนงานจะได้รับความพึงพอใจBBBAAAAAA นอกจากนี้เมื่อสัญญาณเลขานุการ บริษัท อาจจะไม่สัมภาษณ์ผู้สมัครใด ๆ เพิ่มเติมและคู่แข่งทราบถึงการลงนามในสัญญา เป้าหมายของแต่ละ บริษัท คือการจ้างผู้สมัครที่มีทักษะดีกว่า (ตรงข้ามกับปัญหาแบบคลาสสิกที่ บริษัท เดียวต้องการหาเลขานุการที่ดีที่สุด) เนื่องจากเป็นที่ทราบกันดีว่า บริษัท ที่มีเลขานุการที่ดีกว่านั้น ตลาด. เป็นกลยุทธ์ที่ดีที่สุดในขณะที่ บริษัท ขนาดใหญ่ (สิ่ง)?AAA แล้ว บริษัท ขนาดเล็ก ( ) ล่ะ?BBB ถ้าทั้งสอง บริษัท …

1
เมื่อใดที่ -Nash กลยุทธ์ดุลยภาพมาบรรจบกับกลยุทธ์ Nash Equilibrium?
Nash Equilibria ไม่สามารถคำนวณได้โดยทั่วไป -Nash สมดุลคือชุดของกลยุทธ์ที่กำหนดกลยุทธ์ของฝ่ายตรงข้ามแต่ละ Obtains เล่นภายในของผลตอบแทนที่คาดว่าจะเป็นไปได้สูงสุด การหาสมดุลของแนชที่กำหนดและเกมคือ - สมบูรณ์ϵϵ\epsilonϵϵ\epsilonϵϵ\epsilonϵϵ\epsilonPPADPPAD\mathsf{PPAD} การทำตามคำจำกัดความอย่างเคร่งครัดดูเหมือนจะไม่มีเหตุผลใดที่จะเชื่อได้ว่ากลยุทธ์ของ -Nash equilibrium ที่ใดก็ตามอยู่ใกล้กับกลยุทธ์ของแนชดุลใด ๆ อย่างไรก็ตามเรามักจะเห็นวรรณกรรมค่อนข้างลื่นไหลใช้วลีเช่น "คำนวณสมดุลแนช" เมื่อมันหมายถึงการพูดว่า "คำนวณสมดุลประมาณแนช"ϵϵ\epsilon ดังนั้นฉันสงสัยว่าเมื่อสองหมายถึงแรก; นั่นคือเกมที่เราคาดหวัง -Nash equilibria ว่า "ใกล้" กับ Nash equilibria?ϵϵ\epsilon อย่างเป็นทางการมากขึ้นสมมติว่าฉันมีเกมสำหรับผู้เล่นคนและลำดับของโปรไฟล์กลยุทธ์\nnn(s(1)1,…,s(1)n),(s(2)1,…,s(2)n),(s(3)1,…,s(3)n),…(s1(1),…,sn(1)),(s1(2),…,sn(2)),(s1(3),…,sn(3)),…(s_1^{(1)},\dots,s_n^{(1)}), (s_1^{(2)},\dots,s_n^{(2)}), (s_1^{(3)},\dots,s_n^{(3)}), \dots แต่ละคือ -Nash ดุลยภาพและลำดับบรรจบกันเป็นศูนย์(s(i)1,…,s(i)n)(s1(i),…,sn(i))(s_1^{(i)},\dots,s_n^{(i)})ϵiϵi\epsilon_iϵ1,ϵ2,ϵ3,…ϵ1,ϵ2,ϵ3,…\epsilon_1,\epsilon_2,\epsilon_3,\dots คำถามของฉัน: เมื่อใด (ภายใต้เงื่อนไข / สมมุติฐาน) กลยุทธ์ทั้งหมดมาบรรจบกันเมื่อใด นั่นคือสำหรับผู้เล่นแต่ละคน ,จำเป็นต้องมาบรรจบกันjjjs(1)j,s(2)j,s(3)j,…sj(1),sj(2),sj(3),…s_j^{(1)},s_j^{(2)},s_j^{(3)},\dots ภายใต้เงื่อนไขอะไรเพิ่มเติมขีด จำกัด ของลำดับนี้จริง ๆ แล้วดุลของเกมแนช? (สำหรับฉันแล้วดูเหมือนว่าไม่จำเป็นต้องมีข้อสมมติฐานเพิ่มเติมเช่นหากกลยุทธ์ทั้งหมดมาบรรจบกันขีด จำกัด …

2
การทำความเข้าใจหลักฐานการออกแบบกลไก
ฉันได้ดิ้นรนกับรายละเอียดทางเทคนิคของการพิสูจน์เกี่ยวกับทฤษฎีการประมูลในเอกสารนี้: http://users.eecs.northwestern.edu/~hartline/omd.pdf ทฤษฎีบท 2.5 โดยเฉพาะ: เงื่อนไขที่จำเป็นและเพียงพอสำหรับกลไกที่เป็นความจริง ยิ่งไปกว่านั้นโดยเฉพาะทิศทางไปข้างหน้าของการพิสูจน์ที่ให้ไว้ในหน้า 6 การกำหนดค่าตามความจริงเป็น โวลต์ผมviv_iและค่าทั่วไปอาจเป็นเท็จ (เช่นการเสนอราคา) เป็น ขผมbib_iผู้เขียนยังคงยืนยันสองปริมาณเพิ่มเติม Z1z1z_1 และ Z2z2z_2. จากนั้นเขาก็กำหนดว่า โวลต์ผม=Z1vi=z1v_i = z_1, ขผม=Z2bi=z2b_i = z_2ซึ่งให้ความไม่เสมอภาคบนพื้นฐานของงานก่อนหน้าของกระดาษ เขายังกำหนดว่า โวลต์ผม=Z2vi=z2v_i = z_2, ขผม=Z1bi=z1b_i = z_1ซึ่งให้ความแตกต่างที่คล้ายกัน แต่แตกต่างกันขึ้นอยู่กับงานก่อนหน้าของกระดาษ โอเคยุติธรรมพอ จากนั้นเขาก็ลบความไม่เท่าเทียมกันอันหนึ่งออกจากอีกอันหนึ่งและหาวิธีทำให้ได้ผลลัพธ์ตามที่ต้องการบนพื้นฐานของพีชคณิตที่เป็นผลสืบเนื่อง ฉันไม่เข้าใจว่าทำไมการลบนั้นเป็นธรรม - เขาดูเหมือนว่าจะลบความไม่เท่าเทียมกันสองข้อที่อยู่บนสมมติฐานที่แตกต่างกันอย่างสิ้นเชิง (ในความเป็นจริงตรงกันข้าม) และทุกครั้งที่ฉันเห็นมัน ฉันค่อนข้างมั่นใจว่าฉันเห็นวิธีการพื้นฐานนี้ (หนังสือของ Shoham และ Leyton-Brown หรือไม่ฉันไม่ได้เข้าไปใกล้เพื่อตรวจสอบ) ดังนั้นมันจึงเป็นความคิดทั่วไป แต่ฉันไม่สามารถผ่านมันไปได้ ใครช่วยให้ฉันเข้าใจว่าทำไมถึงถูกต้องหรืออธิบายให้ฉันสิ่งที่ฉันหายไป? (ฉันพยายามพิสูจน์ผลลัพธ์ที่ต้องการโดยสมมติว่ามีค่าสามค่า - ค่าจริง …

1
ผู้ชนะเกมการ์ดในเวอร์ชั่นที่ง่ายขึ้น
ฉันถามปัญหานี้ในMathOverflowโดยไม่มีคำตอบที่น่าพอใจ พิจารณาต่อไปนี้เกมที่สองผู้เล่นซึ่งเป็นความเรียบง่ายของเกมการ์ดที่เรียกว่าผู้ชนะ (สูตรต่อไปนี้นำมาจากความคิดเห็นโดย Guillaume Brunerie บน MathOverflow) มีผู้เล่นสองคน A และ B ผู้เล่นแต่ละคนมีชุดไพ่ (เซตย่อยของ ) ซึ่งมองเห็นได้จากผู้เล่นทั้งสอง เป้าหมายของเกมคือการกำจัดไพ่ของตัวเอง ผู้เล่นคนแรกเล่นการ์ดใด ๆ บนโต๊ะจากนั้นผู้เล่นคนอื่นจะต้องเล่นไพ่ที่ใหญ่กว่า (อย่างเคร่งครัด) และต่อไปจนกว่าผู้เล่นคนใดคนหนึ่งจะไม่สามารถเล่นหรือตัดสินใจที่จะผ่าน จากนั้นไพ่บนโต๊ะจะถูกยกเลิกและผู้เล่นคนอื่นจะเริ่มต้นอีกครั้งโดยการเล่นไพ่ใด ๆ (ซึ่งจะตามด้วยไพ่ที่ใหญ่กว่า) และต่อไปจนกว่าผู้เล่นหนึ่งในสองคนจะหมดไพ่และชนะเกม{ 1 , … , n }{1,...,n}\{1,\dots,n\} ฉันต้องการทราบกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น (ถ้าเขาสามารถชนะได้) นิยามที่เป็นทางการ แสดงโดยการกำหนดค่าของเกมที่ชุดไพ่ของผู้เล่นคนแรกคือชุดของไพ่ของผู้เล่นที่สองคือและการ์ดที่ใหญ่ที่สุดบนโต๊ะคือโดยที่หมายความว่าไม่มีบัตรบนโต๊ะ ผมอยากจะอัลกอริทึมในการคำนวณการรับไม่ว่าจะเป็นผู้เล่นคนแรกมีกลยุทธ์ชนะในการกำหนดค่าB)w ( i , A , B )W(ผม,A,B)w(i,A,B)AAABBBผมผมii = 0ผม=0i=0ฉัน, A , Bผม,A,Bi,A,Bw ( i …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.