การประยุกต์ทฤษฎีเกมในวิทยาการคอมพิวเตอร์?


14

ในฐานะนักเรียนวิทยาศาสตร์คอมพิวเตอร์ฉันได้รับการแนะนำให้รู้จักกับทฤษฎีเกม แต่ไม่เห็นรายละเอียดมากนักในวิชานี้ ฉันค้นหาใน Google และดูหนังสือบางเล่มเกี่ยวกับทฤษฎีเกมและพวกเขาให้การยืนยันการใช้งานในวิทยาการคอมพิวเตอร์ ฉันได้เริ่มศึกษาทฤษฎีเกมอย่างเป็นทางการจากมุมมองของนักเศรษฐศาสตร์ ตอนนี้ฉันต้องการรู้การประยุกต์ใช้ทฤษฎีเกมในวิทยาการคอมพิวเตอร์ อะไรคือความสำเร็จครั้งสำคัญของนักวิทยาศาสตร์คอมพิวเตอร์ในสาขาต่าง ๆ เช่นปัญญาประดิษฐ์และทฤษฎีความซับซ้อนซึ่งใช้องค์ประกอบของทฤษฎีเกม? มีวิธีใดที่จะเข้าใกล้ทฤษฎีเกมที่มีรากฐานทางวิทยาศาสตร์คอมพิวเตอร์มากกว่าเศรษฐศาสตร์หรือไม่?



8
Vijay V. Vazirani, Noam Nisan, Tim Roughgarden และÉva Tardos, " Algorithmic Game Theory ", 2007.
Kaveh

คำตอบ:


22

XA

maxxXEaA[T(a,x)]minaAExX[T(a,x)],

ตัวอย่างเช่น: อัลกอริทึมการเรียงลำดับแบบอิงการเปรียบเทียบใด ๆ ที่กำหนดต้องใช้เวลาโดยเฉลี่ยเพื่อจัดเรียงอาร์เรย์ที่อนุญาตอย่างสม่ำเสมอโดยการสุ่ม ( พิสูจน์:ในต้นไม้ไบนารีใด ๆ กับใบอย่างน้อยครึ่งหนึ่งใบมีความลึกอย่างน้อย . ) หลักการดังนั้นยาวของหมายความว่าที่เลวร้ายที่สุดกรณีที่คาดว่าเวลาการทำงานใด ๆสุ่มเปรียบเทียบตามการเรียงลำดับ ขั้นตอนวิธีการนี้ยังn)N ( LG N ) / 2 Ω ( n log n )Ω(nlogn)N(lgN)/2Ω(nlogn)

หลักการ minmax ของ Yao นั้นปฏิบัติตามได้อย่างง่ายดายจากทฤษฎีบท minimaxของ von Neumann สำหรับเกม zero-sum จำนวนสองผู้เล่นซึ่งผู้เล่นคนใดคนหนึ่งป้อนข้อมูล


2
ไม่ควรย้อนกลับความไม่เท่าเทียมกัน? (นอกเสียจากว่าฉันขาดอะไรไป)
George

ในมือข้างหนึ่งนี่เป็นเพียง LP คู่ที่อ่อนแอและอาจเป็นประโยชน์ในการคิดอย่างนั้นเพราะการหาวิธีแก้ปัญหาที่เป็นไปได้สองทางเป็นวิธีทั่วไปที่ดีในการลดขอบเขตที่เหมาะสมที่สุดของปัญหาการย่อขนาด ที่อื่นอาจจะเป็นประโยชน์ในการคิดของผู้เล่น "อัลกอริทึม" และผู้เล่น "อินพุต" ...
Sasho Nikolov

11

มีลักษณะทางทฤษฎีเกมจำนวนคลาสที่ซับซ้อน อาจมีชื่อเสียงมากที่สุด

  • AP = PSPACE (การหาผู้ชนะในเกมที่กำหนดขึ้นซึ่งมีจำนวนพหุนามเป็นจำนวนคำถามที่สมบูรณ์ PSPACE)

  • IP = PSPACE (ในเกมกำหนดค่าความยาวพหุนามที่เล่นกับผู้เล่นที่ทำการเคลื่อนที่แบบสุ่มโดยแยกความแตกต่างระหว่างกรณีที่โอกาสในการชนะของคุณคือ> 0.9 และ <0.1 คือ PSPACE สมบูรณ์)

แต่มีจำนวนมากอีกมากมาย


10

ทฤษฎีเกมมีบทบาทสำคัญในการแก้ปัญหา "ปัญหาที่เป็นนามธรรมเต็มรูปแบบ" ในความหมายของภาษาโปรแกรม โดยเฉพาะอย่างยิ่งความหมายที่เป็นนามธรรมแรกสำหรับ PCF ของ Plotkin ได้รับการใช้เกมเป็นแบบจำลอง

การอ้างอิงที่เกี่ยวข้องคือ:

Abstraction แบบเต็มสำหรับ PCFโดย Samson Abramsky, Radha Jagadeesan และ Pasquale Malacaria

และ

ในสิ่งที่เป็นนามธรรมอย่างสมบูรณ์สำหรับ PCF: I, II และ IIIโดย JME Hyland และ C. -HL องค์

ซึ่งทั้งคู่ปรากฏในข้อมูลและการคำนวณเล่มที่ 163 ฉบับที่ 2, 15 ธันวาคม 2000


2
นั่นเป็นความคิดที่แตกต่างกันของเกมในแง่ที่ว่ามันไม่ได้มีแนวคิดเรื่องการจ่ายเงิน (ไม่สำคัญ) ซึ่งแตกต่างจากเกมในมุมมองของนักเศรษฐศาสตร์ ในบริบทของการงดออกเสียงสำหรับ PCF ฮันโนนิคเซาควรจะกล่าวถึง "Hereditarily Sequential Functionals" ด้วย
Martin Berger

7

อีกตัวอย่างที่มีชื่อเสียงของการใช้ทฤษฎีเกมคือใน CS คือการสังเคราะห์: ในการสังเคราะห์เราได้สเปคมากกว่าอินพุต I และเอาต์พุต O (เช่นในตรรกะชั่วคราวหรือเป็นออโตเมติก) และเราต้องการสร้างระบบอัตโนมัติ (เช่นขอบเขต - state transducer) ซึ่งรับประกันได้ว่าสำหรับทุกลำดับของสภาพแวดล้อมการคำนวณที่เกิดจากตัวแปลงสัญญาณเป็นไปตามข้อกำหนด

ผลก็คือการสังเคราะห์สามารถกำหนดเป็นเกมระหว่างสภาพแวดล้อมและระบบซึ่งกลยุทธ์การชนะสำหรับระบบที่สอดคล้องกับตัวแปลงสัญญาณ

เครื่องมือที่สำคัญอย่างยิ่งจากทฤษฎีเกมที่ใช้ในบริบทนี้คือการกำหนด Borel โดยเฉพาะอย่างยิ่งเมื่อเราทำงานกับการคำนวณที่ไม่มีที่สิ้นสุด

คุณสามารถเริ่มต้นการอ่านเกี่ยวกับเรื่องนี้ในการสำรวจ Moshe Vardi ของ


6

มันง่ายกว่าที่ฉันจะนึกถึงการประยุกต์ใช้วิทยาการคอมพิวเตอร์ (เทคนิค) กับทฤษฎีเกมมากกว่าวิธีอื่น ๆ มีฟิลด์ของทฤษฎีเกมอัลกอริทึมที่ใช้งานอยู่ซึ่งมุ่งเน้นไปที่การพัฒนาอัลกอริธึมที่มีประสิทธิภาพ (หรือผลลัพธ์ที่ซับซ้อน) สำหรับเช่นสมดุลของแนชค่าของแชปลีย์และแนวคิดทางทฤษฎีเกมมาตรฐานอื่น ๆ บ่อยครั้งที่แนวคิดเหล่านี้ง่ายต่อการกำหนด แต่เป็นการยากที่จะคำนวณโดยตรงจากคำจำกัดความ งานนี้ขยายอย่างน้อยเท่าที่การออกแบบกลไกที่เราพยายามจัดการกฎการประมูลเพื่อรับประกันพฤติกรรมตัวแทน (เช่นเราต้องการให้รายงานการเสนอราคาจริง) หรือผลลัพธ์โดยรวม (เช่นเราต้องการรับประกันสูงสุด รายได้.)

Noam Nisan, Yoav Shoham, Tim Roughgarden และอื่น ๆ อีกมากมายมีเอกสารที่น่าสนใจเกี่ยวกับเรื่องของการออกแบบกลไกจากมุมมองทางทฤษฎี Vince Conitzer ใช้เทคนิค AI กับปัญหาเพื่อพัฒนาการออกแบบกลไกอัตโนมัติ

ในอีกด้านหนึ่งที่ประยุกต์ใช้กับปัญญาประดิษฐ์มันยากที่จะคิดว่าระบบมัลติเอเจนต์โดยไม่คิดว่ามันเป็นเกม เฟรมเวิร์กเกม Stochastic Partially Observable (POSG) มักใช้เพื่อหารือเกี่ยวกับการตั้งค่าหลายเอเจนต์ ภายใต้เกณฑ์ฟังก์ชั่นรางวัลที่เหมาะสมมันจะกลายเป็น DEC-POMDP


5

ทฤษฎีเกม Combinatorial มีบทบาทในด้านตรรกะและวิทยาศาสตร์คอมพิวเตอร์เช่นในเกม Ehrenfeucht-fraïsséซึ่งเป็นเกมตรรกะที่เล่นบนโครงสร้างแบบจำลองเชิงทฤษฎี ผู้เล่นคนแรกเลือกองค์ประกอบจากหนึ่งในสองโครงสร้างและที่สองต้องเลือกองค์ประกอบจากที่อื่นพยายามรักษา isomorphisms ท้องถิ่นระหว่างองค์ประกอบที่เลือกจนถึงจุดนั้น

ทฤษฎีบทหลักเกี่ยวกับเกมนี้กล่าวอย่างคร่าว ๆ ว่าหากผู้เล่น 2 มีกลยุทธ์การชนะในเกมที่มีโครงสร้างมากกว่าสองโครงสร้างก็จะไม่มีสูตรตรรกะลำดับแรกที่แยกความแตกต่างของทั้งสองโครงสร้าง

ผลลัพธ์นี้ใช้ในผลลัพธ์การแสดงผลจำนวนมากสำหรับลอจิกลำดับแรกและสำหรับลอจิคัลอื่นเช่นกัน (มีการขยายทฤษฎีบทไปเป็นลอจิกลำดับที่สองแบบ monadic)

ผลลัพธ์ที่ชัดเจนเหล่านี้ส่งผลให้มีการใช้งานที่แข็งแกร่งในด้านวิทยาศาสตร์คอมพิวเตอร์เช่นการตรวจสอบอย่างเป็นทางการทฤษฎีฐานข้อมูล ฯลฯ ...


3

บทความในDistributed Computing Column 42พยายามที่จะนำมุมมองทางทฤษฎีเกมไปสู่ปัญหาการคำนวณแบบกระจาย

Distributed Computing ตรงกับทฤษฎีเกม: รวมข้อมูลเชิงลึกจากทุ่งสอง Ittai Abraham, Lorenzo Alvisi, Joseph Y. Halpern ข่าว SIGACT 42 (2) มิถุนายน 2011, หน้า 68-76

อ้างถึงจาก "Idit Keidar" บรรณาธิการในเวลานั้น:

ทฤษฎีเกมและการยอมรับความผิดมีสองรสชาติที่แตกต่างกันของความทนทานต่อระบบการกระจาย - ในอดีตนั้นแข็งแกร่งต่อผู้เข้าร่วมที่พยายามที่จะเพิ่มอรรถประโยชน์ของพวกเขาเองให้ได้มากที่สุด คอลัมน์นี้จะดูที่ความพยายามในการรวมทั้งสองเข้าด้วยกัน มันมีรีวิวงานล่าสุดที่ให้ทั้งสองรสชาติของความทนทานโดย Ittai Abraham, Lorenzo Alvisi และ Joe Halpern Ittai, Lorenzo และ Joe คุยกันว่าพฤติกรรมเชิงกลยุทธ์ของทฤษฎีเกมสามารถนำมาใช้ในโปรโตคอลแบบกระจายที่ทนต่อความผิดพลาดได้อย่างไร พวกเขาสร้างกรณีที่น่าสนใจสำหรับนำมุมมองทางทฤษฎีเกมไปสู่ปัญหาการคำนวณแบบกระจาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.