การเลือกหัวข้อการวิจัยโดยใช้ทฤษฎีเกม


19

นี้คำถามทฤษฎีเกมที่ผ่านมามีฉันคิด (นี่คือสัมผัสของหลักสูตร): มันเป็นไปได้อย่างมีประสิทธิภาพเพิ่มประสิทธิภาพของกลยุทธ์ส่วนบุคคลในการเลือกคำถามการวิจัยในการทำงานเกี่ยวกับการใช้ทฤษฎีเกม?

เพื่อที่จะมุ่งหน้าสู่การทำให้เป็นทางการของคำถามฉันจะทำสมมติฐานดังกล่าว (ไม่เป็นทางการ) ดังต่อไปนี้:

  • ฉันอย่างเท่าเทียมกัน "สนุก" ปัญหาใด ๆ ที่มีให้ฉันทำงาน (เพื่อหลีกเลี่ยงคำตอบ "อ่อน" (และถูกต้อง!) ของ "ทำในสิ่งที่คุณชอบ!"
  • ฉันอาจจะหรืออาจจะไม่ประสบความสำเร็จในการหาคำตอบสำหรับปัญหาใด ๆ ที่ฉันเลือกที่จะทำงาน สำหรับปัญหาใดก็ตามฉันมีการประเมินความน่าจะเป็นที่ฉันจะแก้ไขปัญหาได้ดีเพียงใด
  • เป้าหมายของฉันคือการเพิ่มผลตอบแทนของฉันให้มากที่สุดเมื่อถูกประเมินตามสายงาน (การสมัครงาน, การสมัครงาน, การสมัครเป็นเพื่อน ฯลฯ ) ซึ่งเป็นหน้าที่ของปัญหาที่ฉันแก้ไขและความสำคัญหรือปัญหาที่หนักหนาสาหัสเพียงใด . ฉันไม่มีความคิดที่ชัดเจนเกี่ยวกับการจ่ายเงินที่แน่นอนต่อปัญหา แต่ฉันสามารถประมาณการได้อย่างสมเหตุสมผล
  • มีความสัมพันธ์แบบผกผันหลวมระหว่างผลตอบแทนปัญหาและปัญหาความยากลำบาก ข้อความอีกข้อหนึ่งของเป้าหมายของฉันคือ "เกม" ความแตกต่าง (เช่นมองหา "ผลไม้แขวนต่ำ")
  • ตัวอย่างของปัญหาโดยรวมนี้ถูกระบุโดยรายการคำถามการวิจัย (อาจเป็นจำนวนอนันต์) ซึ่งฉันแนบไว้อย่างแน่นหนา (โดยไม่มีค่าใช้จ่ายในการคำนวณ; เป็นค่าที่ป้อนเข้า) การประมาณค่าของคำถามและความยากของคำถาม ฉันกำลังเล่นเกมนี้กับศัตรู (คนที่ประเมินฉัน); ธรรมชาติตัดสินใจให้ความน่าจะเป็นของฉันในการแก้ปัญหาที่กำหนดไม่ว่าฉันจะแก้ปัญหาได้สำเร็จหรือไม่หลังจากที่ฉันเลือกที่จะลอง

ในความพยายามที่จะทำพิธีจริงๆสิ่งที่เกิดขึ้น (และก้าวเท้าเลี่ยงจืดหรือการตอบสนอง / อภิปรายโต้แย้งประเภท) ผมจะดูปัญหานี้เป็นเกมที่กว้างขวางฟอร์มพร้อมข้อมูลที่ไม่สมบูรณ์กับชุดการกระทำที่ไม่มีที่สิ้นสุด


คำถาม : ฉันคิดว่าเกมประเภทนี้ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ อย่างไรก็ตามมีวิธีคิดเวลาแบบพหุนามเพื่อเพิ่มผลตอบแทนของฉันให้สูงสุดหรือไม่ PTAS เป็นอย่างไร

หรืออีกวิธีหนึ่งจะมีรูปแบบทฤษฎีเกมที่ถูกต้องมากขึ้นสำหรับปัญหานี้หรือไม่? ถ้าเป็นเช่นนั้นคำถามเดียวกันนี้: ฉัน (โดยประมาณ) สามารถเพิ่มผลตอบแทนให้ได้อย่างมีประสิทธิภาพสูงสุดหรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร


4
ปัญหาหนึ่งที่อาจเกิดขึ้นกับการกำหนดเกมนี้คือศัตรูของคุณผู้ประเมินคุณไม่จำเป็นต้องเล่นกับคุณ ที่จริงแล้วเป็นกรณีที่พวกเขาอยู่เคียงข้างคุณและเต็มใจที่จะเห็นคุณล้มเหลวหากคุณยังไม่ผ่านข้อกำหนดขั้นต่ำเปล่า ปฏิปักษ์ที่เป็นไปได้อีกอย่างคือนักวิจัยคนอื่น ๆ ทั้งหมดเนื่องจากพวกเขาอาจทำงาน (อาจร่วมมือกัน) ในปัญหาเดียวกันและทำงานกับคุณเพื่อให้บรรลุความสำเร็จโดยพยายามรับผลก่อนที่จะทำ
Dave Clarke

สำหรับวัตถุประสงค์ของคำถามนี้ (ฉันต้องการหลีกเลี่ยงการสนทนาให้มากที่สุดเท่าที่จะเป็นไปได้ดังนั้นนี่เป็นคำถามที่ดี ... ), สมมติว่าคนที่ประเมินฉันอยู่ภายใต้แรงกดดันบางอย่างเพื่อเลือกบุคคลที่ดีที่สุดเพียงคนเดียวสำหรับ รางวัลพิเศษดังนั้นพวกเขาจึงเป็นปฏิปักษ์ นอกจากนี้สมมติว่า "สิ่งใดที่เป็นของจริงอย่างแท้จริงจะเป็นเช่นนั้น: ดั้งเดิม" ดังนั้นนักวิจัยคนอื่น ๆ ก็ไม่ได้กังวลอย่างจริงจัง ฉัน (แน่นอน!) มีความสนใจส่วนตัวในความเป็นไปได้อื่น ๆ แต่ฉันคิดว่าการเปิดทิ้งไว้จะเป็นการเชิญคำตอบที่ไม่ดี :)
Daniel Apon

ปัจจัยหนึ่งในปัญหาที่อาจทำแบบจำลองที่แตกต่าง: การประเมินความน่าจะเป็นของโครงสร้างความสำเร็จ / รางวัลต่อปัญหาที่ฉันเลือกที่จะทำงาน
Daniel Apon

2
ดังนั้นวิธีหนึ่งในการจำลองเกมคือ: คุณกำลังพยายามที่จะรวบรวมจุดวิจัยก่อนที่นาฬิกาดำรงตำแหน่งหมดอายุในเวลาTคำถามที่คุณอาจทำงานในแต่ละเป็นมูลค่าจุดวิจัยและสำหรับแต่ละคำถามมีฟังก์ชั่นซึ่งจะช่วยให้ความน่าจะเป็นของการแก้ได้ถ้าคุณใช้เวลามัน เพิ่มโอกาสในการสะสมคะแนนให้เพียงพอก่อนที่นาฬิกาจะหมด คุณอาจพูดอะไรเกี่ยวกับกลยุทธ์ที่ดีที่สุดสำหรับเกมนี้ T R ฉันP ฉัน ( t ) tRTRผมPผม(เสื้อ)เสื้อ
Peter Shor

2
แน่นอนในชีวิตจริงคำถามแต่ละข้อที่คุณตอบจะปลดล็อคคำถามเพิ่มเติมซึ่งคุณไม่สามารถคาดการณ์ล่วงหน้าได้ แต่อาจจะง่ายกว่าและ / หรือคุ้มค่ามากกว่าคำถามที่คุณเริ่มด้วย แต่เมื่อคุณเริ่มทำแผนผังกลยุทธ์ เช่นนี้โอกาสในการค้นหาสิ่งที่น่าสนใจที่คุณสามารถพูดเกี่ยวกับเกมจะลดลงอย่างมาก
Peter Shor

คำตอบ:


4

ฉันจะพยายามตอบคำถามของคุณโดยเสนอโมเดลสำรองสำหรับคำถาม ฉันมักจะถามคำถามมากกว่าที่ฉันตอบที่นี่ดังนั้นฉันหวังว่าคุณจะให้อภัยหากคำตอบของฉันไม่เหมาะแม้ว่าฉันจะทำดีที่สุด

ฉันคิดว่าวิธีวลีคำถามที่ดีที่สุดสำหรับการอนุญาตให้ทฤษฎีเกมมีประโยชน์จะต้องสมมติสถานการณ์การแข่งขันที่สูงขึ้น นั่นคือต้องมีการแข่งขันระหว่างนักแสดงที่หลากหลาย ดังนั้นฉันจะถือว่าต่อไปนี้:

  • มีจำนวนมาก แต่แน่นอนคือnของนักวิจัยอื่น ๆ พยายามที่จะไล่ตามชุดเดียวกันของคำถามการวิจัยที่มีซึ่งผมเรียกQว่าคุณจะอยู่ในความสนใจ
  • ปัญหาการวิจัยแต่ละครั้งจะถูกกำหนดโดยลักษณะดังต่อไปนี้:
    • การลงทุนครั้งหรือฉันจำเป็นต้องมีการมองเห็นว่าคุณจะสามารถแก้ปัญหาได้หรือไม่
    • ความน่าจะเป็นของความสำเร็จหรือSในการแก้ปัญหา เมื่อคุณมาถึง "ช่วงเวลาแห่งความจริง" และใช้เวลาพอสมควรธรรมชาติจะตัดสินใจแบบสุ่มหากคุณจะสามารถแก้ปัญหาได้หรือไม่
    • เป็นประโยชน์ต่ออาชีพการงานของคุณหรือU (เช่นในอรรถประโยชน์) หากประสบความสำเร็จ
  • นักวิจัยแต่ละคนมีระดับต่าง ๆ กันในปริมาณต่อไปนี้:
    • เวลาที่มีอยู่สำหรับการลงทุนในการวิจัยที
    • ความสามารถในการวิจัยr
    • ทักษะความสัมพันธ์ระหว่างบุคคลและคุณสมบัติช่วยในการทำงานอื่น ๆl (เหมือนที่เป็นที่นิยม) ซึ่งจะกำหนดว่าผู้วิจัยจะใช้ประโยชน์จากความสำเร็จในการวิจัยของพวกเขาได้ดีเพียงใดเพื่อความก้าวหน้าในอาชีพ

ตอนนี้สมมติว่าไม่มีความร่วมมือกับปัญหาใด ๆ ที่เป็นไปได้ลองพิจารณาสิ่งที่ฉันกำลังจะเรียกว่าเป็น "เกมวนซ้ำแบบไดนามิก" นี่เป็นเกมที่เล่นซ้ำ ๆ แต่มีการเปลี่ยนแปลงเล็กน้อยในแต่ละครั้งที่เล่น

ให้Mเป็นจำนวนการเคลื่อนไหวหรือการเลี้ยวในเกม การปรากฏตัวครั้งแรกของเกมสามารถแสดงเป็นรายการที่มีนักแสดงทุกคน (นักวิจัย) และปัญหาที่พวกเขาสามารถทำงานได้นอกเหนือไปจากค่าทั้งหมดที่เกี่ยวข้องกับนักแสดงแต่ละคนและปัญหาที่ฉันระบุไว้ข้างต้น (ฉันคิดว่าแน่นอนว่านักวิจัยทุกคนรู้ทุกอย่างที่รู้ในปัจจุบันเกี่ยวกับปัญหาทั้งหมดและเกี่ยวกับนักวิจัยคนอื่น ๆ ทำให้เกมนี้เป็นข้อมูลที่สมบูรณ์แบบ)

ในระหว่างการวนซ้ำของเกมนักแสดงแต่ละคนเลือกคำถามการวิจัยเพื่อทำงาน นักแสดงแต่ละคนได้รับอนุญาตให้สลับคำถามได้ตลอดเวลาและหากปัญหาได้รับการแก้ไขผลประโยชน์ในอาชีพของคุณจะลดลงเหลือ 0 สำหรับผู้เล่นอื่น ๆ หากผู้เล่นลงทุนเวลาเพียงพอและไม่สามารถแก้ปัญหาได้ผู้เล่นนั้นจะถูกห้ามไม่ให้พยายามแก้ไขปัญหานั้นอีกครั้ง ... แม้ว่าผู้เล่นคนอื่น ๆ จะได้รับอนุญาตให้ทำงานต่อไปในปัญหาและนักแสดงคนอื่นอาจสามารถแก้ไขได้ มันประสบความสำเร็จ เกมจะจบลงหลังจากมีการหมุนMทั้งหมด

แต่ละครั้งที่นักวิจัยเลือกปัญหาจะทำให้ผู้เล่นเข้าใกล้ถึง "ช่วงเวลาแห่งความจริง" และอาจแก้ปัญหาได้โดยธรรมชาติอนุญาต ปัญหาเมื่อแก้ไขเพิ่มผลประโยชน์บางอย่างให้กับอาชีพนักวิจัยบนพื้นฐานลิตร ความสามารถในการวิจัยขยายความน่าจะเป็นของความสำเร็จในขณะที่เวลาว่างขยายความสามารถในการทำให้ความก้าวหน้าในการเปิดที่กำหนด

ฉันสงสัยว่ามีอัลกอริทึมเวลาพหุนามใด ๆ สำหรับการแก้ปัญหานี้ ฉันไม่เห็นเหตุผลว่าทำไมนักวิจัยควร จำกัด การเล่นกลยุทธ์สมดุลแนชอย่างแท้จริงดังนั้นปัญหาจะเกี่ยวข้องกับกลยุทธ์สมดุลของแนชและดังนั้นจึงเป็นสิ่งที่เลวร้ายที่สุดใน PPAD ถ้าคุณพิจารณา "การแก้ปัญหา" หมายถึง "การหาแนช" ดุลยภาพสำหรับปัญหา " (ใคร ๆ ก็นึกออกว่าถ้าคุณเป็นนักวิจัยเชิงรุกมากที่สุดคุณอาจไปข้างหน้าและคำนวณสมดุลของแนชที่คุณชื่นชอบแล้วส่งสัญญาณไปยังผู้เล่นคนอื่น ๆ ... ดังนั้นให้ความมั่นใจกับคุณว่าไม่มีใครเปลี่ยนกลยุทธ์ออกจากกลยุทธ์ โปรไฟล์ที่คุณส่งสัญญาณ)

นี่คือคำตอบที่เกี่ยวข้องมากที่สุดที่ฉันเคยโพสต์ ฉันหวังว่ามันมีค่าอย่างน้อย กรุณาแจ้งให้เราทราบหากใครมีการตอบสนองใด ๆ หรือมันหรือคำแนะนำสำหรับการปรับปรุง


1
ฟิลิปขอบคุณสำหรับคำตอบ! นี่เป็นมุมมองที่ยอดเยี่ยมเกี่ยวกับปัญหา ฉันสงสัยว่า: คุณคิดวิธีใดที่จะเพิ่มแนวคิดของ "ข้อมูลบางส่วน" ลงในปัญหาเพื่อให้สถานะของ PPAD สมบูรณ์หรือไม่ บางสิ่งบางอย่างเพื่อจำลองความจริงที่ว่าในฐานะผู้เล่นในเกมนี้ฉันไม่จำเป็นต้องรู้ว่าศัตรูของฉันกำลังทำอะไร (เช่นฉันไม่มีความรู้ที่สมบูรณ์แบบเกี่ยวกับคำถามที่พวกเขากำลังพิจารณาและพวกเขาเชื่อว่าพวกเขามี ตอบคำถามแต่ละข้อ) การเพิ่มสิ่งนี้มีผลต่อความซับซ้อนของการคำนวณสมดุลของแนชหรือไม่? (ฉันไม่รู้!)
Daniel Apon

1
@Daniel Apon: ขอบคุณสำหรับความคิดเห็น! ฉันไม่คิดว่ามันจะเป็นการยากที่จะเปลี่ยนแปลงเงื่อนไขดังนั้นคุณเพียงแค่ไม่รู้ว่าศัตรูของคุณกำลังทำอะไรหรือคุณลักษณะของพวกเขาคืออะไร ข้อแม้เดียวคือฉันคิดว่าการรับประกันการมีอยู่ของสมดุลของแนชจะหายไปเมื่อคุณจัดการกับเกมข้อมูลที่ไม่สมบูรณ์ ฉันไม่รู้มากเกี่ยวกับสิ่งที่เรียกว่า "เกม Stackelberg" แต่ฉันคิดว่าเกมเหล่านี้อาจเกี่ยวข้องกับการเปลี่ยนแปลงที่คุณเสนอ ฉันสงสัยจริง ๆ แล้วว่าวิธีแก้ปัญหาที่ดีที่สุดคืออะไรในเกมข้อมูลที่ไม่สมบูรณ์ ... ฉันจะให้ความคิดบางอย่าง
Philip White

ฉันอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ ... ฉันคิดว่าเกมของ Bayesian อาจเกี่ยวข้องกับที่นี่เพราะพวกเขาคุ้นเคยกับเกมที่มีข้อมูลไม่สมบูรณ์ นี่คือลิงค์ไปยังหน้า Wikipedia ที่ฉันมองไปที่: en.wikipedia.org/wiki/Bayesian_game
Philip White
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.