เพื่อความเป็นรูปธรรมพิจารณาแผ่นเสียงสำหรับการแก้เกมศูนย์ผลรวมสองผู้เล่นที่ผู้เล่นแต่ละคนมีการกระทำสมมติว่าแต่ละรายการของเมทริกซ์ผลตอบแทนคือAมากที่สุด 1 ในค่าสัมบูรณ์ เพื่อความง่ายเราไม่ได้ตั้งสมมติฐาน
สมมติว่า runtime สามารถใช้เพื่อประมาณค่าของเกมนี้
เทคนิคหนึ่งสำหรับการประมาณค่านี้คือวิธีการปรับปรุงแบบหลายค่า (เรียกว่าการเรียนรู้แบบไม่เสียใจในบริบทนี้) สิ่งนี้ทำให้เกิดข้อผิดพลาดของโดยที่ ˜ Oซ่อนปัจจัยการบันทึก
ผมไม่ทราบว่าสิ่งที่ภูมิทัศน์ข้อผิดพลาดที่ดีที่สุดสำหรับวิธีการที่รู้จักกันจุดภายในรูปลักษณ์ที่ต้องการ แต่ฉันเดาผิดพลาดเป็นสิ่งที่ต้องการ )
วิธีการปรับปรุงการคูณให้ข้อผิดพลาดที่เป็นพหุนามผกผันในTวิธีการจุดภายในให้ข้อผิดพลาดที่มีขนาดเล็กชี้แจงในT ข้อผิดพลาดของสิ่งที่ดีที่สุดของทั้งสองจึงค่อยๆลดลงชั่วขณะหนึ่งจนกระทั่งจุดด้านในจับขึ้นหลังจากนั้นข้อผิดพลาดก็ตกจากหน้าผา สัญชาตญาณของฉันขัดต่อการแลกเปลี่ยนเวลา / ข้อผิดพลาดที่ดีที่สุดเท่าที่จะทำได้ด้วยวิธีนี้
คำถามของฉัน :
มีอัลกอริทึมสำหรับการโปรแกรมเชิงเส้นโดยประมาณที่ทำให้มุมของเส้นโค้งเวลา / ข้อผิดพลาดการค้าราบรื่นขึ้นหรือไม่? นั่นคืออัลกอริธึมที่ทำอย่างน้อยที่สุดเท่าที่จะทำได้ดีที่สุดสำหรับทั้งสองสำหรับค่าของพารามิเตอร์เวลาที่มีอยู่และมีการแลกเปลี่ยนเวลา / ข้อผิดพลาดที่ค่อนข้างราบรื่น วิธีที่ชาญฉลาดยิ่งขึ้นในการรวมเทคนิคการอัพเดทภายในและการปรับปรุงแบบทวีคูณมากกว่าการใช้สองวิธีที่ดีกว่ามาใช้เป็นวิธีหนึ่งที่จะได้อัลกอริธึมดังกล่าว
การอ้างอิง :
การปรับปรุงหลายหลากโดยทั่วไป:
http://www.cs.princeton.edu/~arora/pubs/MWsurvey.pdf
การปรับปรุงแบบทวีคูณสำหรับเกมที่มีผลรวมเป็นศูนย์:
http://dx.doi.org/10.1016/0167-6377(95)00032-0
การปรับปรุงหลายหลากสำหรับแผ่นปิด / บรรจุ LPs:
http://arxiv.org/PS_cache/arxiv/pdf/0801/0801.1987v1.pdf
กระดาษจุดภายในเดิม:
http://math.stanford.edu/~lekheng/courses/302/classics/karmarkar.pdf
มหาดไทยชี้จากมุมมองทางคณิตศาสตร์ที่ใช้:
การเขียนโปรแกรมแบบไม่เชิงเส้นของ Bertsekasหัวข้อ 4.1.1