เสียใจภายในในการเพิ่มประสิทธิภาพนูนออนไลน์


19

Zinkevich ของ "การเพิ่มประสิทธิภาพออนไลน์นูน" ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generalizes "ลดความเสียใจ" เรียนรู้อัลกอริธึมจากการตั้งค่าเชิงเส้นการตั้งค่านูนและ "นอกเขตเสียใจ" . มีลักษณะทั่วไปที่คล้ายกันสำหรับเสียใจภายใน? (ฉันไม่แน่ใจโดยสิ้นเชิงแม้จะหมายถึงอะไรก็ตาม)


เป็นไปได้หรือไม่ที่จะเพิ่มคำอธิบายสั้น ๆ เกี่ยวกับความเสียใจภายในคำถาม
Moritz

ใน "ผู้เชี่ยวชาญ" ตามปกติการตั้งค่าความเสียใจภายในจะหมายความว่าในการหวนกลับคุณไม่ต้องการสลับการกระทำหนึ่งกับอีกการกระทำอย่างสม่ำเสมอตลอดประวัติศาสตร์ กระดาษ Blum-Mansour น่าจะเป็นข้อมูลอ้างอิงที่ดีที่สุดสำหรับความเสียใจภายในและภายนอก: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

คำตอบ:


9

ลอง "การเรียนรู้ไม่มีความเสียใจในเกมนูน" โดยกอร์ดอนวาล์ดและเครื่องหมายhttp://portal.acm.org/citation.cfm?id=1390202 นามธรรมของมันดูเหมือนว่ามันอาจจะตอบคำถามของคุณหรืออย่างน้อยก็มีใครตอบคำถามนั้นจะอ้างหรืออ้างถึงโดยกระดาษที่


0

กระดาษ Avrim Blum นี้ชี้การเชื่อมต่อระหว่างความเสียใจจากภายนอกและภายใน ตามนามธรรม externa regret เป็นการวัดว่าอัลกอริทึมที่ไม่ดีนั้นเทียบกับการกระทำที่ดีที่สุดคงที่ในขณะที่ความเสียใจภายในเปรียบเทียบกับการเปลี่ยนแปลงที่ดีที่สุดของวิธีการนั้น (การเปลี่ยนแปลงคงที่ที่ดีที่สุดของเอาท์พุท คลาส B)


1
กระดาษ Blum-Mansour ไม่ได้อยู่ในการตั้งค่า "การเพิ่มประสิทธิภาพการนูนออนไลน์" แต่เป็นการตั้งค่าใน "ผู้เชี่ยวชาญ" แบบเส้นตรง คำถามของฉันคือสิ่งที่คล้ายกันหรืออัลกอริทึมเสียใจโดยตรงภายในอื่น ๆ สามารถใช้ในการตั้งค่านูน
Noam
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.