สถานการณ์ในชีวิตจริงประเภทใดที่เราสามารถใช้อัลกอริธึมแบบหลายแขนโจรได้?


15

โจรหลายแขนทำงานได้ดีในสถานการณ์ที่คุณมีทางเลือกและคุณไม่แน่ใจว่าสิ่งใดจะเพิ่มความเป็นอยู่ที่ดีที่สุดของคุณ คุณสามารถใช้อัลกอริทึมสำหรับสถานการณ์ชีวิตจริงบางอย่าง เป็นตัวอย่างการเรียนรู้อาจเป็นสาขาที่ดี:

หากเด็กกำลังเรียนรู้ช่างไม้และเขาไม่ดีที่มันอัลกอริทึมจะบอกเขา / เธอว่าเขา / เธออาจต้องดำเนินการต่อไป หากเขา / เธอทำได้ดีอัลกอริทึมจะบอกให้เขา / เธอเรียนรู้ฟิลด์นั้นต่อไป

การออกเดทเป็นฟิลด์ที่ดีเช่นกัน:

คุณเป็นผู้ชายที่พยายามอย่างมากในการตามหาผู้หญิง อย่างไรก็ตามความพยายามของคุณจะไม่ได้รับการยืนยันอย่างแน่นอน อัลกอริทึมควร "เล็กน้อย" (หรืออย่างยิ่ง) ทำให้คุณขยับเขยื้อนต่อไป

สถานการณ์ในชีวิตจริงอื่น ๆ ที่เราสามารถใช้อัลกอริทึมโจรหลายแขนสำหรับ?

PS: หากคำถามกว้างเกินไปโปรดแสดงความคิดเห็น หากมีฉันทามติฉันจะลบคำถามของฉัน


3
เนื่องจากมี 3 คำตอบ upvoted (จนถึง) ฉันไม่คิดว่ามันกว้างเกินกว่าจะตอบได้
gung - Reinstate Monica

@ gung ฉันมีผู้โหวตมากขึ้นและพวกเขายังไม่ได้สะท้อนคะแนนของฉัน มาทำไม
Andy K

5
นั่นเป็นเพราะหัวข้อนี้คือ community wiki (CW), @AndyK เมื่อเธรดคือ CW ผู้คนจะไม่ได้รับชื่อเสียงจาก upvotes (หรือทำให้เสียจาก downvotes) คุณจะได้รับป้ายตามปกติ คำถามเช่นนี้ที่ขอรายชื่อสิ่งของ & ที่ไม่มีคำตอบที่ถูกต้องชัดเจนว่าควรปิดหัวข้อในเว็บไซต์ SE การประนีประนอมของเรา (ฉันเชื่อว่าเว็บไซต์อื่นทำเช่นนี้) คือการอนุญาตคำถามดังกล่าวเป็นกรณี ๆ ไป แต่เพื่อทำให้พวกเขา CW
gung - Reinstate Monica

ยุติธรรมเพียงพอ @gung
Andy K

1
การรับเข้าเรียนวิทยาลัย การคัดเลือกตัวชี้วัดเพื่อคัดเลือกผู้รับบริจาคอวัยวะ
EngrStudent - Reinstate Monica

คำตอบ:


8

เมื่อคุณเล่นเกมโปเกมอนดั้งเดิม (สีแดงหรือสีน้ำเงินและสีเหลือง) และคุณไปถึงเมืองศิลาดลเครื่องสล็อตจรวดของทีมมีอัตราต่อรองที่แตกต่างกัน Multi-Arm Bandit อยู่ตรงนั้นถ้าคุณต้องการที่จะปรับ Porygon ให้เร็วที่สุด

ผู้คนพูดถึงปัญหาด้วยการเลือกตัวแปรการปรับแต่งในการเรียนรู้ของเครื่อง โดยเฉพาะอย่างยิ่งถ้าคุณมีตัวแปรจำนวนมากการสำรวจการเอารัดเอาเปรียบกับการถูกเอ่ยถึง ดูเช่น Spearmint หรือแม้แต่กระดาษใหม่ในหัวข้อนี้ที่ใช้อัลกอริทึมแบบง่ายสุดในการเลือกพารามิเตอร์การปรับ (และวิธีที่ดีกว่าเทคนิคการปรับตัวแปรอื่น ๆ )


6

สามารถใช้ในการตั้งค่าการออกแบบ / การวิจัยทางการแพทย์ ยกตัวอย่างเช่นผมเชื่อว่าQ-การเรียนรู้ขั้นตอนวิธีการที่ใช้ในการต่อเนื่อง, การมอบหมายงานหลายทดลองแบบสุ่ม ( ทดลอง SMART ) ความคิดที่หลวมคือระบอบการรักษาปรับให้เหมาะสมกับความคืบหน้าของผู้ป่วย เห็นได้ชัดว่ามันอาจจะดีที่สุดสำหรับผู้ป่วยแต่ละราย แต่ก็สามารถมีประสิทธิภาพมากขึ้นในการทดลองทางคลินิกแบบสุ่ม


ขอบคุณ @gung ฉันไม่รู้เกี่ยวกับอัลกอริทึมนั้น ฉันจะอ่านมัน
Andy K

6

พวกเขาจะใช้ในการทดสอบ A / B ของการโฆษณาออนไลน์ที่โฆษณาที่แตกต่างกันจะแสดงให้ผู้ใช้ที่แตกต่างกันและขึ้นอยู่กับการตัดสินใจผลลัพธ์ที่ทำเกี่ยวกับโฆษณาที่จะแสดงในอนาคต นี้จะอธิบายในบทความที่ดีโดย Google วิจัยสตีเว่นแอสกอตต์


ขอบคุณ @Tim ฉันอ่านว่าvwo.com/blog/multi-armed-bandit-algorithm
Andy K

2

ฉันถามคำถามเดียวกันกับQuora

นี่คือคำตอบ

  • การจัดสรรเงินทุนสำหรับแผนกต่าง ๆ ขององค์กร

  • การเลือกนักกีฬาที่มีประสิทธิภาพสูงสุดออกจากกลุ่มนักเรียนที่กำหนดเวลา จำกัด และเกณฑ์การคัดเลือกโดยพลการ

  • เพิ่มรายได้ของเว็บไซต์ให้สูงสุดขณะเดียวกันก็ทำการทดสอบคุณสมบัติใหม่ (แทนการทดสอบ A / B) คุณสามารถใช้งานได้ทุกเวลาที่คุณต้องการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดเมื่อคุณมีข้อมูลไม่เพียงพอที่จะสร้างแบบจำลองทางสถิติที่เข้มงวด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.