ทำไมวงดนตรีถึงมีประสิทธิภาพอย่างไร้เหตุผล


14

ดูเหมือนว่าเป็นจริงซึ่งกลุ่มผู้เรียนนำไปสู่ผลลัพธ์ที่ดีที่สุดเท่าที่จะเป็นไปได้ - และมันกลายเป็นสิ่งที่หายากมากเช่นสำหรับรุ่นเดียวที่ชนะการแข่งขันเช่น Kaggle มีคำอธิบายทางทฤษฎีว่าทำไมชุดตระการตาจึงมีประสิทธิภาพ


1
ฉันเดาว่าเป็นทฤษฎีขีด จำกัด กลาง แต่ฉันไม่มีเหตุผล

คำตอบ:


13

สำหรับรูปแบบเฉพาะที่คุณป้อนข้อมูลให้เลือกคุณสมบัติเลือกพารามิเตอร์หลายมิติและอื่น ๆ เปรียบเทียบกับความเป็นจริงมันทำให้เกิดข้อผิดพลาดสามประเภท:

  • อคติ (เนื่องจากความซับซ้อนของโมเดลต่ำเกินไปทำให้มีอคติสุ่มตัวอย่างในข้อมูลของคุณ)
  • ความแปรปรวน (เนื่องจากเสียงรบกวนในข้อมูลของคุณข้อมูลส่วนเกินของคุณ)
  • การสุ่มของความเป็นจริงที่คุณพยายามคาดการณ์ (หรือขาดคุณสมบัติการคาดเดาในชุดข้อมูลของคุณ)

ตระการตาเฉลี่ยจำนวนรุ่นเหล่านี้ อคติเนื่องจากการสุ่มตัวอย่างอคติจะไม่ได้รับการแก้ไขด้วยเหตุผลที่ชัดเจนมันสามารถแก้ไขอคติความซับซ้อนของแบบจำลองบางส่วนได้ โดยเฉพาะอย่างยิ่งรุ่นที่มีความสัมพันธ์ต่ำทำให้เกิดข้อผิดพลาดที่แตกต่างกันมากในพื้นที่นี้บางรุ่นทำงานได้ดีในบางส่วนของพื้นที่คุณลักษณะ คุณจะสามารถลดความแปรปรวนนี้ได้เล็กน้อยโดยเฉลี่ย นี่คือเหตุผลที่ตระการตาส่องแสง


6

คำตอบที่เลือกนั้นยอดเยี่ยม แต่ฉันต้องการเพิ่มสองสิ่ง:

  1. มีการตั้งข้อสังเกตว่าค่าเฉลี่ยการคาดการณ์ของมนุษย์ให้การคาดการณ์ที่ดีกว่าการทำนายส่วนบุคคลใด ๆ นี้เป็นที่รู้จักกันเป็นภูมิปัญญาของฝูงชน ตอนนี้คุณสามารถยืนยันว่าเป็นเพราะบางคนมีข้อมูลที่แตกต่างกันดังนั้นคุณจึงมีค่าเฉลี่ยข้อมูล แต่ไม่เป็นความจริงแม้แต่กับงานเช่นคาดเดาจำนวนถั่วในขวด ฉันตั้งสมมติฐานว่ามันเกี่ยวข้องกับเหตุผลบางอย่างที่ระบุไว้ด้านบนเกี่ยวกับตัวแบบ data mining
  2. เทคนิคบางอย่างเช่นวิธีการดรอปเอาท์ในเครือข่ายประสาทเทียม (ซึ่งในการทำซ้ำแต่ละครั้งในระหว่างการฝึกอบรมคุณใช้เครือข่ายประสาทของคุณเพียงก้อนเดียว) ให้ผลลัพธ์ที่คล้ายกับกลุ่มเครือข่ายประสาท เหตุผลคือคุณบังคับให้โหนดทำงานอย่างมีประสิทธิภาพเช่นเดียวกับโหนดอื่นอย่างมีประสิทธิภาพการสร้าง meta-ensemble ฉันกำลังพูดถึงสิ่งนี้เพื่อทำให้ประเด็นที่ว่าเราอาจจะสามารถแนะนำข้อดีของวงดนตรีในรูปแบบดั้งเดิม

6

ตระการตาชนะการทำนายด้วยเหตุผลทางทฤษฎีและปฏิบัติ

มีทฤษฎีพื้นฐานของการพยากรณ์ที่ดีที่สุดถ้าเราหมายถึงการทำนายเหตุการณ์ต่อไปในลำดับบนพื้นฐานของความรู้เกี่ยวกับเหตุการณ์ก่อนหน้า การคาดการณ์ของโซโลมอนอฟฟ์ (โซโลมอนอฟฟ์ 1964) นั้นเหมาะสมที่สุดในหลาย ๆ ด้านรวมถึงมัน“ จะเรียนรู้ที่จะทำนายลำดับการคำนวณใด ๆ ได้อย่างถูกต้องด้วยจำนวนข้อมูลขั้นต่ำที่แน่นอนเท่านั้น” (Hutter, Legg & Vitanyi 2007) ตัวทำนาย Solomonoff ทำการชั่งน้ำหนักโปรแกรมทั้งหมดที่เข้ากันได้กับข้อมูลที่มีอยู่ตามความซับซ้อนของโปรแกรม Kolmogorov และความน่าจะเป็นที่โปรแกรมกำหนดให้กับข้อมูลโดยการรวม Epicurean (“ รักษาทฤษฎีทั้งหมด”) และ ปรัชญาของ Ockham (“ ชอบทฤษฎีที่เรียบง่าย”) ในกรอบแนวคิดแบบเบย์

คุณสมบัติการเพิ่มประสิทธิภาพของการทำนาย Solomonoff อธิบายการค้นพบที่แข็งแกร่งที่คุณอ้างถึง: ค่าเฉลี่ยมากกว่าแบบจำลองแหล่งที่มาหรือผู้เชี่ยวชาญช่วยปรับปรุงการคาดการณ์ วิธีการต่าง ๆ ที่เห็นในทางปฏิบัตินั้นสามารถนำมาใช้เป็นแนวทางในการคำนวณเพื่อประมาณ Solomonoff - และ MML (Wallace 2005) สำรวจความสัมพันธ์อย่างชัดเจนแม้ว่าจะไม่ใช่

วอลเลซ (2548) ตั้งข้อสังเกตว่าตัวทำนายโซโลมอนอฟไม่ได้เป็นตัวเงิน - มันเก็บตัวอย่างที่ไม่มีที่สิ้นสุด - แต่พลังการทำนายส่วนใหญ่ย่อมตกอยู่ในโมเดลที่ค่อนข้างเล็ก ในบางโดเมนแบบจำลองที่ดีที่สุดเพียงอย่างเดียว (หรือตระกูลของแบบจำลองที่แยกไม่ออกได้เกือบ) อาจอธิบายได้ว่าเป็นส่วนใหญ่ของพลังการทำนายและมีประสิทธิภาพที่เหนือกว่าตระการตาทั่วไป แต่ในโดเมนที่ซับซ้อนที่มีทฤษฎีน้อยมาก ดังนั้นค่าเฉลี่ยผู้สมัครที่มีเหตุผลควรปรับปรุงการทำนาย ในการชนะรางวัล Netflix ทีมของ Bellkor ได้รวมโมเดลกว่า 450 แบบ (Koren 2009)

โดยทั่วไปแล้วมนุษย์จะแสวงหาคำอธิบายที่ดีเพียงคำเดียว: ในโดเมน "ทฤษฎีระดับสูง" เช่นฟิสิกส์สิ่งเหล่านี้ใช้ได้ดี แน่นอนถ้าพวกเขาจับการเปลี่ยนแปลงสาเหตุพื้นฐานพวกเขาควรจะเอาชนะได้เกือบ แต่ในกรณีที่ทฤษฎีที่มีอยู่นั้นไม่เหมาะสมกับปรากฏการณ์ (เช่นคำแนะนำภาพยนตร์หรือภูมิศาสตร์การเมือง) รุ่นเดียวจะมีประสิทธิภาพต่ำกว่า: ทั้งหมดไม่สมบูรณ์ดังนั้นจึงไม่มีใครควรครอง ดังนั้นการให้ความสำคัญกับวงดนตรี (สำหรับการเรียนรู้ของเครื่อง) และภูมิปัญญาของฝูงชน (สำหรับผู้เชี่ยวชาญ) และความสำเร็จของโปรแกรมเช่น IARPA ACE และโครงการพิเศษเพื่อการตัดสินใจที่ดี (Tetlock & Gardiner 2015)

อ้างอิง

  • M. Hutter, S. Legg และ P. Vitanyi,“ ความน่าจะเป็นของอัลกอริทึม,” Scholarpedia, vol. 2, 2007, p. 2572
  • Y. Koren,“ The BellKor Solution to Netflix Grand Prize,” 2009
  • โซโลมอนอฟเรย์ (มีนาคม 2507) "ทฤษฎีทางการของการอนุมานอุปนัยฉัน" (PDF) ข้อมูลและการควบคุม 7 (1): 1–22 ดอย: 10.1016 / S0019-9958 (64) 90223-2
  • โซโลมอนอฟเรย์ (มิถุนายน 2507) "ทฤษฎีทางการของการอนุมานอุปนัยตอนที่ II" (PDF) สารสนเทศและการควบคุม 7 (2): 224–254 ดอย: 10.1016 / S0019-9958 (64) 90131-7
  • PE Tetlock, คำพิพากษาทางการเมืองของผู้เชี่ยวชาญ: มันดีแค่ไหน? เราจะรู้ได้อย่างไรสำนักข่าวมหาวิทยาลัยพรินซ์ตัน, 2548
  • Tetlock, PE, & Gardner, D. (2015) Superforecasting: ศิลปะและวิทยาศาสตร์แห่งการทำนาย นิวยอร์ก: คราวน์
  • CS Wallace การอนุมานเชิงสถิติและการเหนี่ยวนำโดยความยาวข้อความต่ำสุด Springer-Verlag, 2005
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.