หลังจากอ่านคำถามนี้อีกครั้งฉันสามารถมอบข้อ จำกัด ต่อไปนี้ให้คุณ:
สมมติว่ากลุ่มตัวอย่างถูกวาดด้วย iid การแจกแจงคงที่และการสูญเสียถูก จำกัด โดยจากนั้นด้วยความน่าจะเป็นอย่างน้อย ,
1 - δ E [ E ( H ) ] ≤ E ( H ) + B √B1 - δ
E [ E( h ) ] ≤ E^( h ) + บันทึก B1δ2 ม-----√
โดยที่คือขนาดตัวอย่างและคือความมั่นใจ ขอบเขตของความไม่เท่าเทียมของ McDiarmid นั้นมีอยู่เล็กน้อย1 - δม.1 - δ
E [ E ( H ) ] E ( H )ม.คือขนาดตัวอย่างคือข้อผิดพลาดทั่วไปและคือข้อผิดพลาดในการทดสอบสมมติฐานE[E(h)]E^(h)
โปรดอย่ารายงานเฉพาะข้อผิดพลาดในการตรวจสอบความถูกต้องไขว้หรือข้อผิดพลาดในการทดสอบซึ่งไม่มีความหมายโดยทั่วไปเนื่องจากเป็นเพียงการประมาณค่า
โพสต์เก่าสำหรับบันทึก:
ฉันไม่แน่ใจว่าฉันเข้าใจคำถามของคุณทั้งหมด แต่ฉันจะแทงมัน
อันดับแรกฉันไม่แน่ใจว่าคุณจะกำหนดช่วงเวลาการทำนายสำหรับการเลือกแบบจำลองได้อย่างไรเนื่องจากฉันเข้าใจแล้วช่วงเวลาการทำนายทำให้สมมติฐานบางส่วนกระจาย แต่คุณสามารถได้รับความไม่เท่าเทียมกันของความเข้มข้นซึ่งผูกตัวแปรสุ่มโดยความแปรปรวนของความน่าจะเป็น ความไม่เท่าเทียมกันของความเข้มข้นถูกใช้ผ่านการเรียนรู้ของเครื่องจักรรวมถึงทฤษฎีขั้นสูงสำหรับการส่งเสริม ในกรณีนี้คุณต้องการเชื่อมโยงข้อผิดพลาดทั่วไป (ข้อผิดพลาดของคุณโดยทั่วไปคุณไม่เห็นจุด) จากข้อผิดพลาดเชิงประจักษ์ (ข้อผิดพลาดของคุณในชุดทดสอบ) บวกกับคำที่ซับซ้อนและคำที่เกี่ยวข้องกับความแปรปรวน
ตอนนี้ฉันต้องขจัดความเข้าใจผิดเกี่ยวกับการตรวจสอบข้ามซึ่งเป็นเรื่องธรรมดามาก การตรวจสอบความถูกต้องไขว้จะให้การประมาณที่ไม่ลำเอียงถึงข้อผิดพลาดที่คาดหวังของแบบจำลองสำหรับขนาดตัวอย่างที่มีการแก้ไข หลักฐานนี้ใช้งานได้กับโปรโตคอลการลาแบบครั้งเดียวเท่านั้น สิ่งนี้ค่อนข้างอ่อนแอเนื่องจากไม่มีข้อมูลเกี่ยวกับความแปรปรวน ในทางกลับกันการตรวจสอบความถูกต้องจะส่งคืนแบบจำลองที่ใกล้กับโซลูชันการลดความเสี่ยงทางโครงสร้างซึ่งเป็นทางออกที่ดีที่สุดในทางทฤษฎี คุณสามารถหาหลักฐานได้ในภาคผนวกที่นี่: http://www.cns.nyu.edu/~rabadi/resources/scat-150519.pdf
ดังนั้นวิธีที่จะได้รับลักษณะทั่วไปที่ถูกผูกไว้? (โปรดจำไว้ว่าข้อ จำกัด ของการวางนัยทั่วไปนั้นเป็นช่วงเวลาการคาดเดาเกี่ยวกับข้อผิดพลาดในการวางนัยสำหรับรุ่นเฉพาะ) ขอบเขตเหล่านี้เป็นอัลกอริทึมเฉพาะ น่าเสียดายที่มีหนังสือเรียนเพียงเล่มเดียวเท่านั้นที่กำหนดขอบเขตสำหรับอัลกอริทึมที่ใช้กันทั่วไปทั้งหมดในการเรียนรู้ของเครื่อง (รวมถึงการส่งเสริม) หนังสือเล่มนี้เป็นพื้นฐานของการเรียนรู้ของเครื่อง (2012) โดย Mohri, Rostamizadeh และ Talwalkar สำหรับสไลด์บรรยายที่ครอบคลุมเนื้อหาคุณสามารถค้นหาได้ในหน้าเว็บของ Mohri: http://www.cs.nyu.edu/~mohri/ml14/
ในขณะที่องค์ประกอบของการเรียนรู้ทางสถิติเป็นหนังสือที่มีความสำคัญและค่อนข้างเป็นประโยชน์ แต่ก็ไม่ได้เข้มงวดมากนักและจะละเว้นรายละเอียดทางเทคนิคที่สำคัญมากเกี่ยวกับอัลกอริธึมและละเว้นขอบเขตการจัดประเภททั่วไป รากฐานของการเรียนรู้ของเครื่องเป็นหนังสือที่ครอบคลุมมากที่สุดสำหรับการเรียนรู้ของเครื่อง (ซึ่งทำให้รู้สึกว่ามันถูกเขียนโดยบางส่วนที่ดีที่สุดในสนาม) อย่างไรก็ตามตำราเรียนเป็นแบบขั้นสูงดังนั้นโปรดระวังรายละเอียดทางเทคนิค
ลักษณะทั่วไปของการส่งเสริมสามารถพบได้ (พร้อมหลักฐาน) ที่นี่: http://www.cs.nyu.edu/~mohri/mls/lecture_6.pdf
ฉันหวังว่าคำแนะนำเหล่านั้นจะเพียงพอที่จะตอบคำถามของคุณ ฉันลังเลที่จะตอบคำถามให้ครบเพราะจะใช้เวลาประมาณ 50 หน้าในการตรวจสอบรายละเอียดที่จำเป็นทั้งหมดโดยไม่ต้องพูดถึงการสนทนาเบื้องต้น ...
โชคดี!