ฉันมีคำถามบางอย่างเกี่ยวกับสัญลักษณ์ที่ใช้ในมาตรา9.2 การขาดความเหนือกว่าโดยธรรมชาติของลักษณนามใด ๆใน Duda, ฮาร์ตและนกกระสาการจัดจำแนกรูปแบบ ก่อนอื่นให้ฉันอ้างอิงข้อความที่เกี่ยวข้องจากหนังสือ:
- เพื่อความง่ายให้พิจารณาปัญหาสองหมวดหมู่ที่ชุดฝึกอบรมประกอบด้วยรูปแบบและเลเบลหมวดหมู่ที่เกี่ยวข้อง สำหรับสร้างขึ้นโดยฟังก์ชันเป้าหมายที่ไม่รู้จักที่จะเรียนรู้ที่i)
- ให้แทนเซตของสมมติฐาน (ไม่ต่อเนื่อง) หรือชุดของพารามิเตอร์ที่เป็นไปได้ที่จะเรียนรู้ สมมติฐานเฉพาะ สามารถอธิบายได้โดยน้ำหนักเชิงปริมาณในเครือข่ายประสาทหรือพารามิเตอร์ 0 ในรูปแบบการทำงานหรือชุดของการตัดสินใจในต้นไม้และอื่น ๆ
- นอกจากนี้เป็นความน่าจะเป็นก่อนหน้านี้ที่อัลกอริทึมจะสร้างสมมติฐานหลังจากการฝึกอบรม โปรดทราบว่านี่ไม่ใช่ความน่าจะเป็นที่ถูกต้อง
- ถัดไปหมายถึงความเป็นไปได้ว่าอัลกอริทึมจะให้ผลผลิตสมมติฐานเมื่อผ่านการฝึกอบรมเกี่ยวกับข้อมูลDในขั้นตอนวิธีการเรียนรู้ที่กำหนดเช่นที่ใกล้ที่สุดเพื่อนบ้านและการตัดสินใจต้นไม้ จะเป็นทุกศูนย์ยกเว้นสมมติฐานเดียวชั่วโมงสำหรับวิธีการสุ่ม (เช่นเครือข่ายนิวรัลที่ได้รับการฝึกฝนจากน้ำหนักเริ่มต้นแบบสุ่ม) หรือการเรียนรู้ Boltzmann แบบสุ่มสามารถเป็นการกระจายอย่างกว้างขวาง
- ให้เป็นข้อผิดพลาดสำหรับฟังก์ชัน zero-one หรือฟังก์ชัน loss อื่น
ข้อผิดพลาดการจำแนกหมวดหมู่การฝึกอบรมนอกชุดที่คาดไว้เมื่อฟังก์ชันที่แท้จริงคือและความน่าจะเป็นสำหรับอัลกอริทึมการเรียนรู้ผู้สมัครที่คือมอบให้โดย
ทฤษฎีบท 9.1 (ไม่มีอาหารกลางวันฟรี)สำหรับอัลกอริทึมการเรียนรู้ใด ๆ สองและสิ่งต่อไปนี้เป็นจริงโดยไม่ขึ้นกับการแจกแจงตัวอย่างและจำนวนของคะแนนการฝึกอบรม:n
ค่าเฉลี่ยของฟังก์ชันเป้าหมายทั้งหมดอย่างสม่ำเสมอ ,
สำหรับการฝึกอบรมการแก้ไขใด ๆ ชุดเฉลี่ยเหมือนกันกว่า ,
ตอนที่ 1 กำลังพูดว่า
ตอนที่ 2 กำลังพูดว่า
คำถามของฉันคือ
- ในสูตรของ , คือฉันสามารถแทนที่ด้วยและย้ายไปนอก sumเพราะมันเป็นจริงการกระจายของกว่ารับสำหรับ TH ขั้นตอนวิธีการเรียนรู้ที่สุ่ม?
- เนื่องจากอัลกอริธึมการเรียนรู้ผู้สมัครที่นั้นเป็นวิธีการสุ่มทำไมในสูตรของจึงไม่มีผลรวมมากกว่าคือ ?
เป็นอย่างไรและ แตกต่างจากคนอื่น ๆ ?
ไม่หมายถึงอัตราความผิดพลาดปิดการฝึกอบรมที่ได้รับการฝึกอบรมชุด ?
ไม่หมายถึงอัตราความผิดพลาดปิดการฝึกอบรมโดยเฉลี่ยมากกว่าทุกชุดการฝึกอบรมได้รับการฝึกอบรมขนาด ? ถ้าใช่ทำไมส่วนที่ 1 ในทฤษฎีบทเอ็นเอฟแอลโดยเฉลี่ยมากกว่าชุดฝึกอบรมอีกครั้งโดยการเขียนและทำไมในสูตรสำหรับ ไม่มีค่าเฉลี่ยสำหรับชุดการฝึกอบรมทั้งหมดที่กำหนดขนาดการฝึกอบรม ?
- ในส่วนที่ 1 ของเอ็นเอฟแอทฤษฎีบทไม่ชุดหมายถึงข้อสรุปในช่วงการฝึกอบรมทั้งหมดที่มีขนาดการฝึกอบรมคง ?
- ถ้าหากสรุปผลรวมของค่าที่เป็นไปได้ทั้งหมดในของขนาดการฝึกอบรมในตอนที่ 1 ผลลัพธ์ยังคงเป็น 0 ใช่ไหม?
- ในสูตรของถ้าฉันเปลี่ยนเป็นนั่นคือไม่ได้ จำกัด อยู่นอกชุดฝึกอบรมทั้งสองส่วนจะต้องอยู่ใน ทฤษฎีบทของ NFL ยังคงเป็นจริงหรือไม่
- หากความสัมพันธ์ที่แท้จริงระหว่างและไม่ถือว่าเป็นฟังก์ชันที่กำหนดขึ้นเช่นแต่เป็นการแทนการแจกแจงแบบมีเงื่อนไขหรือการแจกแจงร่วมซึ่งเทียบเท่ากับ รู้และ (เห็นคำถามอื่นของฉัน ) จากนั้นฉันสามารถเปลี่ยน
เป็น (แปลก ๆ ด้วยชี้ให้เห็นในส่วนที่ 1 และ 2) สองส่วนในทฤษฎีบท NFL ยังคงเป็นจริงหรือไม่?
ขอบคุณและขอแสดงความนับถือ!