ทำความเข้าใจกับทฤษฎีอาหารกลางวันฟรีในการจำแนกรูปแบบของ Duda et al


12

ฉันมีคำถามบางอย่างเกี่ยวกับสัญลักษณ์ที่ใช้ในมาตรา9.2 การขาดความเหนือกว่าโดยธรรมชาติของลักษณนามใด ๆใน Duda, ฮาร์ตและนกกระสาการจัดจำแนกรูปแบบ ก่อนอื่นให้ฉันอ้างอิงข้อความที่เกี่ยวข้องจากหนังสือ:

  • เพื่อความง่ายให้พิจารณาปัญหาสองหมวดหมู่ที่ชุดฝึกอบรมประกอบด้วยรูปแบบและเลเบลหมวดหมู่ที่เกี่ยวข้อง สำหรับสร้างขึ้นโดยฟังก์ชันเป้าหมายที่ไม่รู้จักที่จะเรียนรู้ที่i)Dxiyi=±1i=1,...,nF(x)yi=F(xi)
  • ให้แทนเซตของสมมติฐาน (ไม่ต่อเนื่อง) หรือชุดของพารามิเตอร์ที่เป็นไปได้ที่จะเรียนรู้ สมมติฐานเฉพาะ สามารถอธิบายได้โดยน้ำหนักเชิงปริมาณในเครือข่ายประสาทหรือพารามิเตอร์ 0 ในรูปแบบการทำงานหรือชุดของการตัดสินใจในต้นไม้และอื่น ๆHh(x)H
  • นอกจากนี้เป็นความน่าจะเป็นก่อนหน้านี้ที่อัลกอริทึมจะสร้างสมมติฐานหลังจากการฝึกอบรม โปรดทราบว่านี่ไม่ใช่ความน่าจะเป็นที่ถูกต้องP(h)hh
  • ถัดไปหมายถึงความเป็นไปได้ว่าอัลกอริทึมจะให้ผลผลิตสมมติฐานเมื่อผ่านการฝึกอบรมเกี่ยวกับข้อมูลDในขั้นตอนวิธีการเรียนรู้ที่กำหนดเช่นที่ใกล้ที่สุดเพื่อนบ้านและการตัดสินใจต้นไม้ จะเป็นทุกศูนย์ยกเว้นสมมติฐานเดียวชั่วโมงสำหรับวิธีการสุ่ม (เช่นเครือข่ายนิวรัลที่ได้รับการฝึกฝนจากน้ำหนักเริ่มต้นแบบสุ่ม) หรือการเรียนรู้ Boltzmann แบบสุ่มสามารถเป็นการกระจายอย่างกว้างขวางP(h|D)hDP(h|D)hP(h|D)
  • ให้เป็นข้อผิดพลาดสำหรับฟังก์ชัน zero-one หรือฟังก์ชัน loss อื่นE

ข้อผิดพลาดการจำแนกหมวดหมู่การฝึกอบรมนอกชุดที่คาดไว้เมื่อฟังก์ชันที่แท้จริงคือและความน่าจะเป็นสำหรับอัลกอริทึมการเรียนรู้ผู้สมัครที่คือมอบให้โดยF(x)kPk(h(x)|D)

Ek(E|F,n)=xDP(x)[1δ(F(x),h(x))]Pk(h(x)|D)

ทฤษฎีบท 9.1 (ไม่มีอาหารกลางวันฟรี)สำหรับอัลกอริทึมการเรียนรู้ใด ๆ สองและสิ่งต่อไปนี้เป็นจริงโดยไม่ขึ้นกับการแจกแจงตัวอย่างและจำนวนของคะแนนการฝึกอบรม:P1(h|D)P2(h|D)nP(x)n

  1. ค่าเฉลี่ยของฟังก์ชันเป้าหมายทั้งหมดอย่างสม่ำเสมอ ,FE1(E|F,n)E2(E|F,n)=0

  2. สำหรับการฝึกอบรมการแก้ไขใด ๆ ชุดเฉลี่ยเหมือนกันกว่า , DFE1(E|F,D)E2(E|F,D)=0

ตอนที่ 1 กำลังพูดว่า

FDP(D|F)[E1(E|F,n)E2(E|F,n)]=0

ตอนที่ 2 กำลังพูดว่า

F[E1(E|F,D)E2(E|F,D)]=0

คำถามของฉันคือ

  1. ในสูตรของ , คือฉันสามารถแทนที่ด้วยและย้ายไปนอก sumเพราะมันเป็นจริงการกระจายของกว่ารับสำหรับ TH ขั้นตอนวิธีการเรียนรู้ที่สุ่ม?Ek(E|F,n)
    Ek(E|F,n)=xDP(x)[1δ(F(x),h(x))]Pk(h(x)|D),
    Pk(h(x)|D)Pk(h|D)xDhHDk
  2. เนื่องจากอัลกอริธึมการเรียนรู้ผู้สมัครที่นั้นเป็นวิธีการสุ่มทำไมในสูตรของจึงไม่มีผลรวมมากกว่าคือ ?kEk(E|F,n)hhH
  3. เป็นอย่างไรและ แตกต่างจากคนอื่น ๆ ?Ei(E|F,D)Ei(E|F,n)

    ไม่หมายถึงอัตราความผิดพลาดปิดการฝึกอบรมที่ได้รับการฝึกอบรมชุด ?Ei(E|F,D)D

    ไม่หมายถึงอัตราความผิดพลาดปิดการฝึกอบรมโดยเฉลี่ยมากกว่าทุกชุดการฝึกอบรมได้รับการฝึกอบรมขนาด ? ถ้าใช่ทำไมส่วนที่ 1 ในทฤษฎีบทเอ็นเอฟแอลโดยเฉลี่ยมากกว่าชุดฝึกอบรมอีกครั้งโดยการเขียนและทำไมในสูตรสำหรับ ไม่มีค่าเฉลี่ยสำหรับชุดการฝึกอบรมทั้งหมดที่กำหนดขนาดการฝึกอบรม ?Ei(E|F,n)nEi(E|F,n)DEk(E|F,n)n

  4. ในส่วนที่ 1 ของเอ็นเอฟแอทฤษฎีบทไม่ชุดหมายถึงข้อสรุปในช่วงการฝึกอบรมทั้งหมดที่มีขนาดการฝึกอบรมคง ?Dn
  5. ถ้าหากสรุปผลรวมของค่าที่เป็นไปได้ทั้งหมดในของขนาดการฝึกอบรมในตอนที่ 1 ผลลัพธ์ยังคงเป็น 0 ใช่ไหม?Nn
  6. ในสูตรของถ้าฉันเปลี่ยนเป็นนั่นคือไม่ได้ จำกัด อยู่นอกชุดฝึกอบรมทั้งสองส่วนจะต้องอยู่ใน ทฤษฎีบทของ NFL ยังคงเป็นจริงหรือไม่Ek(E|F,n)xDxx
  7. หากความสัมพันธ์ที่แท้จริงระหว่างและไม่ถือว่าเป็นฟังก์ชันที่กำหนดขึ้นเช่นแต่เป็นการแทนการแจกแจงแบบมีเงื่อนไขหรือการแจกแจงร่วมซึ่งเทียบเท่ากับ รู้และ (เห็นคำถามอื่นของฉัน ) จากนั้นฉันสามารถเปลี่ยน เป็น (แปลก ๆ ด้วยชี้ให้เห็นในส่วนที่ 1 และ 2) สองส่วนในทฤษฎีบท NFL ยังคงเป็นจริงหรือไม่?xyFy=F(x)P(y|x)P(x,y)P(y|x)P(x)Ek(E|F,n)
    Ek(E|P(x,y),n)=Ex,y[1δ(y,h(x))]Pk(h(x)|D)
    Pk(h(x)|D)

ขอบคุณและขอแสดงความนับถือ!


คือ Dirac / Kronecker เดลต้า? ในδ
Ek(E|F,n)=xDP(x)[1δ(F(x),h(x))]Pk(h(x)|D)

นี่ไม่ใช่ทฤษฎีอาหารกลางวันฟรีเหมือนกับปัญหาการหยุดหรือไม่ พวกเขาเชื่อมต่อ?

คำตอบ:


6

ฉันจะตอบคำถามที่ฉันคิดว่าฉันรู้คำตอบ

  1. คำตอบนี้ไม่ได้เพราะคุณกำลังการเลือกที่ไม่ได้เป็นส่วนหนึ่งของชุดพอดีและอื่น ๆขึ้นอยู่กับxxDhx
  2. hถูกประเมินที่ค่าในชุดการทดสอบเพื่อให้ได้อัตราความผิดพลาดที่คาดไว้เท่านั้นดังนั้นจึงไม่ถูกประเมินทั้งชุดแต่เฉพาะที่ชุดแยกของในชุดทดสอบxHx
  3. Ei(E|F,D)เป็นที่คาดว่าอัตราการออกจากข้อผิดพลาดในการฝึกอบรมชุดที่กำหนดฟังก์ชั่นและการฝึกอบรมชุดDแต่ผมคิดว่าเป็นที่แตกต่างกันเพราะคุณเป็นเครื่องเฉพาะในจำนวนของจุดฝึกอบรมและไม่จริงค่า แต่สิ่งนี้ทำให้งงเมื่อได้รับข้อความในภายหลังFDEi(E|F,n)nx
  4. Dคือชุดของเวกเตอร์การฝึกอบรม มีการฝึกอบรมในเวกเตอร์Dดังนั้นคุณจะข้อสรุปที่ผ่านการแก้ไขเวกเตอร์การฝึกอบรมในDมีเพียงหนึ่งชุดDnDnDD
  5. ฉันคิดว่าคำตอบของ 5 คือไม่ สัญกรณ์ดูเหมือนจะสับสนเล็กน้อย

ไม่สามารถแสดงความคิดเห็นในวันที่ 6 และ 7


2
+1 ยินดีต้อนรับสู่เว็บไซต์ฉันเป็นแฟนตัวยงของรีวิวของคุณใน Amazon แก้ตัวสันนิษฐานของฉันในการแก้ไขสัญกรณ์คณิตศาสตร์ส่วนใหญ่จะทำโดยการใส่ $ 's ทั้งสองด้านของบางสิ่งบางอย่าง หากคุณคลิกที่วงกลมสีเหลือง? ที่ด้านบนขวาเมื่อเขียนคุณจะเห็นลิงก์สำหรับ "ความช่วยเหลือขั้นสูง" ซึ่งจะให้ข้อมูลเพิ่มเติม นอกจากนี้คุณสามารถคลิกขวาที่ mathjax ที่มีอยู่ (เช่นข้อใดข้อหนึ่ง) และเลือก "แสดงคำสั่งทางคณิตศาสตร์ -> คำสั่ง TeX" เพื่อดูว่ามันเสร็จสิ้นแล้ว
gung - Reinstate Monica

2
กล่าวอีกอย่างคือ @gung กำลังพูดว่า: เว็บไซต์นี้รองรับใน (เกือบ) อย่างที่คุณคาดหวังรวมถึงคณิตศาสตร์ดิสเพลย์ ยินดีต้อนรับสู่เว็บไซต์ LATEX
พระคาร์ดินัล

@Michael โปรดให้ฉันเพิ่มการต้อนรับให้กับผู้อื่นเหล่านี้: ฉันมีความยินดีที่ได้พบคุณที่นี่ (ไมเคิลได้มีส่วนร่วมที่มีความรู้เป็นพิเศษในรายการสนทนาของ American Statistics Association)
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.