ความแปรปรวนของฟังก์ชั่น * * ใน * หมายถึงการเรียนรู้เชิงสถิติ * หมายถึงอะไร


11

บนหน้า 34 ของการเรียนรู้สถิติเบื้องต้น :

แม้ว่าหลักฐานทางคณิตศาสตร์จะอยู่นอกเหนือขอบเขตของหนังสือเล่มนี้ก็เป็นไปได้ที่จะแสดงให้เห็นว่าการทดสอบที่คาดหวัง MSE สำหรับค่าที่กำหนดx0สามารถแบ่งย่อยเป็นผลรวมของสามปริมาณพื้นฐาน: ความแปรปรวนของf^(x0)ที่ยกกำลังสองอคติของf^(x0)และความแปรปรวนของข้อตกลงข้อผิดพลาด\εนั่นคือ,

E(y0f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε)

[... ] ความแปรปรวนหมายถึงจำนวนที่f^จะเปลี่ยนแปลงหากเราประเมินโดยใช้ชุดข้อมูลการฝึกอบรมอื่น

คำถาม:เนื่องจากVar(f^(x0))ดูเหมือนจะแสดงถึงความแปรปรวนของฟังก์ชั่นสิ่งนี้หมายความว่าอย่างเป็นทางการ?

นั่นคือฉันคุ้นเคยกับแนวคิดของความแปรปรวนของตัวแปรสุ่มXแต่สิ่งที่เกี่ยวกับความแปรปรวนของชุดฟังก์ชัน นี่อาจเป็นความแปรปรวนของตัวแปรสุ่มอีกค่าที่มีรูปแบบของฟังก์ชันหรือไม่


6
ระบุว่าทุกครั้งที่ปรากฏในสูตรจะได้รับนำไปใช้กับ "ค่าที่กำหนดว่า" , แปรปรวนนำไปใช้กับจำนวนไม่ตัวเอง เนื่องจากตัวเลขดังกล่าวได้รับการพัฒนาจากข้อมูลที่สร้างแบบจำลองด้วยตัวแปรสุ่มจึงเป็นตัวแปรสุ่ม (มูลค่าจริง) แนวคิดตามปกติของความแปรปรวนใช้ f^x0 f^(x0)f^
whuber

2
ฉันเห็น. ดังนั้นกำลังเปลี่ยนแปลง (แตกต่างกันไปตามชุดข้อมูลการฝึกอบรมที่แตกต่างกัน) แต่เรายังคงดูความแตกต่างของด้วยตนเอง f^f^(x0)
George

ใครเป็นผู้เขียนหนังสือเล่มนี้ ฉันต้องการเรียนรู้เรื่องนี้ด้วยตัวเองและขอขอบคุณข้อเสนอแนะอ้างอิงของคุณอย่างมาก
Chill2Macht

3
@WilliamKrinsman นี่คือหนังสือ: www-bcf.usc.edu/~gareth/ISL
Matthew Drury

คำตอบ:


13

การโต้ตอบกับ @whuber ของคุณถูกต้อง

อัลกอริทึมการเรียนรู้สามารถมองได้ว่าเป็นฟังก์ชั่นระดับสูงกว่าการฝึกอบรมการทำแผนที่กำหนดให้ฟังก์ชั่นA

A:T{ff:XR}

โดยที่เป็นพื้นที่ของชุดฝึกอบรมที่เป็นไปได้ นี้อาจจะเป็นขนบิตแนวคิด แต่โดยทั่วไปแต่ละผลการฝึกอบรมชุดแต่ละหลังการใช้ขั้นตอนวิธีการฝึกอบรมรูปแบบในฟังก์ชั่น speicificซึ่งสามารถนำมาใช้เพื่อทำให้การคาดการณ์ที่กำหนดจุดข้อมูลxTfx

หากเรามองว่าพื้นที่ของชุดการฝึกอบรมเป็นพื้นที่น่าจะเป็นเพื่อให้มีการแจกจ่ายชุดข้อมูลการฝึกอบรมที่เป็นไปได้บางส่วนแล้วอัลกอริทึมการฝึกอบรมแบบจำลองจะกลายเป็นฟังก์ชันตัวแปรสุ่มที่มีค่าและเราสามารถคิดถึงแนวคิดทางสถิติ โดยเฉพาะอย่างยิ่งหากเราแก้ไขจุดข้อมูลเฉพาะเราจะได้รับตัวแปรสุ่มที่มีค่าเป็นตัวเลขx0

Ax0(T)=A(T)(x0)

คือครั้งแรกของการฝึกอบรมขั้นตอนวิธีการในแล้วประเมินรูปแบบที่เกิดที่x_0นี่เป็นเพียงแค่ตัวแปรแบบเก่า แต่สร้างแบบสุ่มอย่างชาญฉลาดในพื้นที่ความน่าจะเป็นดังนั้นเราจึงสามารถพูดคุยเกี่ยวกับความแปรปรวน นี่คือความแปรปรวนในสูตรของคุณจาก ISLTx0


5

การตีความภาพโดยใช้ kfolds ซ้ำ

เพื่อให้การตีความด้วยภาพ / การหยั่งรู้ถึงคำตอบของ @Matthew Drury ให้พิจารณาตัวอย่างของเล่นดังต่อไปนี้

  • ข้อมูลถูกสร้างจากเส้นโค้งไซน์ที่มีเสียงดัง: "True noise"f(x) +
  • ข้อมูลถูกแบ่งระหว่างตัวอย่างการฝึกอบรมและการทดสอบ (75% - 25%)
  • โมเดลเชิงเส้น (พหุนาม) ติดตั้งกับข้อมูลการฝึกอบรม:f^(x)
  • กระบวนการนี้ซ้ำแล้วซ้ำอีกหลายครั้งโดยใช้ข้อมูลเดียวกัน(เช่นการแยกการฝึกอบรม - การทดสอบแบบสุ่มโดยใช้ Sklearm kfold ซ้ำ)
  • สิ่งนี้สร้างแบบจำลองที่แตกต่างกันมากมายซึ่งเราคำนวณค่าเฉลี่ยและความแปรปรวนในแต่ละจุดเช่นเดียวกับทุกจุดx=xi

ดูกราฟด้านล่างสำหรับรูปแบบพหุนามระดับ 2 และระดับ 6 ตั้งแต่แรกพบว่าพหุนามสูงกว่า (สีแดง) มีความแปรปรวนมากขึ้น

ป้อนคำอธิบายรูปภาพที่นี่

การพิสูจน์ว่ากราฟสีแดงมีความแปรปรวนมากขึ้น - ทดลอง

ให้และสอดคล้องกับกราฟสีเขียวและสีแดงตามลำดับและเป็นตัวอย่างหนึ่งของกราฟในสีเขียวอ่อนและสีแดงอ่อน ให้เป็นจำนวนคะแนนตามแกนและเป็นจำนวนกราฟ (เช่นจำนวนของการจำลอง) ที่นี่เรามีและf^gf^rf^(i)nxmn=400m=200

ฉันเห็นสามสถานการณ์หลัก

  1. ความแปรปรวนของค่าที่คาดการณ์ ณจุดหนึ่งที่เฉพาะเจาะจง นั้นยิ่งใหญ่กว่านั่นคือx=x0Var [{f^r(1)(x0),...,f^r(m)(x0)}]>Var [{f^g(1)(x0),...,f^g(i)(x0)}]
  2. ความแปรปรวนในสูงกว่าสำหรับทุกจุดในช่วง (1) {x1,...,x400}(0,1)
  3. ความแปรปรวนสูงกว่าโดยเฉลี่ย (เช่นอาจมีขนาดเล็กลงสำหรับบางจุด)

ในกรณีของตัวอย่างของเล่นนี้ทั้งสามสถานการณ์ถือเป็นจริงในช่วงซึ่งแสดงให้เห็นถึงการโต้แย้งว่าคำสั่งพหุนามแบบพอดี (สีแดง) มีความแปรปรวนสูงกว่าพหุนามลำดับล่าง (สีเขียว)(0,1)

บทสรุปที่สิ้นสุดลงแล้ว

สิ่งที่ควรจะถกเถียงกันเมื่อทั้งสามสถานการณ์ข้างต้นไม่ได้ถือไว้ทั้งหมด ตัวอย่างเช่นจะเกิดอะไรขึ้นถ้าความแปรปรวนของการทำนายสีแดงสูงกว่าโดยเฉลี่ย แต่ไม่ใช่สำหรับทุกจุด

รายละเอียดของฉลาก

พิจารณาคะแนนx0=0.5

  • แถบข้อผิดพลาดคือช่วงระหว่าง min ถึง max ของf^(x0)
  • ความแปรปรวนคำนวณได้ที่x0
  • Trueคือเส้นสีน้ำเงินประf(x)

ฉันชอบแนวคิดของการแสดงแนวคิดโดยใช้รูปภาพ ฉันสงสัยเกี่ยวกับสองด้านของโพสต์ของคุณและหวังว่าคุณจะสามารถพูดคุยกับพวกเขาได้ ก่อนอื่นคุณสามารถอธิบายได้อย่างชัดเจนว่าแผนการเหล่านี้แสดง "ความแปรปรวนของฟังก์ชัน" ได้อย่างไร? ประการที่สองไม่ชัดเจนเลยว่าพล็อตสีแดงจัดแสดง "ความแปรปรวนที่มากขึ้น" หรือแม้แต่แผนการทั้งสองนั้นคล้อยตามการเปรียบเทียบแบบง่าย ๆ ลองพิจารณาการแพร่กระจายในแนวตั้งของค่าสีแดงที่ด้านบนและเปรียบเทียบกับการแพร่กระจายของค่าสีเขียวที่จุดเดียวกัน: ค่าสีแดงดูการแพร่กระจายน้อยกว่าค่าสีเขียวเล็กน้อย x=0.95,
whuber

ประเด็นของฉันไม่ใช่ว่าจะเป็นไปได้หรือไม่ที่จะอ่านแปลงของคุณด้วยความแม่นยำสูง: มันเป็นความหมายของการเปรียบเทียบสองแปลงดังกล่าวราวกับว่ามีการพิจารณาความแปรปรวน "สูง" หรือ "ต่ำ" กว่าอีกประเด็นที่น่าสงสัย ช่วงของผลต่างของการทำนายจะสูงขึ้นในพล็อตเดียวและสำหรับช่วงอื่นของความแปรปรวนจะลดลง xx
whuber

ใช่ฉันเห็นด้วย - ฉันได้แก้ไขโพสต์เพื่อแสดงความคิดเห็นของคุณ
Xavier Bourret Sicotte
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.