ผมเสนอข้อผิดพลาดซึ้งปรับปรุง นี่เป็นคำศัพท์ที่นำมาใช้ในวรรค 2.1.1 ของGareth, Witten, Hastie & Tibshirani, คำแนะนำเบื้องต้นเกี่ยวกับการเรียนรู้ทางสถิติหนังสือซึ่งโดยพื้นฐานแล้วจะทำให้ ESL + ห้องปฏิบัติการรหัส R ที่ยอดเยี่ยมง่าย (ยกเว้นข้อเท็จจริงที่ใช้attach
แต่เดี๋ยวก่อนไม่มีใครสมบูรณ์แบบ) ฉันจะแสดงรายการด้านล่างเหตุผลข้อดีและข้อเสียของคำศัพท์นี้
แรกของทั้งหมดที่เราจะต้องจำได้ว่าเราไม่เพียง แต่ถือว่าจะมีค่าเฉลี่ย 0, แต่ยังเป็นอิสระของ (ดูวรรค 2.6.1 สูตร 2.29 ของ ESL 2 ครั้งฉบับที่ 12 วันการพิมพ์) แน่นอนεXε ไม่สามารถประมาณได้จาก Xไม่ว่าชั้นเรียนสมมติฐานใด H(ตระกูลของแบบจำลอง) เราเลือกและตัวอย่างที่เราใช้ในการเรียนรู้สมมติฐานของเรานั้นใหญ่เพียงใด (ประเมินโมเดลของเรา) สิ่งนี้อธิบายว่าทำไมσ2ε เรียกว่าข้อผิดพลาดลดลง
ดูเหมือนว่าเป็นธรรมชาติในการกำหนดส่วนที่เหลือของข้อผิดพลาด ทำผิดพลาด(x0) -σ2εที่ผิดพลาดซึ้งปรับปรุง ตอนนี้คำศัพท์นี้อาจฟังดูค่อนข้างสับสน: ตามความเป็นจริงภายใต้สมมติฐานที่เราทำไว้สำหรับกระบวนการสร้างข้อมูลเราสามารถพิสูจน์ได้ว่า
ฉ( x ) = E [ Y|X= x ]
ดังนั้นความผิดพลาดที่ลดลงสามารถลดลงเป็นศูนย์ได้ถ้าหาก E [ Y|X= x ] ∈ H(สมมติว่าเรามีผู้ประเมินที่สอดคล้องกัน) ถ้าE [ Y|X= x ] ∉ Hเราไม่สามารถขับข้อผิดพลาดที่ลดได้ถึง 0 แม้จะอยู่ในขีด จำกัด ของขนาดตัวอย่างที่ไม่สิ้นสุด อย่างไรก็ตามยังคงเป็นเพียงส่วนหนึ่งของข้อผิดพลาดของเราซึ่งสามารถลดลงได้หากไม่ถูกกำจัดโดยการเปลี่ยนขนาดตัวอย่างแนะนำการทำให้เป็นปกติ (การหดตัว) ในตัวประมาณของเราเป็นต้นกล่าวอีกนัยหนึ่งคือเลือกอีกอันฉ^( x ) ในรุ่นครอบครัวของเรา
โดยพื้นฐานแล้วออกซิเจนที่ลดลงนั้นไม่ได้หมายถึงความรู้สึกเป็นศูนย์ (yuck!) แต่ในแง่ของความผิดพลาดที่สามารถลดลงได้ถึงแม้ว่าจะไม่จำเป็นต้องมีขนาดเล็กก็ตาม นอกจากนี้โปรดทราบว่าโดยหลักการแล้วข้อผิดพลาดนี้สามารถลดลงเป็น 0 ได้โดยการขยายใหญ่ขึ้นH จนกว่าจะมี E [ Y|X= x ]. ในทางตรงกันข้าม,σ2ε ไม่สามารถลดได้ไม่ว่าจะใหญ่เพียงใด H เป็นเพราะ ϵ ⊥ X.