นี่คือปัญหา3.23ในหน้า97ของHastie et al., องค์ประกอบของการเรียนรู้ทางสถิติ , อันดับที่ 2 เอ็ด (พิมพ์ครั้งที่ 5)
กุญแจสู่ปัญหานี้คือความเข้าใจที่ดีของสแควร์สน้อยสามัญ (เช่นการถดถอยเชิงเส้น) โดยเฉพาะอย่างยิ่ง orthogonality ของค่าติดตั้งและส่วนที่เหลือ
Orthogonality lemma : ให้เป็นเมทริกซ์การออกแบบ ,เป็นเวกเตอร์การตอบสนองและพารามิเตอร์ (จริง) สมมติว่าเต็มอันดับ (ซึ่งเราจะตลอด) ที่ OLS ประมาณการของเป็นY ค่าติดตั้งเป็นY แล้ว0 นั่นคือค่าติดตั้งจะเป็นมุมฉากกับส่วนที่เหลือ สิ่งนี้ตามมาตั้งแต่ .Xn × pYβXββ^= (XTX)- 1XTYY^= X(XTX)- 1XTY⟨Y^, y-Y^⟩ =Y^T( y-Y^) = 0XT( y-Y^) =XTY-XTX(XTX)- 1XTY=XTY-XTY= 0
ตอนนี้ให้เป็นเวกเตอร์คอลัมน์ดังกล่าวว่าเป็นคอลัมน์ TH Xเงื่อนไขที่สมมติคือ:xJxJJX
- 1ยังไม่มีข้อความ⟨xJ,xJ⟩ = 1สำหรับแต่ละ , ,J1ยังไม่มีข้อความ⟨ y, y⟩ = 1
- 1ยังไม่มีข้อความ⟨xJ,1พี⟩ =1ยังไม่มีข้อความ⟨ y,1พี⟩ = 0โดยที่หมายถึงเวกเตอร์ของความยาวและ1พีพี
- 1ยังไม่มีข้อความ| ⟨xJ, y⟩ | = λสำหรับทุกJJ
โปรดทราบว่าโดยเฉพาะอย่างยิ่งคำสั่งสุดท้ายของบทแทรกฉากเป็นเหมือนสำหรับทุกJ⟨xJ, y-Y^⟩ = 0J
ความสัมพันธ์จะถูกผูก
ตอนนี้{y} ดังนั้น
และภาคที่สองทางด้านขวามือเป็นศูนย์โดยorthogonality lemmaดังนั้น
ตามที่ต้องการ ค่าสัมบูรณ์ของสหสัมพันธ์เป็นเพียงแค่
u ( α ) = α Xβ^= αY^
⟨xJ, y- u ( a ) ⟩ = ⟨xJ, ( 1 - α ) y+ α y- αY^⟩ = ( 1 - α ) ⟨xJ, y⟩ + อัลฟ่า⟨xJ, y-Y^⟩ ,
1ยังไม่มีข้อความ| ⟨xJ, y- u ( α ) ⟩ | = ( 1 - α ) λ ,
ρ^J( α ) =1ยังไม่มีข้อความ| ⟨xJ, y−u(α)⟩|1ยังไม่มีข้อความ⟨xJ,xJ⟩--------√1ยังไม่มีข้อความ⟨ y- u ( α ) , y- คุณ( α ) ⟩------------------√=( 1 - α ) λ1ยังไม่มีข้อความ⟨ y- u ( α ) , y- คุณ( α ) ⟩------------------√
หมายเหตุ : ทางด้านขวาด้านบนมีความเป็นอิสระจากและตัวเศษเหมือนกับความแปรปรวนร่วมเนื่องจากเราสันนิษฐานว่า 's และทั้งหมดอยู่กึ่งกลาง (โดยเฉพาะอย่างยิ่งไม่จำเป็นต้องลบค่าเฉลี่ย )JxJY
ประเด็นคืออะไร? เมื่อเพิ่มเวกเตอร์การตอบสนองได้รับการแก้ไขเพื่อให้นิ้วเข้าหาทางของการแก้ปัญหากำลังสองน้อยที่สุด( จำกัด ! ) ที่ได้จากการรวมเฉพาะพารามิเตอร์แรกในโมเดล พร้อมกันนี้จะปรับเปลี่ยนพารามิเตอร์ที่ประมาณไว้เนื่องจากเป็นผลิตภัณฑ์ภายในที่เรียบง่ายของตัวทำนายที่มีเวกเตอร์การตอบสนอง (แก้ไข) การปรับเปลี่ยนใช้รูปแบบพิเศษแม้ว่า มันทำให้ (ขนาดของ) ความสัมพันธ์ระหว่างตัวทำนายและการตอบสนองที่แก้ไขเหมือนกันตลอดกระบวนการ (แม้ว่าค่าของความสัมพันธ์กำลังเปลี่ยนแปลง) ลองคิดดูว่าสิ่งนี้ทำอะไรได้บ้างและคุณจะเข้าใจชื่อของขั้นตอน!αพี
รูปแบบที่ชัดเจนของสหสัมพันธ์ (สัมบูรณ์)
ให้ความสำคัญกับคำในตัวส่วนเนื่องจากตัวเศษอยู่ในรูปแบบที่ต้องการแล้ว เรามี
⟨ y- u ( α ) , y- u ( α ) ⟩ = ⟨ ( 1 - α ) y+ α y- u ( α ) , ( 1 - α ) y+ α y- ยู( α ) ⟩
การแทนค่าในและใช้ linearity ของผลิตภัณฑ์ภายในเราจะได้u ( α ) = αY^
⟨ y- u ( α ) , y- u ( α ) ⟩ = ( 1 - α)2⟨ y, y⟩ + 2 α ( 1 - α ) ⟨ y, y-Y^⟩ +α2⟨ y-Y^, y-Y^⟩
สังเกตว่า
- ⟨ y, y⟩ = Nโดยการสันนิษฐาน
- ⟨ y, y-Y^⟩ = ⟨ y-Y^, y-Y^⟩ + ⟨Y^, y-Y^⟩ = ⟨ y-Y^, y-Y^⟩โดยใช้orthogonality lemma (อีกครั้ง) ในเทอมที่สองตรงกลาง; และ,
- ⟨ y-Y^, y-Y^⟩ = R S Sตามคำจำกัดความ
เมื่อรวมทั้งหมดเข้าด้วยกันคุณจะสังเกตเห็นว่าเราได้รับ
ρ^J( α ) =( 1 - α ) λ( 1 - α)2+α ( 2 - α )ยังไม่มีข้อความR S S-----------------√=( 1 - α ) λ( 1 - α)2( 1 -R S Sยังไม่มีข้อความ) +1ยังไม่มีข้อความR S S---------------------√
ในการสรุปสิ่งต่าง ๆดังนั้นมันชัดเจนว่ากำลังลดความในและเป็น11 -R S Sยังไม่มีข้อความ=1ยังไม่มีข้อความ( ⟨ y, y, ⟩ - ⟨ y-Y^, y-Y^⟩ ) ≥ 0ρ^J(α)αρ^j( α ) ↓ 0α ↑ 1
บทส่งท้าย : มุ่งเน้นที่แนวคิดที่นี่ มีเพียงคนเดียวจริงๆ แทรกตั้งฉากไม่เกือบทุกงานสำหรับเรา ส่วนที่เหลือเป็นเพียงพีชคณิตสัญกรณ์และความสามารถในการทำให้สองอันสุดท้ายนี้ทำงานได้