มีการวิเคราะห์ที่ดีโดยเป็นstats_modelในคำตอบของเขา
ฉันพยายามตอบคำถามที่คล้ายกันที่หลักฐานของสูตรเทียบเท่าของริดจ์ถดถอย
ฉันจะใช้วิธี Hand On เพิ่มเติมสำหรับกรณีนี้
ลองดูการทำแผนที่ระหว่างและใน 2 รุ่นtλ
ขณะที่ฉันเขียนและสามารถดูได้จากstats_modelในการวิเคราะห์ของเขาการทำแผนที่ขึ้นอยู่กับข้อมูล ดังนั้นเราจะเลือกการรับรู้ปัญหาที่เฉพาะเจาะจง แต่รหัสและการร่างภาพการแก้ปัญหาจะเพิ่มสัญชาตญาณให้กับสิ่งที่เกิดขึ้น
เราจะเปรียบเทียบโมเดล 2 แบบต่อไปนี้:
The Regularized Model: argminx12∥Ax−y∥22+λ∥x∥22
The Constrained Model: argminxsubject to12∥Ax−y∥22∥x∥22≤t
สมมติว่าเป็นโซลูชันของโมเดลที่ทำให้เป็นมาตรฐานและให้เป็นโซลูชันของโมเดลที่มีข้อ จำกัดx^x~
เรากำลังมองหาที่ทำแผนที่จากที่จะดังกล่าวว่า{x}
มองในการแก้ปัญหาของฉันที่จะแก้สำหรับนอร์ม จำกัด แควน้อยหนึ่งจะได้เห็นว่าการแก้ข้อ จำกัด รุ่นเกี่ยวข้องกับการแก้ Regularized รุ่นและการหาที่ตรงกับ (รหัสที่เกิดขึ้นจริงจะนำเสนอในแควน้อยกับยุคลิด ( ) ข้อ จำกัด ทั่วไป )tλx^=x~
λtL2
ดังนั้นเราจะเรียกใช้แก้เหมือนกันและสำหรับแต่ละเราจะแสดงที่ดีที่สุด\tλ
แก้โดยทั่วไปแก้:
argλsubject toλ∥∥∥(ATA+2λI)−1ATb∥∥∥22−t=0
ดังนั้นนี่คือเมทริกซ์ของเรา:
mA =
-0.0716 0.2384 -0.6963 -0.0359
0.5794 -0.9141 0.3674 1.6489
-0.1485 -0.0049 0.3248 -1.7484
0.5391 -0.4839 -0.5446 -0.8117
0.0023 0.0434 0.5681 0.7776
0.6104 -0.9808 0.6951 -1.1300
และนี่คือเวกเตอร์ของเรา:
vB =
0.7087
-1.2776
0.0753
1.1536
1.2268
1.5418
นี่คือการทำแผนที่:
ที่สามารถมองเห็นข้างต้นสำหรับค่าสูงพอพารามิเตอร์ตามที่คาดไว้tλ=0
ซูมเข้าสู่ช่วง [0, 10]:
รหัสเต็มมีอยู่ในStackExchange Cross Validated Q401212 GitHub Repository ของฉัน