เชือกในการวิเคราะห์การถดถอยคืออะไร?


81

ฉันกำลังมองหาความหมายที่ไม่ใช่ทางเทคนิคของเชือกและสิ่งที่มันใช้


จากโรเบิร์ตทิบชิรา นี ของ (ผู้เขียนของกระดาษเชือกเดิม) หน้า: คำอธิบายง่ายๆของเชือกและมุมน้อยถดถอย

คำตอบ:


112

LASSO (ตัวย่อและการย่อขนาดน้อยที่สุด) เป็นวิธีการถดถอยที่เกี่ยวข้องกับการลงโทษขนาดสัมบูรณ์ของสัมประสิทธิ์การถดถอย

โดยการลงโทษ (หรือ จำกัด การรวมผลรวมของค่าสัมบูรณ์ของการประมาณการ) เท่ากับคุณสิ้นสุดในสถานการณ์ที่การประมาณค่าพารามิเตอร์บางอย่างอาจเป็นศูนย์อย่างแน่นอน ยิ่งการลงโทษนั้นยิ่งรุนแรงมากเท่าไหร่

สิ่งนี้จะสะดวกเมื่อเราต้องการการเลือกคุณสมบัติ / ตัวแปรอัตโนมัติหรือเมื่อจัดการกับตัวทำนายที่มีความสัมพันธ์สูงซึ่งการถดถอยมาตรฐานมักจะมีค่าสัมประสิทธิ์การถดถอยที่ 'ใหญ่เกินไป'

https://web.stanford.edu/~hastie/ElemStatLearn/ (ดาวน์โหลดฟรี) มีคำอธิบายที่ดีเกี่ยวกับ LASSO และวิธีการที่เกี่ยวข้อง


ฉันใหม่สำหรับเว็บไซต์; นี่คือข้อมูลที่ฉันต้องการอย่างแม่นยำ ขอบคุณมาก.
พอลโฟกท์

มี PDF เกี่ยวกับวิธีแก้ปัญหาโดยใช้ปัญหาคู่หรือไม่
Royi

ลิงก์ใช้งานไม่ได้
Oliver Angelil

3

LASSO regression เป็นประเภทของการวิเคราะห์การถดถอยที่ทั้งการเลือกตัวแปรและการควบคุมเกิดขึ้นพร้อมกัน วิธีนี้ใช้บทลงโทษที่ส่งผลกระทบต่อคุณค่าของสัมประสิทธิ์การถดถอย เมื่อการลงโทษเพิ่มค่าสัมประสิทธิ์มากขึ้นจะกลายเป็นศูนย์และในทางกลับกัน มันใช้เทคนิคการทำให้เป็นมาตรฐาน L1 ซึ่งพารามิเตอร์การปรับจะใช้เป็นจำนวนของการหดตัว เมื่อพารามิเตอร์การปรับแต่งเพิ่มขึ้นอคติจะเพิ่มขึ้นและตามที่ลดลงดังนั้นความแปรปรวนจะเพิ่มขึ้น หากค่าคงที่ไม่มีสัมประสิทธิ์เป็นศูนย์และมีแนวโน้มที่จะไม่มีค่าสัมประสิทธิ์สัมประสิทธิ์ทั้งหมดจะเป็นศูนย์


2

ใน "ปกติ" การถดถอย (OLS) เป้าหมายคือเพื่อลดผลรวมที่เหลือของกำลังสอง (RSS) เพื่อประเมินค่าสัมประสิทธิ์

argminβRpi=1n(Yij=1pXijβj)2

ในกรณีของการถดถอยแบบ LASSO คุณประมาณค่าสัมประสิทธิ์ด้วยวิธีที่ต่างกันเล็กน้อย:

argminβRpi=1n(Yij=1pXijβj)2+λj=1p|βj|

λλ

λ=0argminλ=1λการลงโทษที่มากขึ้นจะนำไปใช้กับค่าสัมประสิทธิ์และขนาดเล็กจะเป็นค่าสัมประสิทธิ์บางคนอาจกลายเป็นศูนย์ นั่นหมายความว่า LASSO สามารถส่งผลให้รุ่นที่มีคุณสมบัติไม่พึงประสงค์ได้โดยการเลือกคุณสมบัติและป้องกันไม่ให้ตัวแบบ overfitting ที่กล่าวว่าคุณสามารถใช้ LASSO ได้หากคุณมีคุณสมบัติมากมายและเป้าหมายของคุณคือการคาดการณ์ข้อมูลแทนที่จะตีความค่าสัมประสิทธิ์ของแบบจำลองของคุณ


1
TEXTEX

@Tim: ขอบคุณมากสำหรับสิ่งนั้น! มันเป็นเคล็ดลับที่ยอดเยี่ยมในการคลิกแก้ไขเพื่อดูวิธีการทำ
ก้อนหิน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.