สัน, เชือกและยางยืด


33

วิธีเปรียบเทียบมาตรฐานของสันเขา LASSO และ elasticnet ทำอย่างไร? อะไรคือข้อดีและข้อเสียของพวกเขา? เอกสารทางเทคนิคที่ดีหรือบันทึกการบรรยายจะได้รับการชื่นชมเช่นกัน

คำตอบ:


39

ในหนังสือองค์ประกอบของการเรียนรู้ทางสถิติ Hastie และคณะ ให้การเปรียบเทียบที่ลึกซึ้งและลึกซึ้งของเทคนิคการหดตัวเหล่านี้ หนังสือเล่มนี้มีให้บริการออนไลน์ ( pdf ) ทำการเปรียบเทียบในส่วน 3.4.3 หน้า 69

ความแตกต่างที่สำคัญระหว่าง Lasso และ Ridge คือศัพท์ที่ใช้ Ridge ใช้ระยะโทษซึ่ง จำกัด ขนาดของค่าสัมประสิทธิ์เวกเตอร์ Lasso ใช้โทษซึ่งกำหนดขอบเขตระหว่างสัมประสิทธิ์และทำให้โมเดลที่ติดตั้งตีความได้ง่ายขึ้น Elasticnet แนะนำว่าการประนีประนอมระหว่างทั้งสองเทคนิคและมีโทษซึ่งเป็นส่วนผสมของและบรรทัดฐานL2L1L1L2


3
นั่นคือหนังสืออ้างอิงที่ยอดเยี่ยม
bdeonovic

4
ก็เพราะผู้เขียนเป็นนักประดิษฐ์ของเทคนิคเหล่านี้!
Bakaburg

1
ขอบคุณที่ให้การอ้างอิงของหนังสือเล่มนี้ที่สวยงาม
Christina

1
ฉันขอแนะนำส่วนที่ 18.4 เช่นกันหน้า 661-668 จัดเตรียมข้อมูลเพิ่มเติมเกี่ยวกับ lasso vs. elastic net
Katya Handler

1
ลิงก์ไปยังหนังสือเล่มนี้ตายแล้วตั้งแต่วันที่ 14 ต.ค. 2559
Ashe

22

เพื่อสรุปนี่คือความแตกต่างสำคัญระหว่าง Lasso, Ridge และ Elastic-net:

  1. Lasso ทำการเลือกเบาบางในขณะที่ Ridge ไม่
  2. เมื่อคุณมีตัวแปรที่มีความสัมพันธ์สูงการถดถอยของริดจ์จะทำให้ค่าสัมประสิทธิ์ทั้งสองมีค่าลดลง Lasso ค่อนข้างเฉยเมยและโดยทั่วไปเลือกหนึ่งมากกว่าอื่น ๆ ขึ้นอยู่กับบริบทไม่มีใครรู้ว่าจะเลือกตัวแปรใด Elastic-net เป็นการประนีประนอมระหว่างสองสิ่งที่พยายามลดขนาดและทำการเลือกแบบเบาบางในเวลาเดียวกัน
  3. ตัวประมาณค่าริดจ์มีความแตกต่างกับการขยายสเกลของข้อมูล นั่นคือถ้าทั้งสองตัวแปร X และ Y ถูกคูณด้วยค่าคงที่ค่าสัมประสิทธิ์ของความพอดีจะไม่เปลี่ยนแปลงสำหรับพารามิเตอร์กำหนด อย่างไรก็ตามสำหรับ Lasso พอดีไม่ได้เป็นอิสระจากการปรับขนาด ในความเป็นจริงพารามิเตอร์ต้องถูกปรับอัตราส่วนโดยตัวคูณเพื่อให้ได้ผลลัพธ์เดียวกัน มันซับซ้อนมากขึ้นสำหรับตาข่ายยืดหยุ่นλλ
  4. ริดจ์ลงโทษ 's ที่ใหญ่ที่สุดβมากกว่าที่จะลงโทษคนที่มีขนาดเล็กกว่า Lasso ลงโทษพวกเขาอย่างสม่ำเสมอ สิ่งนี้อาจมีหรือไม่มีความสำคัญ ในปัญหาการพยากรณ์ด้วยตัวทำนายที่ทรงพลังประสิทธิภาพของตัวพยากรณ์นั้นหดตัวลงโดยสันเมื่อเทียบกับ Lasso

@ balaks สำหรับจุดที่สองที่คุณทำมันหมายความว่า 'หนึ่งไม่ทราบว่าตัวแปรที่ได้รับเลือก'? คุณหมายถึง LASSO ไม่แยแสดังนั้นจึงเป็นการสุ่มเลือกหนึ่งดังนั้นเราจึงไม่รู้ว่าอันไหนดีที่สุด
meTchaikovsky

4

ฉันแนะนำเป็นอย่างยิ่งให้คุณอ่านหนังสือการเรียนรู้เชิงสถิติเบื้องต้น (Tibshirani et. al, 2013)

เหตุผลของเรื่องนี้คือองค์ประกอบของหนังสือเรียนรู้ทางสถิติมีไว้สำหรับบุคคลที่มีการฝึกอบรมขั้นสูงในสาขาคณิตศาสตร์ ในคำนำถึง ISL ผู้เขียนเขียน:

ความรู้เบื้องต้นเกี่ยวกับการเรียนรู้ทางสถิติเกิดขึ้นจากความต้องการการรับรู้ที่กว้างขึ้นและการปฏิบัติทางเทคนิคในหัวข้อเหล่านี้น้อยลง [ ... ]

การเรียนรู้เบื้องต้นเกี่ยวกับสถิติเหมาะสำหรับนักศึกษาระดับปริญญาตรีหรือปริญญาโทขั้นสูงในด้านสถิติหรือสาขาวิชาที่เกี่ยวข้องหรือสำหรับบุคคลในสาขาวิชาอื่น ๆ ที่ต้องการใช้เครื่องมือการเรียนรู้ทางสถิติเพื่อวิเคราะห์ข้อมูล


1
คุณช่วยอธิบายรายละเอียดเกี่ยวกับสาเหตุที่คุณพบว่าการอ้างอิงนี้มีประโยชน์หรือไม่
JM ไม่ใช่นักสถิติ

1
ไม่เป็นไรที่จะอ้างถึงหนังสือ แต่โปรดทำเครื่องหมายว่าเป็นข้อความอ้างอิงและไม่ใช่ข้อความของคุณเอง ไม่อย่างนั้นมันจะเป็นการลอกเลียนแบบ ฉันแก้ไขให้คุณแล้ว
อะมีบาพูดว่า Reinstate Monica

1

คำตอบข้างต้นมีความชัดเจนและให้ข้อมูล ฉันต้องการเพิ่มจุดย่อยหนึ่งจุดจากมุมมองทางสถิติ ยกตัวอย่างการถดถอยของสันเขา มันเป็นส่วนขยายของการถดถอยแบบสี่เหลี่ยมจัตุรัสที่น้อยที่สุดตามลำดับเพื่อแก้ปัญหาพหุคูณสัมพันธ์เมื่อมีคุณลักษณะที่สัมพันธ์กันมากมาย หากการถดถอยเชิงเส้นคือ

Y=Xb+e

โซลูชันสมการปกติสำหรับการถดถอยเชิงเส้นหลายเส้น

b=inv(X.T*X)*X.T*Y

โซลูชันสมการปกติสำหรับการถดถอยของสันคือ

b=inv(X.T*X+k*I)*X.T*Y. 

มันเป็นตัวประมาณแบบเอนเอียงสำหรับ b และเราสามารถหาค่าปรับ k ซึ่งจะทำให้ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองของการถดถอยของสันมีค่าน้อยกว่า OLS ถดถอย

สำหรับ LASSO และ Elastic-Net เราไม่สามารถหาวิธีวิเคราะห์เช่นนี้ได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.