การปรับสภาพสุทธิแบบยืดหยุ่นเป็นที่นิยมของ Lasso & Ridge เสมอเนื่องจากดูเหมือนว่าจะแก้ไขข้อเสียของวิธีการเหล่านี้ สัญชาตญาณคืออะไรและอะไรคือคณิตศาสตร์ที่อยู่เบื้องหลังตาข่ายยืดหยุ่น
การปรับสภาพสุทธิแบบยืดหยุ่นเป็นที่นิยมของ Lasso & Ridge เสมอเนื่องจากดูเหมือนว่าจะแก้ไขข้อเสียของวิธีการเหล่านี้ สัญชาตญาณคืออะไรและอะไรคือคณิตศาสตร์ที่อยู่เบื้องหลังตาข่ายยืดหยุ่น
คำตอบ:
ใช่ตาข่ายที่ยืดหยุ่นมักเป็นที่นิยมมากกว่าการถดถอยแบบ lasso & ridge เพราะมันสามารถแก้ไขข้อ จำกัด ของทั้งสองวิธีในขณะที่รวมถึงแต่ละกรณีเป็นกรณีพิเศษ ดังนั้นหากวิธีแก้ปัญหาสันเขาหรือบ่วงนั้นเป็นสิ่งที่ดีที่สุดแน่นอนว่าการเลือกแบบจำลองที่ดีจะระบุว่าเป็นส่วนหนึ่งของกระบวนการสร้างแบบจำลอง
ความคิดเห็นที่โพสต์ของฉันได้ชี้ให้เห็นว่าข้อดีของการยืดหยุ่นสุทธิจะไม่มีเงื่อนไข ฉันยืนยันในความเชื่อของฉันว่าความเป็นสากลของการถดถอยสุทธิแบบยืดหยุ่นยังคงเป็นที่นิยมในการทำให้เป็นมาตรฐานหรือด้วยตนเอง โดยเฉพาะฉันคิดว่าประเด็นของการต่อสู้ระหว่างฉันกับคนอื่นนั้นเชื่อมโยงโดยตรงกับข้อสันนิษฐานที่เรายินดีทำเกี่ยวกับกระบวนการสร้างแบบจำลอง เมื่อมีความรู้ที่แข็งแกร่งเกี่ยวกับข้อมูลพื้นฐานบางวิธีจะเป็นที่ต้องการของผู้อื่น อย่างไรก็ตามความชอบของฉันสำหรับตาข่ายยืดหยุนนั้นมีรากฐานมาจากความสงสัยของฉันที่ใคร ๆ ก็มั่นใจได้ว่าหรือเป็นแบบจำลองที่แท้จริง
มันค่อนข้างกลม ยกโทษให้ฉันถ้านี่เป็นกะล่อนค่อนข้าง แต่ถ้าคุณรู้ว่า LASSO (สันเขา) เป็นทางออกที่ดีที่สุดแล้วคุณจะไม่ถามตัวเองว่าจะทำแบบจำลองอย่างเหมาะสม; คุณจะพอดีกับโมเดล LASSO (สัน) หากคุณแน่ใจอย่างแน่นอนว่าคำตอบที่ถูกต้องคือการถดถอยของ LASSO (สันเขา) คุณจะมั่นใจได้อย่างชัดเจนว่าไม่มีเหตุผลที่จะเสียเวลาในการติดตั้งมุ้งยืด แต่ถ้าคุณไม่แน่ใจเล็กน้อยว่า LASSO (สัน) เป็นวิธีที่ถูกต้องในการดำเนินการหรือไม่ฉันเชื่อว่ามันสมเหตุสมผลที่จะประเมินตัวแบบที่ยืดหยุ่นมากขึ้นและประเมินว่าข้อมูลสนับสนุนความเชื่อก่อนหน้านี้มากเพียงใด
นี่เป็นเรื่องจริง แต่ในขั้นตอนที่เราคิดว่าจะใช้วิธีไหนใครจะไม่รู้ว่าตาข่ายยืดหยุ่นสันหรือ LASSO นั้นดีที่สุด หากหนึ่งในเหตุผลที่ทางออกที่ดีที่สุดต้องเป็น LASSO หรือการถดถอยแนวสันนั่นก็คือเราอยู่ในโดเมนของการอ้างสิทธิ์ (1) หากเรายังไม่แน่ใจว่าสิ่งไหนดีที่สุดเราสามารถทดสอบ LASSO, สันและยืดหยุ่นได้และเลือกรุ่นสุดท้ายที่จุดนั้น (หรือถ้าคุณเป็นนักวิชาการเพียงเขียนบทความของคุณเกี่ยวกับทั้งสามข้อ ) สถานการณ์ความไม่แน่นอนก่อนหน้านี้จะทำให้เราอยู่ในขอบเขตของการอ้างสิทธิ์ (2) ซึ่งรูปแบบที่แท้จริงคือ LASSO / สันเขา แต่เราไม่ทราบล่วงหน้าก่อนเวลาและเราเลือกรูปแบบที่ไม่ถูกต้องเนื่องจากพารามิเตอร์ที่ระบุไม่ดีหรือ ยืดหยุ่นสุทธิเป็นทางออกที่ดีที่สุด
Hui Zou และ Trevor Hastie " การทำให้เป็นมาตรฐานและการเลือกตัวแปรผ่านทางเน็ตยืดหยุ่น " สถิติ JR Soc., vol 67 (2005), ตอนที่ 2, pp. 301-320
Richard Hardy ชี้ให้เห็นว่าสิ่งนี้ได้รับการพัฒนาในรายละเอียดเพิ่มเติมใน Hastie และคณะ "องค์ประกอบของการเรียนรู้ทางสถิติ" บทที่ 3 และ 18
นี่เป็นคำถามที่ถูกโพสต์ถึงฉันในความคิดเห็น:
ฉันขอขอบคุณที่จิตวิญญาณของคำถามคือ "ถ้ามันเป็นตามที่คุณเรียกร้องและการลงโทษสองครั้งดีทำไมไม่เพิ่มอีก?" แต่ฉันคิดว่าคำตอบอยู่ที่ว่าทำไมเราถึงทำให้เป็นอันดับแรก
นอกจากปัญหาเหล่านี้แล้วโมเดลที่ทำให้เป็นมาตรฐานยังสามารถออกตัวแบบ ML ได้เนื่องจากคุณสมบัติการหดตัวของตัวประมาณค่าเป็น "มองโลกในแง่ร้าย" และดึงสัมประสิทธิ์ไปที่ 0
โดยทั่วไปฉันเห็นด้วยกับคำตอบ @Sycorax แต่ฉันต้องการเพิ่มคุณสมบัติบางประการ
การพูดว่า "ตาข่ายยืดหยุ่นมักเป็นที่นิยมมากกว่าการถดถอยแบบ lasso & ridge" อาจแรงเกินไป ในตัวอย่างที่มีขนาดเล็กหรือขนาดกลางอวนอาจไม่เลือกใช้สารละลาย LASSO หรือริดจ์บริสุทธิ์แม้ว่าในอดีตหรืออันหลังนั้นเป็นของที่เกี่ยวข้องก็ตาม ด้วยความรู้ที่แข็งแกร่งมาก่อนจึงสามารถเลือกใช้ LASSO หรือสันเขาแทนการใช้ตาข่ายยืดหยุ่น อย่างไรก็ตามหากขาดความรู้ก่อนหน้านี้แล้วตาข่ายยืดหยุ่นควรเป็นคำตอบที่ต้องการ
นอกจากนี้ตาข่ายยืดหยุ่นยังมีราคาแพงกว่า LASSO หรือสันเขาเนื่องจากมีการเลือกน้ำหนักสัมพัทธ์ของ LASSO เมื่อเทียบกับสันเขาโดยใช้การตรวจสอบแบบไขว้ หากกริดที่เหมาะสมของค่าอัลฟาคือ [0,1] ที่มีขนาดขั้นตอนที่ 0.1 นั่นก็หมายถึงว่าตาข่ายยืดหยุนนั้นมีค่าประมาณ 11 เท่าของราคาที่คำนวณได้เช่น LASSO หรือสันเขา (เนื่องจาก LASSO และสันเขาไม่มีความซับซ้อนในการคำนวณเหมือนกันผลที่ได้คือการคาดเดาคร่าวๆ)