ฉันกำลังมีปัญหาบางอย่างกับการได้มาของวิธีแก้ปัญหาการถดถอยของสันเขา
ฉันรู้วิธีการแก้ปัญหาการถดถอยโดยไม่มีคำศัพท์
แต่หลังจากเพิ่มคำศัพท์ L2เข้ากับฟังก์ชั่นค่าใช้จ่าย
ฉันกำลังมีปัญหาบางอย่างกับการได้มาของวิธีแก้ปัญหาการถดถอยของสันเขา
ฉันรู้วิธีการแก้ปัญหาการถดถอยโดยไม่มีคำศัพท์
แต่หลังจากเพิ่มคำศัพท์ L2เข้ากับฟังก์ชั่นค่าใช้จ่าย
คำตอบ:
มันเพียงพอที่จะแก้ไขฟังก์ชั่นการสูญเสียโดยการเพิ่มบทลงโทษ ในแง่ของเมทริกซ์ฟังก์ชันการสูญเสียกำลังสองเริ่มต้นจะกลายเป็น
เรามาสร้างสิ่งที่เรารู้กันดีว่าเมื่อใดก็ตามที่เมทริกซ์โมเดลคือคำตอบ -vector คือและพารามิเตอร์ -vector คือฟังก์ชันวัตถุประสงค์
(ซึ่งคือผลรวมของกำลังสองของเศษเหลือ) จะลดลงเมื่อแก้สมการปกติ
การถดถอยของสันเขาเพิ่มคำอีกคำหนึ่งลงในฟังก์ชันวัตถุประสงค์ (โดยปกติจะเป็นหลังตัวแปรมาตรฐานทั้งหมดเพื่อวางไว้บนฐานรากทั่วไป) ขอให้ลด
สำหรับบางคนที่ไม่ใช่เชิงลบอย่างต่อเนื่อง\มันคือผลรวมของกำลังสองของส่วนที่เหลือบวกกับผลรวมของกำลังสองของสัมประสิทธิ์ตัวเอง (ทำให้เห็นได้ชัดว่ามันมีค่าต่ำสุดทั่วโลก) เพราะก็มีบวกราก\
พิจารณาเมทริกซ์เติมกับแถวที่สอดคล้องกับครั้งเมทริกซ์เอกลักษณ์ :
เมื่อเวกเตอร์ถูกขยายในทำนองเดียวกันโดยมีศูนย์ท้าย , ผลิตภัณฑ์เมทริกซ์ในฟังก์ชันวัตถุประสงค์เพิ่มเพิ่มเติมข้อกำหนดของแบบฟอร์มเพื่อวัตถุประสงค์เดิม ดังนั้น
จากรูปแบบของการแสดงออกทางซ้ายมือจะเป็นสมการปกติในทันที
เพราะเราอยู่ติดกับศูนย์ที่ส่วนท้ายของ , ด้านขวามือเป็นเช่นเดียวกับY ในด้านซ้ายมือจะถูกเพิ่มในต้นฉบับX ดังนั้นสมการปกติใหม่ทำให้ง่ายขึ้น
นอกเหนือจากการประหยัดในเชิงแนวคิดแล้ว - ไม่จำเป็นต้องมีการปรับแต่งใหม่เพื่อให้ได้ผลลัพธ์นี้ - นอกจากนี้ยังเป็นการประหยัดทางคอมพิวเตอร์: ซอฟต์แวร์ของคุณสำหรับการทำกำลังสองน้อยที่สุดทั่วไปจะทำการถดถอยแบบสันเขาโดยไม่มีการเปลี่ยนแปลงใด ๆ (อย่างไรก็ตามมันจะมีประโยชน์ในปัญหาใหญ่ในการใช้ซอฟต์แวร์ที่ออกแบบมาเพื่อจุดประสงค์นี้เพราะมันจะใช้ประโยชน์จากโครงสร้างพิเศษของเพื่อให้ได้ผลลัพธ์อย่างมีประสิทธิภาพสำหรับช่วงเวลาที่หนาแน่นของทำให้คุณสามารถสำรวจว่าคำตอบแตกต่างกันอย่างไร กับ )
ความงามอีกอย่างของการมองสิ่งต่าง ๆนี้คือวิธีที่จะช่วยให้เราเข้าใจการถดถอยของสันเขา เมื่อเราต้องการที่จะเข้าใจการถดถอยจริงๆก็มักจะช่วยในการคิดว่ามันเรขาคณิต: คอลัมน์ของเป็นการเวกเตอร์ในปริภูมิเวกเตอร์ที่แท้จริงของมิติnโดยการติดถึงดังนั้นจึงยืดพวกมันจาก -vector ถึง -vectors เรากำลังฝังเข้าไปในพื้นที่ขนาดใหญ่โดยรวม "จินตภาพ", ทิศทางตั้งฉากกัน คอลัมน์แรกของได้รับส่วนประกอบจินตภาพขนาดเล็กที่มีขนาดซึ่งจะเป็นการเพิ่มความยาวและย้ายออกจากพื้นที่ที่สร้างโดยคอลัมน์ต้นฉบับ คอลัมน์ที่สอง, สาม, ... ,มีความยาวคล้ายกันและถูกย้ายออกจากพื้นที่เดิมด้วยจำนวนเดียวกัน - แต่ทั้งหมดอยู่ในทิศทางใหม่ที่แตกต่างกัน ดังนั้นคอลลิเนียริตี้ใด ๆ ที่ปรากฏในคอลัมน์เดิมจะได้รับการแก้ไขทันที ยิ่งไปกว่านั้นยิ่งใหญ่ขึ้นเวกเตอร์ใหม่เหล่านี้ก็ยิ่งเข้าหาแต่ละทิศทางในจินตนาการ: พวกมันมากขึ้นเรื่อย ๆ ดังนั้นการแก้ปัญหาของสมการปกติจะกลายเป็นทันทีที่เป็นไปได้และมันอย่างรวดเร็วจะกลายเป็นตัวเลขที่มีเสถียรภาพเป็นเพิ่มขึ้นจาก0
คำอธิบายของกระบวนการนี้แนะนำวิธีการใหม่และสร้างสรรค์ในการจัดการกับปัญหาการถดถอยของสันถูกออกแบบมาเพื่อจัดการ ตัวอย่างเช่นการใช้วิธีการใด ๆ (เช่นการสลายตัวความแปรปรวนที่อธิบายโดย Belsley, Kuh และ Welsch ในหนังสือปี 1980 เรื่องการวินิจฉัยการถดถอยตอนที่ 3) คุณอาจสามารถระบุกลุ่มย่อยของคอลัมน์ collinear ของที่แต่ละกลุ่มย่อย เกือบจะตั้งฉากกับคนอื่น ๆ คุณต้องการเพียงติดกับเป็นแถวจำนวนมากเพื่อ (และศูนย์การ ) ที่มีองค์ประกอบในกลุ่มที่ใหญ่ที่สุดที่ทุ่มเทใหม่มิติหนึ่ง "จินตนาการ" สำหรับแทนที่องค์ประกอบของกลุ่มแต่ละห่างจากพี่น้อง: คุณไม่จำเป็นต้องจินตนาการ ขนาดที่ต้องทำ
การสืบทอดมารวมถึงเมทริกซ์แคลคูลัสซึ่งค่อนข้างน่าเบื่อ เราต้องการแก้ปัญหาต่อไปนี้:
ตอนนี้ให้สังเกตว่า และ เราจะได้รับเงื่อนไขการสั่งซื้อร่วมกัน แยกให้ผลเฉลย:
เมื่อเร็ว ๆ นี้ฉันได้พบคำถามเดียวกันในบริบทของ P-Splines และเนื่องจากแนวคิดนี้เหมือนกันฉันต้องการให้คำตอบโดยละเอียดเกี่ยวกับการได้มาของตัวประมาณสันเขา
เราเริ่มต้นด้วยฟังก์ชั่นเกณฑ์การลงโทษที่แตกต่างจากฟังก์ชั่น OLS-criterion คลาสสิกโดยใช้บทลงโทษในบทสรุปสุดท้าย:
ที่ไหน
เราสามารถเขียนเกณฑ์นี้ใหม่ในรูปสัญกรณ์เมทริกซ์และแยกย่อยลงได้อีก:
โดยที่เป็นเมทริกซ์เอกลักษณ์
ตอนนี้เราค้นหาที่ลดเกณฑ์ของเราให้น้อยที่สุด เราใช้ประโยชน์จากกฎความแตกต่างของเมทริกซ์ซึ่งเราสามารถทำได้ สมัครที่นี่เป็น :
มีบางสิ่งที่สำคัญที่ขาดหายไปในคำตอบที่ได้รับ
วิธีแก้ปัญหาสำหรับมาจากเงื่อนไขที่จำเป็นในการสั่งซื้อครั้งแรก:ซึ่งให้ผลผลิตI) แต่สิ่งนี้เพียงพอหรือไม่ นั่นคือการแก้ปัญหาเป็นขั้นต่ำทั่วโลกเฉพาะเมื่อนูนอย่างเคร่งครัด สิ่งนี้สามารถแสดงให้เห็นว่าเป็นจริง
อีกวิธีในการดูปัญหาคือดูความสมดุลระหว่างและจำกัด เพื่อที OLS ย่อมาจาก Ordinary Least Squares จากมุมมองนี้เป็นเพียงฟังก์ชัน Lagrangian ที่ใช้ในการค้นหา global minima ของฟังก์ชันวัตถุประสงค์นูนจำกัด ด้วยฟังก์ชันนูน .
คำอธิบายที่ดีเกี่ยวกับประเด็นเหล่านี้และการได้มาของสามารถพบได้ในบันทึกการบรรยายที่ดีเหล่านี้: http://math.bu.edu/people/cgineste/classes/ma575/p/w14_1.pdf