ในฐานะที่เป็นคำอธิบายทางเลือกให้พิจารณาปรีชาดังต่อไปนี้:
เมื่อลดข้อผิดพลาดให้น้อยที่สุดเราต้องตัดสินใจว่าจะลงโทษข้อผิดพลาดเหล่านี้อย่างไร อันที่จริงวิธีที่ตรงไปตรงมาที่สุดในการลงโทษข้อผิดพลาดคือการใช้linearly proportional
ฟังก์ชันการลงโทษ ด้วยฟังก์ชันเช่นนี้การเบี่ยงเบนจากค่าเฉลี่ยแต่ละครั้งจะได้รับข้อผิดพลาดที่สอดคล้องตามสัดส่วน สองเท่าจากค่าเฉลี่ยจะส่งผลให้เกิดการลงโทษสองครั้ง
วิธีที่ใช้กันทั่วไปคือการพิจารณาsquared proportional
ความสัมพันธ์ระหว่างการเบี่ยงเบนจากค่าเฉลี่ยและการลงโทษที่สอดคล้องกัน สิ่งนี้จะทำให้แน่ใจได้ว่ายิ่งคุณอยู่ห่างจากค่าเฉลี่ยมากเท่าไรคุณก็ยิ่งถูกลงโทษมากขึ้นเท่านั้น การใช้ฟังก์ชันการลงโทษนี้ค่าผิดปกติ (ห่างจากค่าเฉลี่ย) ถือว่าเป็นข้อมูลที่มีสัดส่วนมากกว่าการสังเกตใกล้ค่าเฉลี่ย
เพื่อให้เห็นภาพของสิ่งนี้คุณสามารถพล็อตฟังก์ชันการลงโทษได้:
ตอนนี้โดยเฉพาะอย่างยิ่งเมื่อพิจารณาการประมาณการถดถอย (เช่น OLS) ฟังก์ชันการลงโทษที่แตกต่างกันจะให้ผลลัพธ์ที่แตกต่างกัน การใช้linearly proportional
ฟังก์ชั่นการลงโทษการถดถอยจะกำหนดน้ำหนักให้กับค่าผิดปกติน้อยกว่าเมื่อใช้squared proportional
ฟังก์ชันการลงโทษ ค่ามัธยฐานเบี่ยงเบนสัมบูรณ์ (MAD) จึงเป็นที่รู้จักกันว่าเป็นตัวประมาณที่แข็งแกร่งกว่า โดยทั่วไปจึงเป็นกรณีที่ตัวประมาณที่มีประสิทธิภาพเหมาะสมกับจุดข้อมูลส่วนใหญ่ได้ดี แต่ไม่สนใจ 'ค่าผิดปกติ' ในการเปรียบเทียบกำลังสองน้อยที่สุดจะถูกดึงเข้าหาค่าผิดปกติมากขึ้น นี่คือการสร้างภาพข้อมูลเพื่อการเปรียบเทียบ:
ถึงแม้ว่า OLS จะเป็นมาตรฐาน แต่ฟังก์ชั่นการลงโทษที่แตกต่างกันก็มีการใช้งานอย่างแน่นอนเช่นกัน ตัวอย่างเช่นคุณสามารถดูฟังก์ชั่นที่สมบูรณ์แบบของ Matlabซึ่งจะช่วยให้คุณเลือกฟังก์ชั่นการลงโทษที่แตกต่าง (เรียกว่า 'น้ำหนัก') สำหรับการถดถอยของคุณ ฟังก์ชั่นการลงโทษรวมถึงแอนดรู, bisquare, cauchy, ยุติธรรม, ฮิว, โลจิสติก, ols, talwar และเวลส์ การแสดงออกที่สอดคล้องกันของพวกเขาสามารถพบได้บนเว็บไซต์เช่นกัน
ฉันหวังว่าจะช่วยคุณในการรับฟังก์ชั่นการลงโทษเพิ่มเติมอีกเล็กน้อย :)
ปรับปรุง
หากคุณมี Matlab ฉันสามารถแนะนำให้เล่นกับrobustdemoของ Matlab ซึ่งสร้างขึ้นโดยเฉพาะสำหรับการเปรียบเทียบกำลังสองน้อยที่สุดธรรมดากับการถดถอยที่แข็งแกร่ง:
การสาธิตช่วยให้คุณสามารถลากจุดแต่ละจุดและเห็นผลกระทบทันทีทั้งสี่เหลี่ยมน้อยที่สุดธรรมดาและการถดถอยที่แข็งแกร่ง (ซึ่งเหมาะสำหรับวัตถุประสงค์ในการสอน!)