เป็นที่ทราบกันบ่อยมากว่าการลดการเหลือน้อยกำลังสองน้อยที่สุดนั้นเป็นที่ต้องการมากกว่าการลดการตกค้างสัมบูรณ์เนื่องจากเหตุผลที่ทำให้การคำนวณง่ายขึ้น แต่มันอาจจะยังจะดีกว่าสำหรับเหตุผลอื่น ๆ กล่าวคือหากสมมติฐานเป็นจริง (และนี่ไม่ใช่เรื่องผิดปกติ) ดังนั้นจึงมีวิธีแก้ปัญหาที่ (โดยเฉลี่ย) มีความแม่นยำมากขึ้น
โอกาสสูงสุด
การถดถอยกำลังสองน้อยที่สุดและการถดถอยเชิงปริมาณ (เมื่อดำเนินการโดยการลดเศษเหลือสัมสัมบูรณ์) สามารถมองเห็นได้ว่าเป็นการเพิ่มฟังก์ชันความน่าจะเป็นสำหรับการกระจายข้อผิดพลาดแบบเกาส์ / ลาปลาสและในแง่นี้มีความสัมพันธ์อย่างมาก
การกระจายแบบเกาส์:
ฉ( x ) = 12 πσ2----√อี- ( x - μ )22 σ2
ด้วยความน่าจะเป็นบันทึกสูงสุดเมื่อลดผลรวมของเศษที่เหลือยกกำลังสอง
เข้าสู่ระบบL (x)=- n2เข้าสู่ระบบ( 2 π) - n บันทึก( σ) - 12 σ2Σi = 1n( xผม- μ )2ผลรวมของกำลังสองเหลือ
การกระจายแบบ Laplace:
ฉ( x ) = 12 bอี- | x - μ |ข
ด้วยความน่าจะเป็นบันทึกสูงสุดเมื่อลดผลรวมของเหลือตกค้างที่แน่นอน
เข้าสู่ระบบL (x)=-บันทึกการทำงานn( 2 ) - n บันทึก( b ) - 1ขΣi = 1n| xผม- μ |ผลรวมของค่าตกค้างสัมบูรณ์
หมายเหตุ: การแจกแจงแบบลาปลาซและผลรวมของค่าตกค้างสัมบูรณ์เกี่ยวข้องกับค่ามัธยฐาน แต่สามารถนำไปรวมกับควอนไทล์อื่น ๆ ได้โดยให้น้ำหนักต่างกันสำหรับค่าลบและค่าบวกเชิงลบ
การกระจายข้อผิดพลาดที่ทราบ
เมื่อเรารู้ว่าการแจกแจงข้อผิดพลาด (เมื่อสมมติฐานเป็นจริง) มันสมเหตุสมผลที่จะเลือกฟังก์ชั่นความน่าจะเป็นที่เกี่ยวข้อง การย่อขนาดฟังก์ชั่นนั้นเหมาะสมที่สุด
บ่อยครั้งที่ข้อผิดพลาดจะกระจายทั่วไป (โดยประมาณ) ในกรณีที่ใช้กำลังสองน้อยที่สุดเป็นวิธีที่ดีที่สุดในการค้นหาพารามิเตอร์μ (ซึ่งเกี่ยวข้องกับทั้งค่าเฉลี่ยและค่ามัธยฐาน) มันเป็นวิธีที่ดีที่สุดเพราะมีค่าความแปรปรวนตัวอย่างต่ำสุด (ต่ำสุดของตัวประมาณค่าที่ไม่เอนเอียงทั้งหมด) หรือคุณสามารถพูดได้มากกว่านี้: มันโดดเด่นแบบสุ่ม (ดูภาพประกอบในคำถามนี้เปรียบเทียบการกระจายตัวของค่ามัธยฐานตัวอย่างและค่าเฉลี่ยตัวอย่าง)
ดังนั้นเมื่อความคลาดเคลื่อนมีการแจกแจงปกติแล้วค่าเฉลี่ยตัวอย่างคือตัวประมาณค่าการกระจายที่ดีกว่าค่ามัธยฐานตัวอย่างดังนั้นเมื่อข้อผิดพลาดเป็นเรื่องปกติกระจายแล้วค่าเฉลี่ยของกลุ่มตัวอย่างเป็นประมาณการที่ดีขึ้นของค่ามัธยฐานกระจายกว่าค่าเฉลี่ยของกลุ่มตัวอย่างการถดถอยกำลังสองน้อยที่สุดเป็นตัวประมาณที่เหมาะสมที่สุดของควอนไทล์ มันจะดีกว่าการใช้ผลรวมที่เหลือน้อยที่สุดของสัมบูรณ์
เนื่องจากมีปัญหามากมายที่จัดการกับข้อผิดพลาดแบบกระจายการใช้วิธีกำลังสองน้อยที่สุดจึงเป็นที่นิยมมาก หากต้องการทำงานกับการแจกแจงชนิดอื่นคุณสามารถใช้โมเดลเชิงเส้นทั่วไปได้ และวิธีการของกำลังสองน้อยที่สุดซ้ำซึ่งสามารถใช้ในการแก้ GLMs ยังใช้งานได้สำหรับการกระจาย Laplace (เช่น. สำหรับการเบี่ยงเบนสัมบูรณ์ ) ซึ่งเทียบเท่ากับการหาค่ามัธยฐาน (หรือในรุ่นทั่วไปอื่น ๆ quantiles)
การกระจายข้อผิดพลาดที่ไม่รู้จัก
ความแข็งแรง
ค่ามัธยฐานหรือปริมาณอื่น ๆ มีความได้เปรียบที่แข็งแกร่งมากเกี่ยวกับประเภทของการแจกแจง ค่าจริงไม่ได้มีความสำคัญมากนักและปริมาณจะสนใจเพียงแค่ลำดับ ดังนั้นไม่ว่าการกระจายตัวจะเป็นอย่างไรการลดปริมาณตกค้างสัมบูรณ์ (ซึ่งเทียบเท่ากับการค้นหาปริมาณ) ก็ใช้งานได้ดีมาก
คำถามมีความซับซ้อนและกว้างขวางที่นี่และขึ้นอยู่กับประเภทของความรู้ที่เรามีหรือไม่มีเกี่ยวกับฟังก์ชันการแจกแจง ตัวอย่างเช่นการกระจายอาจจะกระจายปกติประมาณ แต่มีค่าผิดปกติเพิ่มเติมบางส่วน สามารถจัดการได้โดยการลบค่าภายนอก การลบค่าสุดขีดนี้ใช้งานได้ในการประมาณค่าพารามิเตอร์ตำแหน่งของการแจกแจง Cauchyซึ่งค่าเฉลี่ยที่ถูกตัดทอนอาจเป็นตัวประมาณที่ดีกว่าค่ามัธยฐาน ดังนั้นไม่เพียง แต่สำหรับสถานการณ์ในอุดมคติเมื่อมีการสันนิษฐาน แต่สำหรับแอพพลิเคชั่นที่เหมาะสมน้อยกว่า (เช่นค่าผิดปกติเพิ่มเติม) อาจมีวิธีการที่ดีที่ยังคงใช้รูปแบบของผลรวมของส่วนที่เหลือกำลังสองแทนผลรวมของค่าคงที่สัมบูรณ์
ฉันจินตนาการว่าการถดถอยด้วยเศษเหลืออาจจะซับซ้อนกว่านี้มาก ดังนั้นมันอาจจะเป็นการถดถอยเชิงปริมาณซึ่งเป็นประเภทของการถดถอยที่เกิดขึ้นเนื่องจากเหตุผลที่ว่ามันง่ายกว่าการคำนวณ (ไม่ง่ายกว่าธรรมดากว่ากำลังสองน้อยที่สุดธรรมดา แต่ง่ายกว่าการตัดทอนกำลังสองน้อยสุด)
ลำเอียง / เป็นกลาง
ปัญหาอีกอย่างคือลำเอียงเมื่อเทียบกับตัวประมาณที่ไม่เอนเอียง ในข้างต้นฉันได้อธิบายการประมาณความน่าจะเป็นสูงสุดสำหรับค่าเฉลี่ยนั่นคือวิธีแก้ปัญหากำลังสองน้อยที่สุดในฐานะตัวประมาณที่ดีหรือดีกว่าเพราะมักจะมีความแปรปรวนต่ำสุดของตัวประมาณค่าที่ไม่เอนเอียงทั้งหมด แต่ตัวประมาณแบบเอนเอียงอาจดีกว่า (ข้อผิดพลาดกำลังสองรวมที่ต่ำกว่าที่คาดไว้)
นี่ทำให้คำถามกว้างและซับซ้อนอีกครั้ง มีตัวประมาณที่แตกต่างกันจำนวนมากและสถานการณ์ที่แตกต่างกันเพื่อนำไปใช้ การใช้ฟังก์ชันผลรวมการสูญเสียส่วนที่ปรับกำลังสองที่ปรับแล้วมักจะทำงานได้ดีเพื่อลดข้อผิดพลาด (เช่นวิธีการทำให้เป็นมาตรฐานทุกประเภท) แต่อาจไม่จำเป็นต้องทำงานได้ดีในทุกกรณี มันไม่แปลกที่จะจินตนาการว่าเนื่องจากฟังก์ชั่นการสูญเสียส่วนที่เหลือยกกำลังสองมักจะทำงานได้ดีสำหรับผู้ประมาณค่าที่ไม่เอนเอียงทุกคนตัวประมาณค่าเอนเอียงที่ดีที่สุดอาจเป็นสิ่งที่ใกล้เคียงกับผลรวมของฟังก์ชันการสูญเสียส่วนแบ่งกำลังสอง