ฉันได้เห็นหลาย ๆ ที่ที่พวกเขามีชุดข้อมูลอินพุต / เอาต์พุตที่พวกเขาสร้างเส้นถดถอยเชิงเส้นแก้ไขอคติจากนั้นใช้ข้อมูลนั้นสำหรับโมเดลของพวกเขาเท่านั้น ฉันไม่ได้รับการแก้ไขความลำเอียงนี้คืออะไร?
ฉันได้เห็นหลาย ๆ ที่ที่พวกเขามีชุดข้อมูลอินพุต / เอาต์พุตที่พวกเขาสร้างเส้นถดถอยเชิงเส้นแก้ไขอคติจากนั้นใช้ข้อมูลนั้นสำหรับโมเดลของพวกเขาเท่านั้น ฉันไม่ได้รับการแก้ไขความลำเอียงนี้คืออะไร?
คำตอบ:
แม้ว่าคำแถลงปัญหาจะไม่แม่นยำพอที่จะรู้ได้อย่างแม่นยำว่าคุณใช้การปรับแก้ปัญหาแบบอคติชนิดใดฉันคิดว่าฉันสามารถพูดได้ในแง่ทั่วไป บางครั้งตัวประมาณค่าสามารถลำเอียง นี่หมายถึงว่าแม้ว่ามันอาจเป็นตัวประมาณที่ดี แต่ค่าที่คาดหวังหรือค่าเฉลี่ยนั้นไม่เท่ากับพารามิเตอร์อย่างแท้จริง ความแตกต่างระหว่างค่าเฉลี่ยของตัวประมาณและค่าพารามิเตอร์จริงเรียกว่าอคติ เมื่อตัวประมาณเป็นที่รู้กันว่าลำเอียงบางครั้งก็เป็นไปได้โดยวิธีอื่นเพื่อประมาณค่าความเอนเอียง ขั้นตอนนี้เรียกว่าการแก้ไขอคติ มันทำด้วยความตั้งใจที่จะปรับปรุงประมาณการ ในขณะที่มันจะลดอคติก็จะเพิ่มความแปรปรวน
ตัวอย่างที่ดีของการแก้ไขอคติที่ประสบความสำเร็จคือการประมาณการแก้ไขการบูตอคติของอัตราข้อผิดพลาดการจำแนกประเภท การประเมินอัตราการเกิดข้อผิดพลาดครั้งใหม่มีความเอนเอียงในแง่ดีมากเมื่อขนาดตัวอย่างมีขนาดเล็ก bootstrap จะใช้ในการประเมินความลำเอียงของการประเมินการประกาศใหม่และเนื่องจากการประมาณการการประกาศใหม่ประเมินอัตราความผิดพลาดต่ำกว่าความผิดพลาดการประเมินความลำเอียงจะถูกเพิ่มเข้าไปในการประมาณการการประกาศใหม่เพื่อให้การประมาณการการบูตมีความถูกต้อง เมื่อขนาดตัวอย่างมีขนาดเล็ก 30 หรือน้อยกว่าการรวมทั้งสองคลาสในปัญหาสองคลาสบางรูปแบบของการประมาณ bootstrap (โดยเฉพาะอย่างยิ่งการประมาณ 632) ให้การประมาณการที่แม่นยำมากขึ้นของอัตราความผิดพลาดมากกว่าการตรวจสอบแบบ cross-one-out การประเมินอัตราข้อผิดพลาดเกือบจะไม่เอนเอียง)