การแก้ไขอคติคืออะไร [ปิด]


12

ฉันได้เห็นหลาย ๆ ที่ที่พวกเขามีชุดข้อมูลอินพุต / เอาต์พุตที่พวกเขาสร้างเส้นถดถอยเชิงเส้นแก้ไขอคติจากนั้นใช้ข้อมูลนั้นสำหรับโมเดลของพวกเขาเท่านั้น ฉันไม่ได้รับการแก้ไขความลำเอียงนี้คืออะไร?


6
ฉันคิดว่าคุณอาจจำเป็นต้องให้ข้อมูลอ้างอิงหรือตัวอย่างที่ชัดเจนเพื่อให้เราสามารถทราบได้อย่างแม่นยำว่าคุณกำลังโต้ตอบอะไรอยู่
whuber

@ naught101 กรุณาทำทีละน้อยอย่าสแปมหน้าหลัก
gung - Reinstate Monica

@gung: อ่า .. คุณหมายถึงแท็กซักหน่อยแล้วค่อยรอหน่อยเหรอ? ขออภัยสายเกินไป ฉันพบแค่ 10 หรือมากกว่านั้นและฉันก็ทำทั้งหมด ลืมเกี่ยวกับเอฟเฟ็กต์หน้าแรก: / ถ้ามี แต่ SE เท่านั้นที่มีคุณสมบัติการแท็กจำนวนมาก
naught101

@gung: บางทีวันนี้อาจเป็นวันแก้ไขอคติอันดับต้น: D
naught101

1
@ naught101 การโต้ตอบซ้ำซ้อนฝ่ายเดียวนั้นเป็นเรื่องไร้สาระโดยเฉพาะบนแท็กที่คุณเพิ่งสร้างขึ้น ในวงกว้างเป็นการดีที่สุดที่จะมีส่วนร่วมกับเมตาดาต้าที่เป็นไปได้ (เพื่ออธิบายสิ่งที่คุณตั้งใจ) และหากดูเหมือนว่าไม่มีข้อโต้แย้ง
Glen_b -Reinstate Monica

คำตอบ:


11

แม้ว่าคำแถลงปัญหาจะไม่แม่นยำพอที่จะรู้ได้อย่างแม่นยำว่าคุณใช้การปรับแก้ปัญหาแบบอคติชนิดใดฉันคิดว่าฉันสามารถพูดได้ในแง่ทั่วไป บางครั้งตัวประมาณค่าสามารถลำเอียง นี่หมายถึงว่าแม้ว่ามันอาจเป็นตัวประมาณที่ดี แต่ค่าที่คาดหวังหรือค่าเฉลี่ยนั้นไม่เท่ากับพารามิเตอร์อย่างแท้จริง ความแตกต่างระหว่างค่าเฉลี่ยของตัวประมาณและค่าพารามิเตอร์จริงเรียกว่าอคติ เมื่อตัวประมาณเป็นที่รู้กันว่าลำเอียงบางครั้งก็เป็นไปได้โดยวิธีอื่นเพื่อประมาณค่าความเอนเอียง ขั้นตอนนี้เรียกว่าการแก้ไขอคติ มันทำด้วยความตั้งใจที่จะปรับปรุงประมาณการ ในขณะที่มันจะลดอคติก็จะเพิ่มความแปรปรวน

ตัวอย่างที่ดีของการแก้ไขอคติที่ประสบความสำเร็จคือการประมาณการแก้ไขการบูตอคติของอัตราข้อผิดพลาดการจำแนกประเภท การประเมินอัตราการเกิดข้อผิดพลาดครั้งใหม่มีความเอนเอียงในแง่ดีมากเมื่อขนาดตัวอย่างมีขนาดเล็ก bootstrap จะใช้ในการประเมินความลำเอียงของการประเมินการประกาศใหม่และเนื่องจากการประมาณการการประกาศใหม่ประเมินอัตราความผิดพลาดต่ำกว่าความผิดพลาดการประเมินความลำเอียงจะถูกเพิ่มเข้าไปในการประมาณการการประกาศใหม่เพื่อให้การประมาณการการบูตมีความถูกต้อง เมื่อขนาดตัวอย่างมีขนาดเล็ก 30 หรือน้อยกว่าการรวมทั้งสองคลาสในปัญหาสองคลาสบางรูปแบบของการประมาณ bootstrap (โดยเฉพาะอย่างยิ่งการประมาณ 632) ให้การประมาณการที่แม่นยำมากขึ้นของอัตราความผิดพลาดมากกว่าการตรวจสอบแบบ cross-one-out การประเมินอัตราข้อผิดพลาดเกือบจะไม่เอนเอียง)


1
"ในขณะที่มันจะลดอคติมันก็จะเพิ่มความแปรปรวน" - คุณช่วยอธิบายเพิ่มเติมอีกหน่อยได้ไหม? มันไม่ได้ขึ้นอยู่กับวิธีการหรือไม่ คุณหมายถึงโดยทั่วไปแล้วการลดความเอนเอียงจากการถดถอยเชิงเส้นที่เหมาะสมที่สุดของ RMSE จำเป็นต้องเพิ่ม RMSE หรือจะเป็นอย่างอื่นหรือไม่?
naught101
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.