หากคุณมีตัวประมาณสองตัวและไม่ว่าบอกคุณว่านั้น ตัวประมาณที่ดีกว่านั้นขึ้นอยู่กับนิยามของคำว่า "ดีที่สุด" ทั้งหมด ตัวอย่างเช่นหากคุณกำลังเปรียบเทียบตัวประมาณที่ไม่เอนเอียงและโดย "ดีกว่า" คุณหมายถึงมีความแปรปรวนต่ำกว่าใช่นั่นจะหมายความว่าดีกว่า เป็นเกณฑ์ที่ได้รับความนิยมเนื่องจากมีการเชื่อมต่อกับกำลังสองน้อยที่สุดและความน่าจะเป็นในการบันทึกแบบเกาส์ แต่เช่นเดียวกับเกณฑ์ทางสถิติหลาย ๆ ข้อควรระมัดระวังไม่ให้ใช้ θ 2MSE( θ 1)<MSE( θ 2) θ 1 θ 1MSEMSEθ^1θ^2
M S E ( θ^1) < M S E ( θ^2)
θ^1θ^1M S EM S E สุ่มสี่สุ่มห้าเป็นตัวชี้วัดคุณภาพตัวประมาณโดยไม่ต้องใส่ใจกับแอปพลิเคชัน
มีบางสถานการณ์ที่การเลือกตัวประมาณค่าเพื่อลดค่าอาจไม่เหมาะสมอย่างยิ่งที่ต้องทำ สองสถานการณ์ที่นึกถึง:M S E
หากมีค่าผิดปกติจำนวนมากในชุดข้อมูลจะมีผลกระทบต่อ MSE อย่างมากดังนั้นตัวประมาณที่ลด MSE จะได้รับผลกระทบจากค่าผิดปกติดังกล่าว ในสถานการณ์เช่นนี้ความจริงที่ว่าตัวประมาณจะย่อขนาด MSE ไม่ได้บอกอะไรคุณมากนักหากคุณลบค่าผิดปกติคุณจะได้ค่าประมาณต่างกัน ในแง่นี้ MSE นั้นไม่ "แข็งแกร่ง" สำหรับค่าผิดปกติ ในบริบทของการถดถอยความจริงข้อนี้เป็นสิ่งที่กระตุ้นให้ Huber M-Estimator (ที่ฉันพูดถึงในคำตอบนี้) ซึ่งลดฟังก์ชั่นเกณฑ์ที่แตกต่างกัน (นั่นคือส่วนผสมระหว่างข้อผิดพลาดกำลังสองและข้อผิดพลาดสัมบูรณ์) .
หากคุณกำลังประเมินพารามิเตอร์ที่มีขอบเขตการเปรียบเทียบอาจไม่เหมาะสมเนื่องจากจะมีการลงโทษมากกว่าและการเข้าใจที่แตกต่างกันในกรณีนั้น ตัวอย่างเช่นสมมติว่าคุณกำลังประเมินความแปรปรวนσ 2 แล้วถ้าคุณมีสติประมาทปริมาณของคุณเอ็มเอสอีได้มากที่สุดσ 4ในขณะที่การประเมินค่าสูงสามารถผลิตM S Eที่ไกลเกินกว่าσ 4บางทีอาจจะตามจำนวนเงินที่มากมายM S Eσ2M S Eσ4M S Eσ4
เพื่อให้ข้อเสียเปรียบเหล่านี้ชัดเจนยิ่งขึ้นฉันจะยกตัวอย่างที่ชัดเจนว่าเมื่อใดเนื่องจากปัญหาเหล่านี้อาจไม่สามารถวัดคุณภาพการประมาณค่าที่เหมาะสมได้M S E
สมมติว่าคุณมีตัวอย่างจากเสื้อกับการกระจายν > 2องศาอิสระและเรากำลังพยายามที่จะประเมินความแปรปรวนซึ่งเป็นν / ( ν - 2 ) พิจารณาสองประมาณแข่งขัน: θ 1 : ทีเอชอียูn ขฉันs อีd s มพีลิตรอีวีR ฉันX1, . . . , Xnเสื้อν> 2ν/ (ν- 2 )และ θ 2 = 0 , R อีกรัมR d ลิตรอีs s o ฉทีเอชอีd เสื้อชัดเจน M S E ( θ 2 ) = ν 2
θ^1: t h e u n b i a s e d s a m p l e v a r ฉันa n c e
θ^2= 0 , R อีกรัมR d ลิตรอีs s o ฉ t h e d a t a
และมันก็เป็นความจริงที่ว่า
เอ็มเอสอี( θ 1)={ ∞ ถ้า ν ≤ 4 ν 2M S E ( θ^2) = ν2( ν- 2 )2ซึ่งสามารถนำมาใช้
จริงที่กล่าวถึงในหัวข้อนี้และ
คุณสมบัติของเสื้อ-distribution
ดังนั้นตัวประมาณที่ไร้เดียงสาจึงมีประสิทธิภาพสูงกว่าในแง่ของMSEโดยไม่คำนึงถึงขนาดตัวอย่างเมื่อใดก็ตามที่ν<4ซึ่งค่อนข้างน่าอึดอัดใจ นอกจากนี้ยังมีประสิทธิภาพสูงกว่าเมื่อ
(2M S E ( θ^1) = { ∞ν2(ν- 2)2( 2)n - 1+ 6n ( ν- 4 ))ถ้า ν≤ 4ถ้า ν> 4 .
เสื้อM S Eν< 4แต่นี่จะเกี่ยวข้องกับตัวอย่างขนาดเล็กมากเท่านั้น ดังกล่าวข้างต้นที่เกิดขึ้นเพราะธรรมชาตินกยาวของ
เสื้อกับการกระจายองศาขนาดเล็กของเสรีภาพซึ่งทำให้
θ 2มีแนวโน้มที่จะเป็นค่าที่มีขนาดใหญ่มากและ
MSEลงโทษอย่างหนักสำหรับการประเมินค่าสูงในขณะที่
θ 1ไม่ได้มีปัญหานี้
( 2)n - 1+ 6n ( ν- 4 )) >1เสื้อθ^2M S Eθ^1
M S EM S Eθ^
S( θ^) = θ^ν/ (ν- 2 )- 1 - บันทึก( θ^ν/ (ν- 2 ))
S( θ^1) = ∞