ข้อผิดพลาดกำลังสองเฉลี่ยใช้เพื่อประเมินความเหนือกว่าของตัวประมาณหนึ่งตัวเทียบกับอีกตัวหนึ่งหรือไม่?


13

สมมติว่าเรามีสองประมาณและสำหรับพารามิเตอร์บางxในการพิจารณาว่าตัวประมาณใดที่ "ดีกว่า" เราจะดูที่ MSE (หมายถึงข้อผิดพลาดกำลังสอง) หรือไม่ กล่าวอีกนัยหนึ่งเรามองไปที่โดยที่คืออคติของตัวประมาณและคือความแปรปรวนของตัวประมาณ MSE ที่ดีกว่าใดจะเป็นตัวประมาณที่แย่กว่านั้น?α 2 x M S E = β 2 + σ 2 β σ 2α1α2x

MSE=β2+σ2
βσ2

คำตอบ:


10

หากคุณมีตัวประมาณสองตัวและไม่ว่าบอกคุณว่านั้น ตัวประมาณที่ดีกว่านั้นขึ้นอยู่กับนิยามของคำว่า "ดีที่สุด" ทั้งหมด ตัวอย่างเช่นหากคุณกำลังเปรียบเทียบตัวประมาณที่ไม่เอนเอียงและโดย "ดีกว่า" คุณหมายถึงมีความแปรปรวนต่ำกว่าใช่นั่นจะหมายความว่าดีกว่า เป็นเกณฑ์ที่ได้รับความนิยมเนื่องจากมีการเชื่อมต่อกับกำลังสองน้อยที่สุดและความน่าจะเป็นในการบันทึกแบบเกาส์ แต่เช่นเดียวกับเกณฑ์ทางสถิติหลาย ๆ ข้อควรระมัดระวังไม่ให้ใช้ θ 2MSE( θ 1)<MSE( θ 2) θ 1 θ 1MSEMSEθ^1θ^2

MSE(θ^1)<MSE(θ^2)
θ^1θ^1MSEMSE สุ่มสี่สุ่มห้าเป็นตัวชี้วัดคุณภาพตัวประมาณโดยไม่ต้องใส่ใจกับแอปพลิเคชัน

มีบางสถานการณ์ที่การเลือกตัวประมาณค่าเพื่อลดค่าอาจไม่เหมาะสมอย่างยิ่งที่ต้องทำ สองสถานการณ์ที่นึกถึง:MSE

  • หากมีค่าผิดปกติจำนวนมากในชุดข้อมูลจะมีผลกระทบต่อ MSE อย่างมากดังนั้นตัวประมาณที่ลด MSE จะได้รับผลกระทบจากค่าผิดปกติดังกล่าว ในสถานการณ์เช่นนี้ความจริงที่ว่าตัวประมาณจะย่อขนาด MSE ไม่ได้บอกอะไรคุณมากนักหากคุณลบค่าผิดปกติคุณจะได้ค่าประมาณต่างกัน ในแง่นี้ MSE นั้นไม่ "แข็งแกร่ง" สำหรับค่าผิดปกติ ในบริบทของการถดถอยความจริงข้อนี้เป็นสิ่งที่กระตุ้นให้ Huber M-Estimator (ที่ฉันพูดถึงในคำตอบนี้) ซึ่งลดฟังก์ชั่นเกณฑ์ที่แตกต่างกัน (นั่นคือส่วนผสมระหว่างข้อผิดพลาดกำลังสองและข้อผิดพลาดสัมบูรณ์) .

  • หากคุณกำลังประเมินพารามิเตอร์ที่มีขอบเขตการเปรียบเทียบอาจไม่เหมาะสมเนื่องจากจะมีการลงโทษมากกว่าและการเข้าใจที่แตกต่างกันในกรณีนั้น ตัวอย่างเช่นสมมติว่าคุณกำลังประเมินความแปรปรวนσ 2 แล้วถ้าคุณมีสติประมาทปริมาณของคุณเอ็มเอสอีได้มากที่สุดσ 4ในขณะที่การประเมินค่าสูงสามารถผลิตM S Eที่ไกลเกินกว่าσ 4บางทีอาจจะตามจำนวนเงินที่มากมายMSEσ2MSEσ4MSEσ4

เพื่อให้ข้อเสียเปรียบเหล่านี้ชัดเจนยิ่งขึ้นฉันจะยกตัวอย่างที่ชัดเจนว่าเมื่อใดเนื่องจากปัญหาเหล่านี้อาจไม่สามารถวัดคุณภาพการประมาณค่าที่เหมาะสมได้MSE

สมมติว่าคุณมีตัวอย่างจากเสื้อกับการกระจายν > 2องศาอิสระและเรากำลังพยายามที่จะประเมินความแปรปรวนซึ่งเป็นν / ( ν - 2 ) พิจารณาสองประมาณแข่งขัน: θ 1 : ทีเอชอียูn ฉันs อีd s พีลิตรอีวีR ฉันX1,...,Xntν>2ν/(ν2)และ θ 2 = 0 , R อีกรัมR d ลิตรอีs s o ทีเอชอีd เสื้อชัดเจน M S E ( θ 2 ) = ν 2

θ^1:the unbiased sample variance
θ^2=0, regardless of the data
และมันก็เป็นความจริงที่ว่าเอ็มเอสอี( θ 1)={ถ้า  ν 4 ν 2MSE(θ^2)=ν2(ν2)2ซึ่งสามารถนำมาใช้จริงที่กล่าวถึงในหัวข้อนี้และคุณสมบัติของเสื้อ-distribution ดังนั้นตัวประมาณที่ไร้เดียงสาจึงมีประสิทธิภาพสูงกว่าในแง่ของMSEโดยไม่คำนึงถึงขนาดตัวอย่างเมื่อใดก็ตามที่ν<4ซึ่งค่อนข้างน่าอึดอัดใจ นอกจากนี้ยังมีประสิทธิภาพสูงกว่าเมื่อ(2
MSE(θ^1)={if ν4ν2(ν2)2(2n1+6n(ν4))if ν>4.
tMSEν<4แต่นี่จะเกี่ยวข้องกับตัวอย่างขนาดเล็กมากเท่านั้น ดังกล่าวข้างต้นที่เกิดขึ้นเพราะธรรมชาตินกยาวของเสื้อกับการกระจายองศาขนาดเล็กของเสรีภาพซึ่งทำให้ θ 2มีแนวโน้มที่จะเป็นค่าที่มีขนาดใหญ่มากและMSEลงโทษอย่างหนักสำหรับการประเมินค่าสูงในขณะที่ θ 1ไม่ได้มีปัญหานี้(2n1+6n(ν4))>1tθ^2MSEθ^1

MSEMSEθ^

S(θ^)=θ^ν/(ν2)1log(θ^ν/(ν2))

S(θ^1)=


(+1) การสนทนาที่ดี เพื่อความเป็นธรรมมันอาจจะชี้ให้เห็นว่าข้อโต้แย้งที่คล้ายกันสามารถทำและต่อต้านเกณฑ์อื่น ๆ (ฟังก์ชั่นการสูญเสียอื่น ๆ ) เช่นกัน
MånsT

2
โดยทั่วไปคนหนึ่งประเมินตัวประมาณโดยดูที่ฟังก์ชันความเสี่ยงซึ่งวางแผนการสูญเสียที่คาดหวังกับพารามิเตอร์ ที่นี่โดยการแก้ไขพารามิเตอร์คุณอาจสร้างการวิเคราะห์ที่ทำให้เข้าใจผิด หลังจากที่ทุกคนก็มักจะเป็นกรณีที่โง่ (คงไม่รู้ข้อมูล) ประมาณการสามารถผลิตการสูญเสียมากคาดว่าต่ำ: เพียงแค่ตั้งค่าเท่ากับพารามิเตอร์ที่ถูกต้อง! นี่ทำให้ฉันสงสัยว่าการจำลองแสดงให้เห็นอะไรที่นี่จริงๆ
whuber

@ โฮเบอร์ฉันได้แก้ไขคำตอบนี้เพื่อให้ตัวอย่างวิเคราะห์ซึ่งอาจทำให้ชัดเจนขึ้น ฉันยังเสนอฟังก์ชันการสูญเสียทางเลือกที่อาจเหมาะสมกว่า
แมโคร

ν


2

(x)=x2

(x)=|x|

MSE น่าจะเป็นทางเลือกที่ดีถ้ามีการแจกแจงข้อผิดพลาดตามปกติ หากพวกมันมีหางที่อ้วนขึ้นตัวเลือกที่แข็งแกร่งกว่าเช่นค่าสัมบูรณ์จะดีกว่า


0

ในการอนุมานเชิงสถิติของ Case & Berger รุ่นที่ 2 หน้า 332 ระบุว่า MSE ลงโทษอย่างเท่าเทียมกันสำหรับการประเมินค่าสูงและประเมินค่าต่ำไป ในกรณีของสเกลอย่างไรก็ตาม 0 เป็นขอบเขตล่างตามธรรมชาติดังนั้นปัญหาการประมาณค่าจึงไม่สมมาตร การใช้ MSE ในกรณีนี้มีแนวโน้มที่จะให้อภัยการประเมินค่าต่ำไป

คุณอาจต้องการตรวจสอบตัวประมาณค่าที่เป็นไปตามคุณสมบัติของ UMVUE ซึ่งหมายถึงการใช้ขอบเขต Cramer-Rao Lower หน้า 341

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.