การประเมินความแข็งแรงของความแข็งแรง?


11

ฉันกำลังใช้ตัวประมาณปกติสำหรับ kurtosisแต่ฉันสังเกตเห็นว่าแม้แต่ 'ค่าผิดปกติ' ในการแจกแจงเชิงประจักษ์ของฉัน เช่นยอดเขาเล็ก ๆ ห่างจากศูนย์กลางส่งผลกระทบอย่างมาก มีตัวประมาณค่าความโด่งซึ่งมีความทนทานกว่านี้หรือไม่?

K^=μ^4σ^4

คำตอบ:


8

มีหลายแบบด้วยกัน คุณจะพบการเปรียบเทียบที่ละเอียดถี่ถ้วนใน ลิงก์นี้ไปยังบทความที่ไม่ได้ปรับปรุง (อ้างอิงที่ด้านล่างของคำตอบนี้)

เนื่องจากข้อ จำกัด ของปัญหาการแยกส่วนของอัลกอริทึมเหล่านี้ (L / RMC) ที่แข็งแกร่งที่สุดคือ 12.5% ข้อได้เปรียบของ L / RMC ก็คือมันขึ้นอยู่กับปริมาณและยังคงตีความได้แม้ว่าการแจกแจงต้นแบบไม่มีเวลา ข้อดีอีกอย่างคือมันไม่ได้ถือว่าสมมาตรของการกระจายของส่วนที่ไม่มีการปนเปื้อนของข้อมูลในการวัดน้ำหนักหาง: อันที่จริงแล้วอัลกอริทึมส่งกลับตัวเลขสองตัว: RMC สำหรับน้ำหนักหางขวาและ LMC สำหรับน้ำหนักหางซ้าย

ความทนทานของเครื่องประมาณนั้นสามารถวัดได้จากจุดแตกหัก อย่างไรก็ตามความคิดของจุดแตกหักเป็นสิ่งที่ซับซ้อนในบริบทนี้ โดยสัญชาตญาณหมายความว่าฝ่ายตรงข้ามจะต้องควบคุมอย่างน้อย 12.5% ​​ของกลุ่มตัวอย่างของคุณเพื่อให้ตัวประมาณค่านี้ใช้ค่าตามอำเภอใจของน้ำหนักหางอยู่ในเสมอโดยการก่อสร้าง: ไม่มีการปนเปื้อนใด ๆ เช่นทำให้อัลกอริทึมกลับ -1! ในทางปฏิบัติเราพบว่าสามารถแทนที่ประมาณ 5% ของกลุ่มตัวอย่างด้วยค่าผิดปกติทางพยาธิสภาพโดยไม่ทำให้เกิดการประเมินผลกระทบมากที่สุด[0,1]

L / RMC ถูกนำไปใช้อย่างกว้างขวางเช่นกัน ตัวอย่างเช่นคุณสามารถหาการดำเนินการวิจัย ที่นี่ ดังที่อธิบายไว้ในบทความที่ลิงก์ด้านบนเพื่อคำนวณ L / RMC คุณจะต้องคำนวณ MC (ตัวประมาณที่นำมาใช้ในลิงค์) แยกจากกันทางด้านซ้ายและครึ่งขวาของข้อมูลของคุณ ที่นี่ (ซ้าย) ครึ่งขวาเป็นตัวอย่างย่อยที่เกิดขึ้นจากการสังเกต (เล็กกว่า) ใหญ่กว่าค่ามัธยฐานของตัวอย่างดั้งเดิมของคุณ

  • Brys, Hubert, Struyf (2006) มาตรการที่แข็งแกร่งของน้ำหนักหาง

2
นี่ไม่ใช่มาตรการทางเลือกของน้ำหนักหางแทนที่จะเป็นตัวประมาณความแข็งแรงของความโด่งต่อการพูด? นี่อาจเป็นสิ่งที่เขาต้องการจริงๆ แต่มันไม่ใช่สิ่งที่เขาขอ ตัวประมาณค่าใด ๆ / ทั้งหมดนี้รวมตัวกันเป็น kurtosis สำหรับตัวอย่างขนาดใหญ่หรือไม่?
andrewH

สรุปจากบทความ: จากข้อมูลที่ไม่มีการปนเปื้อนทำให้เงื่อนไขในการสั่งซื้อ Van Zwet นูน (ซึ่งหมายถึงความหมายของการวัดความโด่งของ kurtosis) พวกเขามาบรรจบกันเป็นฟังก์ชั่นโมโนโทนของ kurtosis
user603

1
เพอร์สันเพอร์สันวัดความผิดปกติ (หายากมาก) ธรรมดาและเรียบง่าย แล้วคุณกำลังมองหาอะไรอยู่ การวัด "ความแหลม"? ครั้งแรกนั่นไม่ได้เป็นสิ่งที่มาตรการเคิร์ดของเพียร์สัน ประการที่สองหากคุณต้องการวัด "ความแหลม" คุณต้องกำหนดความหมายก่อน หากคุณสามารถกำหนดได้คุณสามารถประมาณได้ ความเป็นไปได้ทางหนึ่งคืออนุพันธ์อันดับสองของ pdf ของข้อมูลที่ได้มาตรฐานซึ่งประเมินที่จุดสูงสุด (ยินดีต้อนรับ) ฉันแน่ใจว่ามีคนอื่น
Peter Westfall

1
ที่จริงฉันให้สามทฤษฎีบททางคณิตศาสตร์ที่เกี่ยวข้องกับ kurtosis ไปยังหางของการกระจายดังนั้นสิ่งเหล่านี้ไม่สามารถปลอม: (i) สำหรับการแจกแจงทั้งหมดที่มีช่วงเวลาที่สี่แน่นอน kurtosis อยู่ระหว่าง E (Z ^ 4 * I (| Z |> 1 )) และ E (Z ^ 4 * I (| Z |> 1)) +1 (ii) ในคลาสย่อยที่ความหนาแน่นของ Z ^ 2 ต่อเนื่องและลดลง (0,1) "+1" สามารถถูกแทนที่ด้วย "+.5" (iii) สำหรับลำดับของการแจกแจงที่มี kurtosis -> infinity, E (Z ^ 4 * I (| Z |> b)) / kurtosis -> 1, สำหรับ b ใด ๆ จริง ทุกอย่างอยู่ที่นี่: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.