ความเบ้เป็นสิ่งที่ไม่ดีเมื่อไหร่ การแจกแจงแบบสมมาตร (โดยทั่วไป แต่ไม่เสมอไป: เช่นไม่ใช่สำหรับการแจกแจงโคชี) มีค่ามัธยฐานโหมดและค่าเฉลี่ยใกล้กันมาก ดังนั้นให้พิจารณาถ้าเราต้องการวัดที่ตั้งของประชากรมันมีประโยชน์ที่จะมีค่ามัธยฐานโหมดและค่าเฉลี่ยใกล้กัน
ตัวอย่างเช่นหากเราหาลอการิทึมของการกระจายรายได้เราจะลดความเบ้ที่มากพอที่เราจะได้แบบจำลองที่มีประโยชน์ของที่ตั้งของรายได้ อย่างไรก็ตามเราจะมีหางขวาที่หนักกว่าที่เราต้องการจริงๆ เพื่อลดความว่าต่อไปเราอาจจะใช้การกระจาย Pareto การกระจาย Pareto คล้ายกับการเปลี่ยนแปลงบันทึกข้อมูล ตอนนี้การแจกแจงแบบพาเรโตและล็อก - ปกติมีความยากในระดับต่ำสุดของระดับรายได้ ตัวอย่างเช่นทั้งสองประสบLN0 = - ∞. การรักษาของปัญหานี้จะครอบคลุมในการแปลงพลังงาน
ตัวอย่างจากรายได้ 25 ดอลล่าร์สหรัฐที่คัดแยกมาจาก www
k$ lnk$
28 3.33220451
29 3.36729583
35 3.555348061
42 3.737669618
42 3.737669618
44 3.784189634
50 3.912023005
52 3.951243719
54 3.988984047
56 4.025351691
59 4.077537444
78 4.356708827
84 4.430816799
90 4.49980967
95 4.553876892
101 4.615120517
108 4.682131227
116 4.753590191
121 4.795790546
122 4.804021045
133 4.890349128
150 5.010635294
158 5.062595033
167 5.117993812
235 5.459585514
ความเบ้ของคอลัมน์แรกคือ 0.99 และคอลัมน์ที่สองคือ -0.05 คอลัมน์แรกไม่น่าจะเป็นเรื่องปกติ (Shapiro-Wilk p = 0.04) และคอลัมน์ที่สองไม่ได้เป็นเรื่องปกติ (p = 0.57)
First column Mean 90.0 (95% CI, 68.6 to 111.3) Median 84.0 (95.7% CI, 52.0 to 116.0)
Second col Exp(Mean) 76.7 (95% CI, 60.2 to 97.7) Exp(Median) 84.0 (95.7% CI, 52.0 to 116.0)
ดังนั้นคำถามคือถ้าคุณเป็นคนสุ่มที่มีรายได้อยู่ในรายการคุณมีแนวโน้มที่จะได้รับอะไร สรุปได้ไหมว่าคุณจะได้รับ 90k หรือมากกว่ามัธยฐานของ 84k หรือมีแนวโน้มที่จะสรุปว่าแม้ค่ามัธยฐานจะมีอคติเป็นตัวชี้วัดที่ตั้งและประสบการณ์[ Mean ln( k $ ) ] 76.7 k ซึ่งน้อยกว่าค่ามัธยฐานก็มีความสมเหตุสมผลมากกว่าในการประมาณ?
เห็นได้ชัดว่าบันทึกปกติที่นี่เป็นแบบจำลองที่ดีกว่าและค่าลอการิทึมเฉลี่ยทำให้เราสามารถวัดตำแหน่งที่ตั้งได้ดีขึ้น ว่านี่เป็นที่รู้จักกันดีถ้าไม่เข้าใจทั้งหมดจะถูกแสดงโดยวลี "ฉันคาดหวังว่าจะได้รับเงินเดือน 5 รูป"