ผมคิดว่าค่ามัธยฐานเฉลี่ย
เป็นกรณีนี้หรือไม่?
ผมคิดว่าค่ามัธยฐานเฉลี่ย
เป็นกรณีนี้หรือไม่?
คำตอบ:
มันเป็นคำถามที่ไม่เกี่ยวกับเรื่องไร้สาระ (แน่นอนว่าไม่ใช่เรื่องไม่สำคัญเท่ากับคนที่ถามคำถามดูเหมือนจะคิด)
ความยากลำบากนั้นเกิดจากความจริงที่ว่าเราไม่รู้จริง ๆ ว่าเราหมายถึงอะไรโดย 'ความเบ้' - หลายครั้งที่มันชัดเจน แต่บางครั้งมันก็ไม่ได้ เมื่อพิจารณาถึงความยากลำบากในการปักหมุดสิ่งที่เราหมายถึงโดย 'ตำแหน่ง' และ 'การแพร่กระจาย' ในกรณีที่ไม่สำคัญ (ตัวอย่างเช่นค่าเฉลี่ยไม่ได้เป็นอย่างที่เราหมายถึงเสมอเมื่อเราพูดถึงตำแหน่ง) มันไม่น่าแปลกใจเลยว่า แนวคิดเช่นความเบ้อย่างน้อยก็ลื่น ดังนั้นสิ่งนี้ทำให้เราลองใช้คำนิยามเกี่ยวกับพีชคณิตต่าง ๆ ของสิ่งที่เราหมายถึงและพวกเขาไม่เห็นด้วยกัน
1) ถ้าคุณวัดความเบ้โดยสัมประสิทธิ์ความเบ้ของเพียร์สันที่สองค่าเฉลี่ย ( ) จะน้อยกว่าค่ามัธยฐาน ( - นั่นคือในกรณีนี้คุณย้อนกลับไป)∼ μ
(ประชากร) ที่สองเพียร์สันเบ้คือและจะเป็นค่าลบ ("ซ้ายเอียง") เมื่อหมู่}μ < ∼ μ
ตัวอย่างเวอร์ชันของสถิติเหล่านี้ทำงานในทำนองเดียวกัน
เหตุผลสำหรับความสัมพันธ์ที่จำเป็นระหว่างค่าเฉลี่ยและค่ามัธยฐานในกรณีนี้คือเพราะนั่นคือวิธีที่กำหนดความเบ้
นี่คือความหนาแน่นแบบเบ้ซ้าย (โดยทั้งการวัดแบบเพียร์สันที่สองและการวัดทั่วไปใน (2) ด้านล่าง):
ค่ามัธยฐานถูกทำเครื่องหมายในระยะขอบล่างเป็นสีเขียวค่าเฉลี่ยเป็นสีแดง
ดังนั้นฉันคาดหวังคำตอบที่พวกเขาต้องการให้คุณคือค่าเฉลี่ยนั้นน้อยกว่าค่ามัธยฐาน มักจะเป็นกรณีที่มีการแจกแจงแบบต่าง ๆ ที่เรามักจะให้ชื่อ
(แต่อ่านต่อไปและดูว่าทำไมมันถึงไม่ถูกต้องเหมือนคำแถลงทั่วไป)
2) หากคุณวัดค่าโดยช่วงเวลามาตรฐานที่สามที่เป็นมาตรฐานมากขึ้นก็มักจะเป็น แต่ก็ไม่เสมอไปในกรณีที่ค่าเฉลี่ยจะน้อยกว่าค่ามัธยฐาน
นั่นคือมันเป็นไปได้ที่จะสร้างตัวอย่างที่ตรงข้ามเป็นจริงหรือที่วัดความเบ้หนึ่งเป็นศูนย์ในขณะที่อื่น ๆ ที่ไม่ใช่ศูนย์
ซึ่งก็คือการพูดว่าไม่มีความสัมพันธ์ที่จำเป็นระหว่างตำแหน่งของค่าเฉลี่ยมัธยฐานและโมเมนต์ความเบ้
ตัวอย่างเช่นพิจารณาตัวอย่างต่อไปนี้ (ตัวอย่างเดียวกันสามารถสร้างเป็นการกระจายความน่าจะเป็นแบบแยก):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
ทว่าค่าสัมประสิทธิ์ความเบ้ (ฟิชเชอร์ช่วงเวลาที่สาม) เป็นค่าลบ (นั่นคือจากแสงเรามีข้อมูลเอียงซ้าย) เนื่องจากผลรวมของลูกบาศก์ของส่วนเบี่ยงเบนจากค่าเฉลี่ยนั้นเป็นค่าลบ
ดังนั้นในกรณีนี้ให้เอียงซ้าย แต่หมายถึงค่ามัธยฐาน
(ในทางกลับกันถ้าคุณเปลี่ยน 2.7 ในตัวอย่างด้านบนเป็น 3 คุณจะมีตัวอย่างที่ช่วงเวลาความเบ้เป็นศูนย์ แต่ค่าเฉลี่ยสูงกว่าค่ามัธยฐานถ้าคุณทำ 3.3 ค่าความเบ้นั้นเป็นค่าบวก และค่าเฉลี่ยสูงกว่าค่ามัธยฐาน - กล่าวคือในที่สุดก็อยู่ในทิศทาง 'คาดการณ์')
หากคุณใช้เพียร์สันเบ้แรกแทนที่จะเป็นคำจำกัดความข้างต้นคุณมีปัญหาคล้ายกันกับกรณีนี้ - ทิศทางของความเบ้ไม่ได้ระบุความสัมพันธ์ระหว่างค่าเฉลี่ยและค่ามัธยฐานโดยทั่วไป
แก้ไข: เพื่อตอบคำถามในความคิดเห็น - ตัวอย่างที่ค่าเฉลี่ยและค่ามัธยฐานเท่ากัน แต่โมเมนต์ความเบ้เป็นลบ พิจารณาข้อมูลต่อไปนี้ (เหมือนก่อนหน้านี้มันยังนับเป็นตัวอย่างสำหรับประชากรที่ไม่ต่อเนื่องพิจารณาการเขียนตัวเลขบนใบหน้าของผู้ตาย)
1 5 6 6 8 10
ค่าเฉลี่ยและค่ามัธยฐานเป็นทั้ง 6 แต่ผลรวมของลูกบาศก์ส่วนเบี่ยงเบนจากค่าเฉลี่ยนั้นเป็นค่าลบดังนั้นช่วงเวลาที่สามที่ความเบ้เป็นลบ
เลขซ้ายเบ้ข้อมูลที่มีหางยาวด้านซ้าย (ต่ำสุด) เพื่อให้ค่าเฉลี่ยจะมักจะน้อยกว่าค่ามัธยฐาน (แต่ดูข้อยกเว้นของ @Glen_b สำหรับข้อยกเว้น) ฉันคิดว่าข้อมูลที่ "ดู" ซ้ายเอียงจะมีค่าเฉลี่ยน้อยกว่าค่าเฉลี่ย
ข้อมูลที่เอียงขวานั้นเป็นเรื่องปกติมากขึ้น เช่นรายได้ มีค่าเฉลี่ยมากกว่ามัธยฐาน
รหัส R
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001