ในข้อมูลเบ้ซ้ายความสัมพันธ์ระหว่างค่าเฉลี่ยและค่ามัธยฐานคืออะไร


12

ผมคิดว่าค่ามัธยฐานเฉลี่ย

เป็นกรณีนี้หรือไม่?


2
หลักสูตร MOOC แบบใดที่เปิดอยู่ สื่อการเรียนการสอนแนะนำให้ตอบอย่างไร?
Glen_b -Reinstate Monica

1
class.stanford.edu/courses/Medicine/HRP258/… . จบหลักสูตรไปแล้ว
Kunjan Kshetri

1
ขอบคุณนั่นเป็นบริบทอย่างน้อยแม้ว่าทั้งหมดที่เหลืออยู่จะมีการอ่านรายสัปดาห์ซึ่งไม่ได้ทำให้เกิดความเข้าใจอย่างถ่องแท้ในเรื่องนี้ ฉันสงสัยในสิ่งที่หลักสูตรพูดในหัวข้อ
Glen_b -Reinstate Monica

คำตอบ:


16

มันเป็นคำถามที่ไม่เกี่ยวกับเรื่องไร้สาระ (แน่นอนว่าไม่ใช่เรื่องไม่สำคัญเท่ากับคนที่ถามคำถามดูเหมือนจะคิด)

ความยากลำบากนั้นเกิดจากความจริงที่ว่าเราไม่รู้จริง ๆ ว่าเราหมายถึงอะไรโดย 'ความเบ้' - หลายครั้งที่มันชัดเจน แต่บางครั้งมันก็ไม่ได้ เมื่อพิจารณาถึงความยากลำบากในการปักหมุดสิ่งที่เราหมายถึงโดย 'ตำแหน่ง' และ 'การแพร่กระจาย' ในกรณีที่ไม่สำคัญ (ตัวอย่างเช่นค่าเฉลี่ยไม่ได้เป็นอย่างที่เราหมายถึงเสมอเมื่อเราพูดถึงตำแหน่ง) มันไม่น่าแปลกใจเลยว่า แนวคิดเช่นความเบ้อย่างน้อยก็ลื่น ดังนั้นสิ่งนี้ทำให้เราลองใช้คำนิยามเกี่ยวกับพีชคณิตต่าง ๆ ของสิ่งที่เราหมายถึงและพวกเขาไม่เห็นด้วยกัน

1) ถ้าคุณวัดความเบ้โดยสัมประสิทธิ์ความเบ้ของเพียร์สันที่สองค่าเฉลี่ย ( ) จะน้อยกว่าค่ามัธยฐาน ( - นั่นคือในกรณีนี้คุณย้อนกลับไป)μμμ

(ประชากร) ที่สองเพียร์สันเบ้คือและจะเป็นค่าลบ ("ซ้ายเอียง") เมื่อหมู่}μ < μ

3(μμ)σ,
μ<μ

ตัวอย่างเวอร์ชันของสถิติเหล่านี้ทำงานในทำนองเดียวกัน

เหตุผลสำหรับความสัมพันธ์ที่จำเป็นระหว่างค่าเฉลี่ยและค่ามัธยฐานในกรณีนี้คือเพราะนั่นคือวิธีที่กำหนดความเบ้

นี่คือความหนาแน่นแบบเบ้ซ้าย (โดยทั้งการวัดแบบเพียร์สันที่สองและการวัดทั่วไปใน (2) ด้านล่าง):

ป้อนคำอธิบายรูปภาพที่นี่

ค่ามัธยฐานถูกทำเครื่องหมายในระยะขอบล่างเป็นสีเขียวค่าเฉลี่ยเป็นสีแดง

ดังนั้นฉันคาดหวังคำตอบที่พวกเขาต้องการให้คุณคือค่าเฉลี่ยนั้นน้อยกว่าค่ามัธยฐาน มักจะเป็นกรณีที่มีการแจกแจงแบบต่าง ๆ ที่เรามักจะให้ชื่อ

(แต่อ่านต่อไปและดูว่าทำไมมันถึงไม่ถูกต้องเหมือนคำแถลงทั่วไป)


2) หากคุณวัดค่าโดยช่วงเวลามาตรฐานที่สามที่เป็นมาตรฐานมากขึ้นก็มักจะเป็น แต่ก็ไม่เสมอไปในกรณีที่ค่าเฉลี่ยจะน้อยกว่าค่ามัธยฐาน

นั่นคือมันเป็นไปได้ที่จะสร้างตัวอย่างที่ตรงข้ามเป็นจริงหรือที่วัดความเบ้หนึ่งเป็นศูนย์ในขณะที่อื่น ๆ ที่ไม่ใช่ศูนย์

ซึ่งก็คือการพูดว่าไม่มีความสัมพันธ์ที่จำเป็นระหว่างตำแหน่งของค่าเฉลี่ยมัธยฐานและโมเมนต์ความเบ้

ตัวอย่างเช่นพิจารณาตัวอย่างต่อไปนี้ (ตัวอย่างเดียวกันสามารถสร้างเป็นการกระจายความน่าจะเป็นแบบแยก):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

ทว่าค่าสัมประสิทธิ์ความเบ้ (ฟิชเชอร์ช่วงเวลาที่สาม) เป็นค่าลบ (นั่นคือจากแสงเรามีข้อมูลเอียงซ้าย) เนื่องจากผลรวมของลูกบาศก์ของส่วนเบี่ยงเบนจากค่าเฉลี่ยนั้นเป็นค่าลบ

ดังนั้นในกรณีนี้ให้เอียงซ้าย แต่หมายถึงค่ามัธยฐาน

(ในทางกลับกันถ้าคุณเปลี่ยน 2.7 ในตัวอย่างด้านบนเป็น 3 คุณจะมีตัวอย่างที่ช่วงเวลาความเบ้เป็นศูนย์ แต่ค่าเฉลี่ยสูงกว่าค่ามัธยฐานถ้าคุณทำ 3.3 ค่าความเบ้นั้นเป็นค่าบวก และค่าเฉลี่ยสูงกว่าค่ามัธยฐาน - กล่าวคือในที่สุดก็อยู่ในทิศทาง 'คาดการณ์')

หากคุณใช้เพียร์สันเบ้แรกแทนที่จะเป็นคำจำกัดความข้างต้นคุณมีปัญหาคล้ายกันกับกรณีนี้ - ทิศทางของความเบ้ไม่ได้ระบุความสัมพันธ์ระหว่างค่าเฉลี่ยและค่ามัธยฐานโดยทั่วไป


แก้ไข: เพื่อตอบคำถามในความคิดเห็น - ตัวอย่างที่ค่าเฉลี่ยและค่ามัธยฐานเท่ากัน แต่โมเมนต์ความเบ้เป็นลบ พิจารณาข้อมูลต่อไปนี้ (เหมือนก่อนหน้านี้มันยังนับเป็นตัวอย่างสำหรับประชากรที่ไม่ต่อเนื่องพิจารณาการเขียนตัวเลขบนใบหน้าของผู้ตาย)

 1  5  6  6  8 10

ค่าเฉลี่ยและค่ามัธยฐานเป็นทั้ง 6 แต่ผลรวมของลูกบาศก์ส่วนเบี่ยงเบนจากค่าเฉลี่ยนั้นเป็นค่าลบดังนั้นช่วงเวลาที่สามที่ความเบ้เป็นลบ


1
@ ปีเตอร์ขออภัยสำหรับการตอบกลับช้าฉันไม่ว่างกำลังสร้างเพียงตัวอย่างเช่นและไม่เห็นคำถามของคุณ
Glen_b -Reinstate Monica

2
ฉันเคยเห็นคำจำกัดความของหนังสือเรียนจำนวนมากและไม่มีใครพูดถึงเรื่องนี้ เย็น.
Peter Flom - Reinstate Monica

6
@Peter แต่น่าเสียดายที่หนังสือเรียนระดับประถมจำนวนมากทำซ้ำข้อมูลที่ไม่ถูกต้องจากตำราเรียนอื่น ๆ โดยไม่ต้องทำการตรวจสอบจริง ๆ ด้วยตนเองดังนั้นความเข้าใจผิดขั้นพื้นฐานจึงแพร่กระจายไป อย่างที่คุณเห็นมันค่อนข้างง่ายต่อการสร้าง (ฉันแค่สร้างมันด้วยมือตามที่ต้องการ) Kendall and Stuart ( ทฤษฎีทางสถิติขั้นสูง, Vol I - อย่าปล่อยให้ชื่อออกจากคุณมันค่อนข้างอ่านได้) อย่างน้อยรุ่นที่สามและสี่มีข้อมูลที่ดี รุ่นล่าสุดเพิ่มเติมโดย Stuart และ Ord ฉันโพสต์เกี่ยวกับปัญหานี้ใน CV หลายครั้งจริง ๆ
Glen_b -Reinstate Monica

4
Binomialsและแสดงว่าหมายความว่ามัธยฐานสอดคล้องกันอย่างสมบูรณ์แบบด้วยความไม่สมมาตร ประเด็นเกี่ยวกับตัวอย่างนี้คือไม่มีใครสามารถโน้มน้าวให้มันเป็นสิ่งคลุมเครือหรือพยาธิสภาพ (5k)0.8k0.25k(5k)0.2k0.85k=
Nick Cox

1
@Nick ใช่ชื่อทวินามที่มีจำนวนเต็มเป็นตัวอย่างที่ดี
Glen_b -Reinstate Monica

5

เลขซ้ายเบ้ข้อมูลที่มีหางยาวด้านซ้าย (ต่ำสุด) เพื่อให้ค่าเฉลี่ยจะมักจะน้อยกว่าค่ามัธยฐาน (แต่ดูข้อยกเว้นของ @Glen_b สำหรับข้อยกเว้น) ฉันคิดว่าข้อมูลที่ "ดู" ซ้ายเอียงจะมีค่าเฉลี่ยน้อยกว่าค่าเฉลี่ย

ข้อมูลที่เอียงขวานั้นเป็นเรื่องปกติมากขึ้น เช่นรายได้ มีค่าเฉลี่ยมากกว่ามัธยฐาน

รหัส R

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001

ค่าเฉลี่ยสามารถเท่ากับมัธยฐานได้หรือไม่?
Kunjan Kshetri

unj2 ฉันเพิ่มตัวอย่างในคำตอบของฉันโดยที่ความเบ้ในช่วงเวลาที่สามเป็นค่าลบ แต่ค่าเฉลี่ย = มัธยฐาน
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.