เหตุใดอายุมัธยฐานจึงเป็นสถิติที่ดีกว่าอายุเฉลี่ย


41

ข้อความแสดงแทน

ข้อความแสดงแทน

เห็นได้ชัดว่าค่าเฉลี่ยอยู่ในสถิติของการเลือกเมื่อมันมาถึงวัย

ฉันไม่สามารถอธิบายให้ตัวเองได้ว่าทำไมค่าเฉลี่ยเลขคณิตจึงเป็นสถิติที่แย่กว่านั้น ทำไมถึงเป็นเช่นนั้น?

โพสต์ครั้งแรกที่นี่เพราะฉันไม่รู้ว่ามีเว็บไซต์นี้อยู่


4
ดูเหมือนว่าคุณมีคำตอบที่สมเหตุสมผลแล้วในเว็บไซต์อื่น?
เชน

1
@Shane: แต่บางทีเว็บไซต์ที่แตกต่างกันมีศักยภาพที่จะรวบรวมคำตอบที่แตกต่างจากมุมมองที่แตกต่างกันใช่ไหม
whuber

คำตอบ:


42

สถิติไม่ได้ให้คำตอบที่ดีสำหรับคำถามนี้ในความคิดของฉัน ค่าเฉลี่ยอาจมีความเกี่ยวข้องในการศึกษาเรื่องการตายเช่นวัย แต่ไม่ใช่เรื่องง่ายที่จะวัดอย่างที่คุณคิด ผู้สูงอายุคนที่ไม่รู้หนังสือและผู้คนในบางประเทศโลกที่สามมีแนวโน้มที่จะเพิ่มอายุของพวกเขาเป็นทวีคูณของ 5 หรือ 10

ค่ามัธยฐานสามารถทนต่อข้อผิดพลาดดังกล่าวได้มากกว่าค่าเฉลี่ย ยิ่งไปกว่านั้นค่ามัธยฐานของอายุโดยทั่วไปคือ 20 - 40 แต่ผู้คนสามารถมีชีวิตอยู่ได้ถึง 100 และมากกว่า (สัดส่วนที่เพิ่มขึ้นและชัดเจนของประชากรของประเทศสมัยใหม่ในปัจจุบันมีชีวิตอยู่เกิน 100) ผู้คนในวัยดังกล่าวมีอิทธิพลต่อค่าเฉลี่ยมากกว่าที่พวกเขาทำกับค่ามัธยฐาน 1.5 ถึง 4 เท่าเมื่อเทียบกับคนอายุน้อยมาก ดังนั้นค่ามัธยฐานจึงเป็นสถิติที่ทันสมัยมากขึ้นเกี่ยวกับการจำแนกอายุของประเทศและเป็นอิสระจากอัตราการตายและอายุขัยเฉลี่ยมากกว่าค่าเฉลี่ยเล็กน้อย

ในที่สุดค่ามัธยฐานทำให้เรามีภาพที่ดีขึ้นเล็กน้อยว่าลักษณะการกระจายอายุตัวเองเป็นอย่างไร: เมื่อคุณเห็นค่ามัธยฐานของ 35 คุณรู้ว่าประชากรครึ่งหนึ่งมีอายุมากกว่า 35 และคุณสามารถอนุมานบางอย่างเกี่ยวกับอัตราการเกิด อายุของผู้ปกครองและอื่น ๆ ; แต่ถ้าค่าเฉลี่ยคือ 35 คุณไม่สามารถพูดได้มากเพราะ 35 อาจได้รับอิทธิพลจากประชากรขนาดใหญ่ที่กระพุ้งตอนอายุ 70 ​​หรืออาจเป็นช่องว่างของประชากรในช่วงอายุเนื่องจากสงครามเก่าหรือโรคระบาด

ดังนั้นสำหรับกลุ่มประชากรที่ไม่เกี่ยวกับสถิติเหตุผลมีค่ามัธยฐานปรากฏว่ามีคุณค่าของบทบาทของรถโดยสารเพื่อสรุปอายุของประชากรที่ค่อนข้างใหญ่


1
ฉันคิดว่าคุณหมายถึง "ค่ามัธยฐานสามารถต้านทานต่อข้อผิดพลาดดังกล่าวได้มากกว่าค่าเฉลี่ย" ฉันเห็นด้วยกับความคิดเห็นของคุณและฉันเชื่อว่าการสำรวจสำมะโนประชากรของสหรัฐมักจะรายงานค่ามัธยฐานของหลายหมวดหมู่ในรายงานอย่างเป็นทางการ (ไม่ใช่แค่อายุ) ด้วยเหตุผลเดียวกันทั้งหมด รายได้อาจเป็นตัวอย่างที่ดีกว่าอายุเพื่อแสดงให้เห็นถึงประเด็นดังกล่าว
Andy W

คุณได้แทนที่ความจริง - ค่าเฉลี่ยนั้นอ่อนไหวต่อค่าผิดปกติ / ค่าเบี่ยงเบน - สำหรับค่าข้อความเกี่ยวกับค่ากำหนดสำหรับค่ามัธยฐานมากกว่าค่าเฉลี่ย ในความเป็นจริงคุณได้แย้งว่าค่าเฉลี่ยไม่ควรถูกกว่าเพราะไม่ใช่ค่ามัธยฐาน (เหมือนกับผู้ที่บอกว่าควรใช้ค่าเฉลี่ยในการแจกแจงแบบสมมาตรนั่นคือเมื่อค่าเฉลี่ยและค่ามัธยฐานเท่ากัน)
Alexis

1
@ Alexis ฉันไม่ปฏิบัติตามคำวิจารณ์ของคุณ คุณสามารถทำอย่างละเอียด? ท้ายที่สุดแล้วคำตอบนี้ให้มากกว่า "ความจริง": มันมีบางส่วนของพวกเขาพร้อมกับการวิเคราะห์ความหมายของพวกเขา และคุณอ้างถึง "ข้อความสั่งค่า" อย่างเฉพาะเจาะจงอย่างไร
whuber

ความกังวลของฉันคือลักษณะที่เป็นข้อเท็จจริงของค่าเฉลี่ยและค่ามัธยฐาน (เช่นในอดีตมีความอ่อนไหวต่อค่าผิดปกติกล่าวคือ "คนในวัยดังกล่าวมีอิทธิพลต่อค่าเฉลี่ยมากกว่าคนที่อายุน้อยกว่า 1.5 ถึง 4 เท่า") กลายเป็นค่าเกี่ยวกับคุณค่าของพวกเขากล่าวคือ "ค่ามัธยฐานให้ภาพที่ดีขึ้นเล็กน้อยว่าการกระจายตัวของอายุนั้นมีลักษณะอย่างไร" อดีตคือข้อเท็จจริงหลังจากนั้นการประเมินมูลค่าของข้อเท็จจริงนั้น ความกังวลของฉันอยู่กับการสลับระหว่างสอง เพิ่มเติม: stats.stackexchange.com/questions/96371/…
อเล็กซิส

1
@Alexis โปรดจำไว้ว่าคำถามนี้ไม่ได้เกี่ยวกับการใช้ค่าเฉลี่ยหรือค่ามัธยฐานโดยทั่วไป แต่ใช้ในการประเมินการกระจายอายุ โปรดทราบว่าในตอนแรกคำตอบของฉันยอมรับว่าไม่มียาครอบจักรวาล: ค่าเฉลี่ยนั้นมีประโยชน์และเกี่ยวข้องกับวัตถุประสงค์เฉพาะ ฉันไม่คิดว่าฉันทำบาปที่คุณกล่าวหาฉันซึ่งเป็นสิ่งที่คลุมเครือของ "ดีกว่า": ฉันได้ระบุไว้อย่างชัดเจนว่าค่ามัธยฐานและค่าเฉลี่ยแตกต่างกันอย่างไรในบริบทนี้ มันฟังดูราวกับว่าคุณมีปัญหาในการโบยเกี่ยวกับค่าเฉลี่ยvsมีเดียน แต่นี่ไม่ใช่สถานที่ที่จะทำ
whuber

16

จอห์นให้คำตอบที่ดีกับเว็บไซต์น้องสาวของคุณ

แง่มุมหนึ่งที่เขาไม่ได้กล่าวถึงอย่างชัดเจนก็คือความทนทาน: ค่ามัธยฐานสำหรับการวัดที่ตั้งศูนย์กลางทำได้ดีกว่าค่าเฉลี่ยเนื่องจากมีจุดแตกหักสูงกว่า (จาก 50%) ในขณะที่ค่าเฉลี่ยมีค่าต่ำสุด 0 จาก 0 (ดูวิกิพีเดียเพื่อดูรายละเอียด )

โดยสัญชาตญาณมันหมายความว่าการสังเกตที่ไม่ดีของแต่ละคนจะไม่เบี่ยงเบนค่ามัธยฐานในขณะที่พวกเขาทำเพื่อค่าเฉลี่ย


9
การแยกย่อยไม่ใช่ปัญหาสำหรับสถิติเชิงพรรณนาของประชากรทั้งหมด
whuber

12

นี่คือคำตอบของฉันโพสต์ครั้งแรกใน math.stackexchange:

ค่ามัธยฐานเป็นสิ่งที่หลายคนคิดในใจเมื่อพวกเขาพูดว่า "หมายความว่า" ง่ายต่อการตีความค่ามัธยฐาน: ครึ่งหนึ่งของประชากรอยู่เหนืออายุนี้และครึ่งหนึ่งอยู่ต่ำกว่า ค่าเฉลี่ยเล็กน้อยที่ลึกซึ้งยิ่งขึ้น

ผู้คนมองหาสมมาตรและบางครั้งก็กำหนดความสมมาตรเมื่อไม่มี การจำแนกอายุในประชากรนั้นอยู่ไกลจากสมมาตรดังนั้นค่าเฉลี่ยอาจทำให้เข้าใจผิด การแจกแจงอายุเป็นสิ่งที่เหมือนปิรามิด เด็กจำนวนมากไม่ใช่ผู้สูงอายุจำนวนมาก (หรืออย่างน้อยนั่นคือวิธีที่มันอยู่ในสถานะที่มั่นคงในสหรัฐอเมริการุ่นบูมทารกโพสต์สงครามโลกครั้งที่สองได้บิดเบือนการกระจายนี้เมื่อพวกเขาอายุบางคนได้เรียกสิ่งนี้ว่า "squaring the ปิรามิด" เพราะ boomers ได้ทำ พีระมิดที่กว้างกว่าที่เคยเป็นมาในอดีต)

ด้วยการกระจายแบบอสมมาตรอาจเป็นการดีกว่าที่จะรายงานค่ามัธยฐานเนื่องจากเป็นสถิติที่สมมาตร ค่ามัธยฐานเป็นสมมาตรแม้ว่าการแจกแจงตัวอย่างจะไม่


ค่ามัธยฐานของสถิติเป็น "สมมาตร" ในแง่ใด แน่นอนว่าไม่ใช่กรณีที่การแจกแจงมักจะมีการกระจายแบบสมมาตรเกี่ยวกับค่ามัธยฐานของพวกเขา หากคุณหมายถึงสิ่งที่คุณเขียนในความคิดเห็นอื่นว่า "ค่ามัธยฐานแบ่งประชากรออกครึ่ง" (ซึ่งนิยามค่ามัธยฐาน) การโต้แย้งของคุณฟังดูเป็นวงกลม: ค่ามัธยฐานนั้นดีเพราะค่ามัธยฐานเป็นค่ามัธยฐาน!
whuber

7

ทำไมขวานถึงดีกว่าขวาน

มันคล้ายกับคำถามของคุณ พวกเขาหมายถึงและทำสิ่งต่าง ๆ หากมีใครพูดถึงคนมัธยฐานแล้วเรื่องราวที่พวกเขาพยายามถ่ายทอดรูปแบบที่พวกเขาพยายามนำไปใช้กับข้อมูลนั้นแตกต่างจากคนที่มีวิธีการ


4

สำหรับตัวอย่างที่เป็นรูปธรรมให้พิจารณาอายุเฉลี่ยสำหรับคองโก (DRC) และญี่ปุ่น หนึ่งถูกทำลายโดยสงครามกลางเมืองอื่น ๆ ได้รับการพัฒนาอย่างดีกับประชากรสูงอายุ ค่าเฉลี่ยไม่น่าสนใจอย่างยิ่งสำหรับการเปรียบเทียบแอปเปิ้ลกับแอปเปิ้ล ในทางตรงกันข้ามค่ามัธยฐานสามารถให้ข้อมูลว่าเป็นการวัดแนวโน้มกลางเนื่องจากตามคำนิยามเรามีครึ่งหนึ่งอยู่ด้านบนครึ่งล่าง บทความวิกิพีเดียเกี่ยวกับพีระมิดประชากรอาจกำลังตรัสรู้อยู่


3

คลังข้อมูลด้านสาธารณสุขในสหรัฐอเมริกากำลังก้าวไปสู่ ​​AGE ในรูปแบบปีเพิ่มขึ้นห้าปีอันเนื่องมาจากผลกระทบของกฎ HIPAA เกี่ยวกับการทำให้ไม่เห็นด้วยเจตนาและปกปิดข้อมูลด้วยเหตุผลส่วนตัว

เมื่อพิจารณาถึงความท้าทายในสิ่งที่เคยเป็นมาในอดีต (ก่อนหน้า HIPAA) ระดับการวัดองค์ประกอบข้อมูลที่ค่อนข้างยุติธรรมโดยพิจารณาจากความแตกต่างระหว่างวันเดือนปีเกิดและวันที่เสียชีวิตเราอาจต้องพิจารณา AGE ใหม่เป็นตัวแปรขนาดที่สามารถ อธิบายพารามิเตอร์ทั้งหมดในชุดข้อมูลสาธารณสุขซึ่งสนับสนุนโมเดลที่อธิบายอายุในรูปแบบที่ไม่ใช้พารามิเตอร์เป็นระดับของลำดับการวัด ฉันรู้ว่าสิ่งนี้อาจดูเหมือน "อยู่เหนือ" ที่สุดสำหรับกลุ่มต่างๆภายในชุมชนสารสนเทศทางการแพทย์ แต่ความคิดนี้อาจมีข้อดีในแง่ของ "การตีความ" ตามที่อธิบายไว้ในความคิดเห็นด้านบน

พลังการวิเคราะห์ทั้งหมดที่มีให้สำหรับแนวทางที่ไม่ใช่แบบมีพารามิเตอร์คืออะไร ใช่มันเป็นความจริงที่ว่าเราทุกคนในระดับสากลเกือบทุกคนจะพยายามใช้เทคนิค GLM (โมเดลเชิงเส้นเชิงเส้นทั่วไป) กับตัวแปรที่นำเสนอตัวเองให้เราในการแจกแจงที่มีพฤติกรรมตามที่ AGE ทำ

ในขณะเดียวกันรูปร่างของการแจกแจงนั้นและวิธีการที่รูปร่างนั้นถูกกำหนดโดยเอฟเฟกต์หลายมิติที่มีผลต่อเซนทรอยด์หลายมิติและเซนทรอยด์กลุ่มย่อยที่มีอยู่ในการกระจายนั้นจะต้องนำมาพิจารณาด้วย จะทำอย่างไรกับชุดข้อมูลที่ซับซ้อนมากเหล่านี้?

เมื่อองค์ประกอบข้อมูลล้มเหลวในการตอบสนอง "สมมติฐานของโมเดล" เราจะทำการตรวจสอบอย่างต่อเนื่อง (ฉันพูดข้ามไม่ลงเราควรเป็นผู้ว่าจ้างโอกาสที่เท่าเทียมกันของวิธีการเครื่องมือแต่ละอันมาจากโรงงานโดยมีรูปแบบตามกฎฟังก์ชัน) รายการ ของแบบจำลองที่เป็นไปได้อื่น ๆ เพื่อค้นหาแบบทดสอบ "ไม่ล้มเหลว"

ในรูปแบบปัจจุบันในชุดข้อมูลด้านสาธารณสุขเราต้องการจริงๆ (ในฐานะชุมชนการสร้างภาพข้อมูล) เพื่อสร้างแบบจำลองมาตรฐานที่มากขึ้นสำหรับการจัดการอายุในการเพิ่มขึ้นห้าปี (5YI) การลงคะแนนของฉันสำหรับการสร้างภาพข้อมูลของ AGE (เมื่อกำหนดในรูปแบบ 5YI ใหม่) คือการใช้ฮิสโตแกรมและกล่องและพล็อตมัสสุ ใช่นี่หมายถึงค่ามัธยฐาน (ไม่มีเล่นสำนวนเจตนา!)

บางครั้งรูปภาพมีค่าหนึ่งพันคำและนามธรรมก็เป็นบทสรุปของพันคำ พล็อตของกล่องและมัสสุจะแสดง "รูปร่าง" ของการแจกแจงเป็นการแสดงสัญลักษณ์ที่มีความหมายของฮิสโตแกรมที่เกือบจะเป็นความละเอียดระดับสัญลักษณ์ การเปรียบเทียบการแจกแจงของการเพิ่มอายุห้าปีโดยการแสดงกล่อง "เคียงข้างกัน" และพล็อตมัสสุที่หนึ่งสามารถเปรียบเทียบรูปแบบการมองเห็นของ 75 ถึง 50 (ค่ามัธยฐาน) ทันทีเพื่อลด 25 ntiles จะทำให้สง่างาม "มาตรฐานสากล" สำหรับการเปรียบเทียบอายุ โลก. สำหรับพวกเราที่ยังคงเพลิดเพลินกับความตื่นเต้นของการแสดงข้อมูลผ่านกลไกเชิงข้อความของการแสดงผลแบบตารางแผนภาพ "ต้นกำเนิดและใบไม้" อาจให้บริการเมื่อใช้เป็นองค์ประกอบภาพกราฟิกเคลื่อนไหวใน "ประกาย"

อายุมาถึงแล้ว จะต้องมีการสำรวจเพิ่มเติมด้วยอัลกอริทึมการคำนวณที่มีประสิทธิภาพยิ่งขึ้นที่มีอยู่ในขณะนี้


1
นี่เป็นบทความที่เขียนมาอย่างดี แต่ดูเหมือนจะไม่มีการเชื่อมต่อกับคำถามเดิม
Andy W

ฉันคิดว่ามันอยู่ในทางอ้อม แต่เหมาะสมกับความตั้งใจที่ชัดเจนของคำถาม @Andy ความผิดถ้ามีอยู่ในคำถามนั้นเองซึ่งคลุมเครือเพราะไม่ได้ระบุความรู้สึกว่าค่าเฉลี่ยอาจ "แย่ลง" กว่าค่ามัธยฐาน คำตอบที่ดีจึงต้องสำรวจเรื่องนี้และพิจารณาจุดประสงค์ของการสรุปการกระจายอายุด้วยสถิติเดียว ที่นี่สิ่งนี้นำไปสู่การถกเถียงกันว่า "อายุ" อาจหมายถึงอะไรและเปรียบเทียบการกระจายอายุอย่างไร
whuber

3

ฉันไม่คิดว่ามีเหตุผลที่ดีสำหรับการเลือกค่ามัธยฐานมากกว่าค่าเฉลี่ยสำหรับการแจกแจงอายุ มีหนึ่งในการปฏิบัติจริงเมื่อเปรียบเทียบข้อมูลรายงาน

หลายประเทศรายงานว่าประชากรของพวกเขาอยู่ในช่วงอายุ 5 ปีโดยมีวงดนตรีเปิดด้านบน สิ่งนี้ทำให้เกิดความยากลำบากในการคำนวณค่าเฉลี่ยจากช่วงเวลาโดยเฉพาะอย่างยิ่งสำหรับช่วงอายุน้อยที่สุด (ได้รับผลกระทบจากอัตราการตายของทารก), "ช่วงเวลา" ด้านบน (ค่าเฉลี่ยของช่วงเวลา "+" 80+) และช่วงเวลาสูงสุดใกล้เท่าใด ค่าเฉลี่ยของแต่ละช่วงเวลามักจะต่ำกว่าค่ากลาง)

มันง่ายกว่าที่จะประมาณค่ามัธยฐานโดยการสอดแทรกภายในช่วงเวลามัธยฐานโดยประมาณโดยสมมติว่าการกระจายอายุแบบแบนหรือแบบสี่เหลี่ยมคางหมูในช่วงเวลานั้น (อัตราการตายในหลายประเทศค่อนข้างต่ำรอบอายุเฉลี่ยทำให้การประมาณนี้สมเหตุสมผลมากกว่าการประมาณ สำหรับเด็กหรือผู้ใหญ่)


3

เพื่อให้คำตอบที่เป็นประโยชน์คำถามต้นฉบับจำเป็นต้องมีเรารู้คำถามที่อยู่เบื้องหลังคำถาม กล่าวอีกนัยหนึ่ง "ทำไมคุณถึงต้องการสรุปสถิติเปรียบเทียบการกระจายอายุของประเทศต่างๆ" ค่ามัธยฐานอาจมีประโยชน์มากที่สุดสำหรับบางคำถาม ค่าเฉลี่ยอาจเป็นประโยชน์ต่อผู้อื่นมากที่สุด และอาจมีคำถามที่ "เปอร์เซ็นต์ที่สูงกว่า (หรือต่ำกว่า) บางช่วงอายุ" จะเป็นสถิติที่มีประโยชน์มากที่สุด


2

คุณได้รับคำตอบที่ดีที่นี่ แต่ให้ฉันเพิ่ม 2 เซนต์ของฉัน ฉันทำงานใน pharmacometrics ซึ่งเกี่ยวข้องกับสิ่งต่าง ๆ เช่นปริมาณเลือดอัตราการกำจัดระดับพื้นฐานของผลของยาผลของยาสูงสุดและพารามิเตอร์เช่นนั้น

เราสร้างความแตกต่างระหว่างตัวแปรที่สามารถใช้กับค่าใด ๆ บวกหรือลบเมื่อเทียบกับค่าที่สามารถบวกเท่านั้น ตัวอย่างของตัวแปรที่สามารถใช้กับค่าใด ๆ บวกหรือลบจะเป็นผลกระทบของยาเสพติดซึ่งอาจเป็นบวกศูนย์หรือเชิงลบ ตัวอย่างของตัวแปรที่สามารถเป็นจริงได้ในเชิงบวกคือปริมาณเลือดหรืออัตราการกำจัดยา

เราจำลองสิ่งเหล่านี้ด้วยการแจกแจงที่โดยปกติแล้วจะเป็นแบบปกติหรือ lognormal, ปกติสำหรับค่าที่มีค่าใด ๆ และ lognormal สำหรับค่าบวกเท่านั้น หมายเลข lognormal คือหมายเลข E ที่นำไปสู่กำลังของจำนวนที่แจกแจงแบบปกติและนั่นคือสาเหตุที่มันสามารถเป็นค่าบวกเท่านั้น

สำหรับตัวแปรที่กระจายแบบปกติค่ามัธยฐานค่าเฉลี่ยและโหมดเป็นตัวเลขเดียวกันดังนั้นจึงไม่สำคัญว่าคุณจะใช้อะไร อย่างไรก็ตามสำหรับตัวแปรที่กระจาย lognormally ค่าเฉลี่ยจะมีขนาดใหญ่กว่าค่ามัธยฐานและโหมดดังนั้นจึงไม่มีประโยชน์จริง ๆ ในความเป็นจริงค่ามัธยฐานเป็นที่ที่ค่าปกติมีค่าเฉลี่ยดังนั้นจึงเป็นค่าที่น่าดึงดูดยิ่งขึ้น

ตั้งแต่อายุ (สมมุติ) ไม่สามารถลบการกระจาย lognormal อาจเป็นคำอธิบายที่ดีกว่าปกติดังนั้นค่ามัธยฐาน (E ถึงค่าเฉลี่ยของพื้นฐานปกติ) จึงมีประโยชน์มากกว่า


5
การกระจายของอายุแน่นอนไม่เข้าสู่ระบบปกติ
Rob Hyndman

1
ฉันไม่คิดว่าคุณสามารถอนุมานอายุได้ว่าการกระจายล็อกปกติเพียงแค่จากข้อเท็จจริงที่ว่ามันเป็นบวกเสมอ แกมม่าและการแจกแจงแบบ Weibull ก็เป็นค่าบวกเสมอดังนั้นทำไมไม่เลือกอันนั้น
โก้

@Rob: @nico: ฉันแน่ใจว่าคุณพูดถูก มันเป็นทางเลือกที่ดีของตัวอย่าง โดยทั่วไปเราจำลองพารามิเตอร์ทางเภสัชจลนศาสตร์เช่นปริมาณและระยะทาง
Mike Dunlavey

2

ฉันได้รับการสอนแล้วว่าควรใช้ค่ามัธยฐานกับพิสัยและค่าเฉลี่ยกับส่วนเบี่ยงเบนมาตรฐาน เมื่อเราพูดถึงอายุฉันคิดว่าช่วงเป็นวิธีที่เกี่ยวข้องมากขึ้นในการแสดงการแพร่กระจายและง่ายต่อการเข้าใจมากที่สุด ตัวอย่างเช่นในประชากรที่ทำการศึกษาอายุเฉลี่ย 53 (SD 5.4) หรืออายุมัธยฐานคือ 48 (ช่วง 23-77) ด้วยเหตุนี้ฉันจึงอยากใช้ค่ามัธยฐานแทนค่าเฉลี่ย แต่ฉันจะสนใจที่นี่นักสถิติหรือมืออาชีพจะพูดเกี่ยวกับการใช้ค่าเฉลี่ยกับช่วงได้อย่างไร ฉันเห็นสิ่งนี้ค่อนข้างน้อยในเอกสารทางวิทยาศาสตร์


ยินดีต้อนรับสู่ CV, Susanne หากคุณโพสต์สิ่งนี้เพื่อพยายามหาคำตอบโปรดลบออกแล้วโพสต์ใหม่เป็นคำถามใหม่ คำแนะนำเกี่ยวกับวิธีการใช้เว็บไซต์นี้สามารถใช้ได้ในของเราศูนย์ช่วยเหลือ
whuber

1

คำตอบของ John เกี่ยวกับ math.stackexchange สามารถดูได้ดังต่อไปนี้:

เมื่อคุณมีการแจกแจงแบบเบ้ค่ามัธยฐานอาจเป็นสถิติสรุปที่ดีกว่าค่าเฉลี่ย

โปรดทราบว่าเมื่อเขาบอกว่ามีทารกมากกว่าผู้ใหญ่เขาจะแนะนำว่าการกระจายอายุเป็นการแจกแจงแบบเบ้


อันที่จริงฉันคิดว่าทุกวันนี้ความเบ้ในหลายประเทศมีผลต่อผู้สูงอายุไม่ใช่หมองคล้ำ
JM ไม่ใช่นักสถิติ

บางทีมันอาจจะเบ้อย่างอื่น แต่จุดทั่วไปตั้งอยู่ สำหรับการแจกแจงแบบเบ้ค่ามัธยฐานอาจสมเหตุสมผลมากกว่าค่าเฉลี่ย

ฉันเพิ่งปรับปรุงคำตอบของฉันใน math.stackexchange เพื่อเน้นเฉพาะจุดนั้น ผู้คนมองหาสมมาตรและสามารถกำหนดความสมมาตรได้อย่างไม่ถูกต้องเมื่อไม่มี เมื่อคุณรายงานค่ามัธยฐานคุณจะได้คำตอบที่สมมาตร - ค่ามัธยฐานจะแบ่งประชากรออกเป็นครึ่ง - แม้ว่าการกระจายจะไม่สมมาตร
John D. Cook

คำตอบนี้ดูเหมือนจะค่อนข้างทำให้ฉันรู้สึกแย่: เมื่อการแจกแจงไม่เบ้ (นั่นคือสมมาตร) ค่าเฉลี่ยเท่ากับค่ามัธยฐานดังนั้นการบอกว่าค่ามัธยฐานคือ "ดีกว่า" เมื่อการแจกแจงเบ้เป็นวิธีลับๆในการพูด "ใช้เท่านั้น ค่ามัธยฐาน "
Alexis

1

ฉันหวังว่าอายุเฉลี่ยจะได้รับอิทธิพลจากค่าผิดปกติในชุดข้อมูลของคุณในขณะที่นี่ไม่ใช่กรณีสำหรับอายุเฉลี่ย ให้เรานำตัวอย่างของชุดข้อมูลผู้ป่วยที่ฉีดวัคซีน: 1,2,3,4,4,5,6,6,6,78 ปีค่าเฉลี่ยจะเป็น: 11.5 และอายุเฉลี่ยของผู้ป่วยเหล่านี้คือ 4.5 อายุเฉลี่ยนี้ได้รับผลกระทบจากค่าเริ่มต้น 78 ค่ามัธยฐานเป็นค่าดีที่สุดในขณะที่จัดการกับชุดข้อมูลของการแจกแจงแบบเบ้


ดูการตอบสนองของฉันต่อ User28
Alexis

0

ในกรณีของการวิเคราะห์ทางประชากรศาสตร์ฉันคิดว่าทั้งค่าเฉลี่ยและค่ามัธยฐานจะมีค่าโดยเฉพาะอย่างยิ่งเมื่อใช้ร่วมกันหากคุณกำลังมองหาค่าผิดปกติหรือพื้นที่ของการเจริญเติบโต ในชุมชนที่มีชุมชนเกษียณอายุขนาดใหญ่หรือในพื้นที่ที่มีอัตราการระเบิดเกิดขึ้นค่ามัธยฐานเพียงอย่างเดียวอาจไม่ให้ภาพรวมและเป็นที่ซึ่งการเปรียบเทียบค่าเฉลี่ยนั้นมีประโยชน์มาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.