ในงานของฉันเมื่อบุคคลอ้างถึงค่า "หมายถึง" ของชุดข้อมูลพวกเขามักจะอ้างถึงค่าเฉลี่ยเลขคณิต (เช่น "เฉลี่ย" หรือ "คาดหวังค่า") ถ้าฉันให้ค่าเฉลี่ยทางเรขาคณิตคนอาจจะคิดว่าฉันกำลังหยามหรือไม่เป็นประโยชน์เนื่องจากคำจำกัดความของ "หมายถึง" เป็นที่รู้จักกันล่วงหน้า
ฉันพยายามที่จะตรวจสอบว่ามีคำจำกัดความของ "ค่ามัธยฐาน" หลายชุดของข้อมูลหรือไม่ ตัวอย่างเช่นหนึ่งในคำจำกัดความที่จัดทำโดยเพื่อนร่วมงานสำหรับการค้นหาค่ามัธยฐานของชุดข้อมูลที่มีองค์ประกอบจำนวนคู่จะเป็น:
อัลกอริทึม 'A'
- หารจำนวนขององค์ประกอบสองปัดเศษลง
- ค่านั้นคือดัชนีของค่ามัธยฐาน
5
คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น[4, 5, 6, 7]
สิ่งนี้ดูเหมือนจะสมเหตุสมผลแม้ว่าลักษณะการปัดเศษลงจะดูเป็นเรื่องเล็กน้อย
อัลกอริทึม 'B'
ไม่ว่าในกรณีใดเพื่อนร่วมงานคนอื่นได้เสนออัลกอริทึมแยกต่างหากซึ่งอยู่ในหนังสือเรียนสถิติของเขา (ต้องได้รับชื่อและผู้แต่ง):
- หารจำนวนองค์ประกอบด้วย 2 และเก็บสำเนาของเลขจำนวนเต็มที่ปัดเศษขึ้นและปัดเศษลง ชื่อพวกเขาและ
n_lo
n_hi
- ใช้ค่าเฉลี่ยขององค์ประกอบที่และ
n_lo
n_hi
(5+6)/2 = 5.5
คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น[4, 5, 6, 7]
ดูเหมือนว่าผิด5.5
ในกรณีนี้ค่ามัธยฐานในกรณีนี้จริง ๆ แล้วไม่ได้อยู่ในชุดข้อมูลดั้งเดิม เมื่อเราสลับอัลกอริทึม 'A' สำหรับ 'B' ในโค้ดทดสอบบางอันมันก็แย่มาก
คำถาม
มี "ชื่อ" อย่างเป็นทางการสำหรับทั้งสองวิธีในการคำนวณค่ามัธยฐานของชุดข้อมูลหรือไม่ เช่น "ค่ามัธยฐานที่น้อยกว่าจาก --- สอง" กับ "ค่าเฉลี่ย - กลาง - องค์ประกอบ - และ - สร้าง - ค่าเฉลี่ยข้อมูลใหม่"?