ฉันต้องการเพิ่มเหตุผลข้อที่สามให้กับเหตุผลที่ถูกต้องของ Harrell และ Flom เหตุผลคือเราใช้ระยะทางแบบยุคลิด (หรือ L2) และไม่ใช่ระยะทางแบบแมนฮัตตัน (หรือ L1) เป็นตัววัดความใกล้ชิดหรือข้อผิดพลาดมาตรฐานของเรา หากมีจุดข้อมูลจำนวนหนึ่งและต้องการตัวเลขเดียว เพื่อประเมินความคิดที่ชัดเจนคือการหาจำนวนที่ลดจำนวนข้อผิดพลาดที่ทำให้เกิดความแตกต่างน้อยที่สุดระหว่างจำนวนที่เลือกและ ตัวเลขที่ประกอบเป็นข้อมูล ในสัญกรณ์คณิตศาสตร์สำหรับฟังก์ชันข้อผิดพลาดที่กำหนด E ต้องการค้นหาหากมีใครใช้สำหรับ E (x, y) L2 ปกติหรือระยะทางนั่นคือx1,…xnθminθ∈R(E(θ,x1,…xn)=minθ∈R(∑i=ni=1E(θ,xi))E(x,y)=(x−y)2จากนั้นตัวขยายขนาดเล็กทั้งหมดคือค่าเฉลี่ย หากใครใช้ระยะทาง L1 หรือแมนฮัตตันตัวย่อเล็กสุดเหนือคือค่ามัธยฐาน ดังนั้นค่าเฉลี่ยคือตัวเลือกทางคณิตศาสตร์ตามธรรมชาติ - ถ้าใครใช้ระยะทาง L2!θ∈Rθ∈R