การเลือกระยะทางที่ถูกต้องไม่ใช่งานเบื้องต้น เมื่อเราต้องการทำการวิเคราะห์แบบกลุ่มบนชุดข้อมูลผลลัพธ์ที่แตกต่างกันอาจปรากฏขึ้นโดยใช้ระยะทางที่แตกต่างกันดังนั้นจึงเป็นเรื่องสำคัญมากที่จะต้องระมัดระวังในการเลือกระยะทางเพราะเราสามารถสร้างสิ่งประดิษฐ์ที่ดีที่จับความแปรปรวนได้ดี ความรู้สึกในปัญหาของเรา
ยุคลิดระยะที่เหมาะสมเมื่อฉันมีตัวแปรที่เป็นตัวเลขอย่างต่อเนื่องและฉันต้องการที่จะสะท้อนให้เห็นถึงระยะทางที่แน่นอน ระยะนี้คำนึงถึงทุกตัวแปรและไม่ลบความซ้ำซ้อนดังนั้นถ้าฉันมีสามตัวแปรที่อธิบายเหมือนกัน (มีความสัมพันธ์กัน) ฉันจะให้น้ำหนักกับเอฟเฟกต์นี้สามครั้ง ยิ่งไปกว่านั้นระยะทางนี้ไม่ใช่ค่าคงที่ขนาดดังนั้นโดยทั่วไปฉันต้องปรับขนาดก่อนหน้านี้เพื่อใช้ระยะทาง
ตัวอย่างนิเวศวิทยา: เรามีข้อสังเกตที่แตกต่างจากหลายท้องที่ซึ่งผู้เชี่ยวชาญได้นำตัวอย่างของปัจจัยทางจุลชีววิทยาร่างกายและเคมี เราต้องการค้นหารูปแบบในระบบนิเวศ ปัจจัยเหล่านี้มีความสัมพันธ์สูง แต่เรารู้ว่าทุกคนมีความเกี่ยวข้องดังนั้นเราจึงไม่ต้องการลบความซ้ำซ้อนเหล่านี้ออก เราใช้ระยะทางแบบยุคลิดกับข้อมูลสเกลเพื่อหลีกเลี่ยงผลกระทบของหน่วย
Mahalanobisระยะที่เหมาะสมเมื่อฉันมีตัวแปรที่เป็นตัวเลขอย่างต่อเนื่องและฉันต้องการที่จะสะท้อนให้เห็นถึงระยะทางที่แน่นอน แต่เราต้องการที่จะลบความซ้ำซ้อน หากเรามีตัวแปรซ้ำ ๆ ผลซ้ำ ๆ ของพวกเขาจะหายไป
ครอบครัวHellinger , โปรไฟล์ชี่และระยะคอร์ดมีความเหมาะสมเมื่อเราต้องการที่จะให้ความสำคัญกับความแตกต่างระหว่างตัวแปรเมื่อเราต้องการที่จะแยกความแตกต่างโปรไฟล์ ระยะทางเหล่านี้มีน้ำหนักตามปริมาณรวมของการสังเกตแต่ละครั้งในลักษณะที่ระยะทางมีขนาดเล็กเมื่อตัวแปรโดยตัวแปรแต่ละคนมีความคล้ายคลึงกันมากขึ้นแม้ว่าในขนาดที่แน่นอนแตกต่างกันมาก ระวัง! ระยะทางเหล่านี้สะท้อนความแตกต่างระหว่างโปรไฟล์ได้ดีมาก แต่สูญเสียเอฟเฟ็กต์ขนาด มันอาจมีประโยชน์มากเมื่อเรามีขนาดตัวอย่างที่แตกต่างกัน
ตัวอย่างนิเวศวิทยา: เราต้องการศึกษาสัตว์ในหลาย ๆ พื้นที่และเรามีเมทริกซ์ข้อมูลของรายการของหอยทาก (สถานที่สุ่มตัวอย่างในแถวและชื่อสปีชีส์ในคอลัมน์) เมทริกซ์นั้นมีลักษณะเป็นศูนย์โดยมีค่าเป็นศูนย์และมีขนาดต่างกันเพราะบางพื้นที่มีสปีชีส์บางแห่งและสปีชีส์อื่นมีสปีชีส์อื่น เราสามารถใช้ระยะทาง Hellinger
Bray-Curtisค่อนข้างคล้ายกัน แต่จะเหมาะสมกว่าเมื่อเราต้องการแยกความแตกต่างของโปรไฟล์และคำนึงถึงขนาดสัมพัทธ์