ให้ฉันแสดงตัวอย่างของแอปพลิเคชันการจัดกลุ่มออนไลน์สมมุติ:
ณ เวลาที่มีการจัดสรร n คะแนน 1,2,3,4 ให้กับคลัสเตอร์สีน้ำเงิน A และคะแนน b จะมีการจัดสรร 5,6,7 ไปยังคลัสเตอร์ B สีแดง
ในเวลา n + 1 จุดใหม่ a ถูกแนะนำซึ่งถูกกำหนดให้กับคลัสเตอร์สีน้ำเงิน A แต่ยังทำให้จุด b ถูกกำหนดให้กับคลัสเตอร์สีน้ำเงิน A เช่นกัน
ในท้ายที่สุดคะแนน 1,2,3,4, a, b เป็นของ A และคะแนน 5,6,7 ถึง B สำหรับฉันนี่ดูเหมือนจะสมเหตุสมผล
สิ่งที่ดูเหมือนง่ายๆในตอนแรกนั้นเป็นเรื่องยากเล็กน้อย - เพื่อรักษาตัวระบุข้ามขั้นตอนเวลา ให้ฉันพยายามทำให้จุดนี้ชัดเจนขึ้นด้วยตัวอย่างของเส้นขอบที่มากขึ้น:
จุดสีเขียวจะทำให้จุดสีฟ้าสองและจุดสีแดงสองจุดถูกรวมเข้าด้วยกันเป็นหนึ่งกลุ่มซึ่งฉันตัดสินใจโดยไม่ตั้งใจว่าจะใช้สีฟ้า - ใจนี่เป็นความคิดแบบมนุษย์ของฉันที่ทำงานอยู่แล้ว!
คอมพิวเตอร์ในการตัดสินใจนี้จะต้องใช้กฎ ตัวอย่างเช่นเมื่อมีการรวมคะแนนเข้าในคลัสเตอร์ดังนั้นเอกลักษณ์ของคลัสเตอร์จะถูกกำหนดโดยเสียงส่วนใหญ่ ในกรณีนี้เราจะพบกับการดึง - ทั้งสีฟ้าและสีแดงอาจเป็นตัวเลือกที่ถูกต้องสำหรับกลุ่มใหม่ (ที่นี่มีสีน้ำเงิน)
ลองนึกภาพจุดสีแดงที่ห้าใกล้กับจุดสีเขียว ส่วนใหญ่จะเป็นสีแดง (3 สีแดงกับ 2 สีน้ำเงิน) ดังนั้นสีแดงจึงเป็นตัวเลือกที่ดีสำหรับกลุ่มใหม่ - แต่สิ่งนี้จะขัดแย้งกับตัวเลือกสีแดงที่ชัดเจนยิ่งขึ้นสำหรับกลุ่มด้านขวาสุดเนื่องจากสีแดงและน่าจะอยู่แบบนั้น .
ฉันคิดว่ามันน่ากลัวที่จะคิดเกี่ยวกับเรื่องนี้ ในตอนท้ายของวันที่ฉันเดาว่าไม่มีกฎที่สมบูรณ์แบบสำหรับเรื่องนี้ - ฮิวริสติกค่อนข้างดีที่จะเพิ่มความเสถียรให้กับสถานการณ์
ในที่สุดนี้นำไปสู่คำถามของฉัน:
- "ปัญหา" นี้มีชื่อที่สามารถอ้างอิงได้หรือไม่?
- มีวิธี "มาตรฐาน" สำหรับสิ่งนี้และ ...
- ... อาจมีแพ็กเกจ R สำหรับสิ่งนั้นอยู่ใช่ไหม
การสืบทอดที่เหมาะสมของเอกลักษณ์ของคลัสเตอร์ในการทำคลัสเตอร์ซ้ำ