ฉันมีปัญหาคล้ายกับคำถามที่ถามที่นี่:
เราวัดความไม่สม่ำเสมอของการแจกแจงได้อย่างไร
ฉันมีชุดการแจกแจงความน่าจะเป็นในแต่ละวันของสัปดาห์ ฉันต้องการวัดว่าการกระจายแต่ละครั้งนั้นใกล้กับเท่าไหร่ (1 / 7,1 / 7, ... , 1/7)
ตอนนี้ฉันใช้คำตอบจากคำถามข้างต้น L2-Norm ซึ่งมีค่า 1 เมื่อการแจกแจงมีมวล 1 เป็นเวลาหนึ่งวันและจะลดลงสำหรับ (1 / 7,1 / 7, 7, ... , 1/7) ฉันกำลังขยายขนาดเชิงเส้นนี้อยู่ระหว่าง 0 ถึง 1 จากนั้นจึงพลิกมัน 0 หมายความว่าไม่สม่ำเสมออย่างสมบูรณ์และ 1 หมายถึงชุดที่สมบูรณ์แบบ
มันใช้งานได้ดี แต่ฉันมีปัญหาหนึ่งเรื่อง มันปฏิบัติต่อทุก ๆ วันทำงานอย่างเท่าเทียมกันเป็นมิติหนึ่งในพื้นที่ 7-Dim ดังนั้นจึงไม่ได้คำนึงถึงความใกล้ชิดของวัน กล่าวอีกนัยหนึ่งก็ให้คะแนนเดียวกันกับ (1 / 2,1 / 2,0,0,0,0,0) และ (1 / 2,0,0,1 / 2,0,0,0) แม้ว่าในบางแง่หลังยิ่ง "กระจาย" และเครื่องแบบและควรได้รับคะแนนสูงกว่า เห็นได้ชัดว่ามีความซับซ้อนเพิ่มที่เรียงลำดับของวันเป็นวงกลม
ฉันจะเปลี่ยนฮิวริสติกนี้เพื่ออธิบายความใกล้เคียงของวันได้อย่างไร