เรากำลังสร้างเว็บไซต์ที่จะรวบรวมข้อมูลตำแหน่ง (คะแนน) จากผู้ใช้ เรากำลังสำรวจเทคนิคเพื่อรักษาความเป็นส่วนตัวของตำแหน่งของผู้ใช้ (เช่นผู้ใช้มักจะแบ่งปันที่อยู่บ้านของพวกเขาซึ่งมีความละเอียดอ่อน) ทางเลือกหนึ่งที่อยู่ในใจคือการทำให้งงงวยหรือ "แฮ" จุดก่อนที่จะเก็บไว้ในฐานข้อมูลโดยไม่จำเป็นต้องจัดเก็บข้อมูลที่สำคัญเหล่านี้เลย
ข้อกำหนดพื้นฐานของเราคือฉันเชื่อว่า:
เนื่องจากมีจุดที่ทำให้งงงวยเดียวมันเป็นไปไม่ได้ที่จะได้รับจุดดั้งเดิมภายใน (พูด) กิโลเมตรหรือมากกว่านั้นแม้จะได้รับข้อมูลเมตาทั้งหมดที่เกี่ยวข้องกับจุดนั้น (กล่าวคือถือว่าฐานข้อมูลทั้งหมดถูกบุกรุก)
เมื่อพิจารณาชุดของจุดที่มีขนาดใหญ่ตามอำเภอใจซึ่งสอดคล้องกับจุดเริ่มต้นเดียวกันนั้นยังคงเป็นไปไม่ได้ที่จะได้รับจุดเดิม (ตัวอย่างเช่นเทคนิคง่าย ๆ คือการเพิ่มเวกเตอร์แบบสุ่มไปยังจุดเดิม แต่ถ้าคุณทำเช่นนี้มากพอเวลาจุดที่ยุ่งเหยิงจะจัดกลุ่มรอบจุดเดิม)
มันจะดีถ้าคุณสมบัติทางสถิติต่าง ๆ ถูกเก็บรักษาไว้ แต่ฉันไม่รู้ว่าคุณสมบัติใดมีความสำคัญในขั้นตอนนี้ ตัวอย่างเช่นฉันต้องการให้คะแนนที่ยุ่งเหยิงกระจัดกระจายในแบบ "เป็นธรรมชาติ" แทนที่จะสะสมลงในตาราง อย่างไรก็ตามความเป็นส่วนตัวสำคัญกว่านี้