คุณไม่ได้ระบุสิ่งนี้อย่างชัดเจน แต่จากคำอธิบายปัญหาของคุณดูเหมือนว่าคุณจะอยู่หลังชุดของควอไทล์ (เช่น 50, 90, 95 และ 99)
หากเป็นเช่นนั้นฉันได้ประสบความสำเร็จอย่างมากกับวิธีการที่อธิบายไว้ใน"การคำนวณที่มีประสิทธิภาพของการให้น้ำหนักเชิงปริมาณมากกว่าการสตรีมข้อมูล"โดย Cormode et al มันเป็นอัลกอริทึมที่รวดเร็วซึ่งต้องการหน่วยความจำน้อยและง่ายต่อการใช้งาน
วิธีการนี้ใช้อัลกอริธึมก่อนหน้านี้โดย Greenwald และ Khanna ที่เก็บรักษาตัวอย่างเล็ก ๆ ของสตรีมอินพุตพร้อมกับขอบเขตบนและล่างตามลำดับของค่าในตัวอย่าง มันต้องการพื้นที่มากกว่าการรวบรวมสักครู่ แต่จะดีกว่าที่จะอธิบายส่วนหางที่น่าสนใจของการกระจายอย่างแม่นยำ