ดังนั้นตัวกรองของ Bloomนั้นยอดเยี่ยมมาก - เป็นชุดที่รองรับการตรวจสอบการเป็นสมาชิกโดยไม่มีข้อผิดพลาดที่ผิดพลาด แต่มีโอกาสเล็กน้อยที่จะมีผลบวกเป็นลบ แม้ว่าเมื่อเร็ว ๆ นี้ฉันต้องการ "ตัวกรอง Bloom" ที่รับประกันสิ่งที่ตรงกันข้าม: ไม่มีผลบวกปลอม แต่อาจเป็นเชิงลบที่ผิดพลาด
แรงจูงใจของฉันนั้นง่าย: เนื่องจากมีไอเท็มจำนวนมากในการประมวลผล (ที่มีรายการซ้ำ) เราต้องการหลีกเลี่ยงการประมวลผลรายการที่เราเคยเห็นมาก่อน มันไม่เจ็บที่จะประมวลผลซ้ำซ้อนมันเสียเวลาเปล่า แต่ถ้าเราละเลยที่จะประมวลผลองค์ประกอบมันจะเป็นหายนะ ด้วย "reverse Bloom filter" เราสามารถจัดเก็บรายการที่มองเห็นด้วยค่าใช้จ่ายในพื้นที่น้อยและหลีกเลี่ยงการทำซ้ำที่มีความน่าจะเป็นสูงโดยการทดสอบการเป็นสมาชิกในชุด
ถึงกระนั้นฉันก็ไม่สามารถพบสิ่งที่จัดเรียง สิ่งที่ฉันพบมากที่สุดคือ " ตัวกรอง Bloom ที่รีทัช " ซึ่งอนุญาตให้ทำการแลกเปลี่ยนผลบวกปลอมที่เลือกเพื่ออัตราการลบที่ผิดพลาดที่สูงขึ้น ฉันไม่ทราบว่าโครงสร้างข้อมูลของพวกเขามีประสิทธิภาพเพียงใดเมื่อต้องการลบผลบวกที่ผิดทั้งหมดออก
ใครเห็นอะไรเช่นนี้ :)