คุณใช้ Apache Kafka เป็นคิวแบบกระจายและมีประสิทธิภาพซึ่งสามารถจัดการข้อมูลปริมาณมากและช่วยให้คุณสามารถส่งผ่านข้อความจากปลายทางหนึ่งไปยังอีกจุดหนึ่งได้
สตอร์มไม่ใช่คิว เป็นระบบที่กระจายความสามารถในการประมวลผลแบบเรียลไทม์ซึ่งหมายความว่าคุณสามารถดำเนินการปรับแต่งทุกรูปแบบกับข้อมูลเรียลไทม์ควบคู่กันได้
ขั้นตอนทั่วไปของเครื่องมือเหล่านี้ (อย่างที่ฉันรู้) มีดังนี้:
ระบบเรียลไทม์ -> Kafka -> Storm -> NoSql -> BI (ไม่บังคับ)
ดังนั้นคุณจึงมีแอปเรียลไทม์ที่จัดการข้อมูลปริมาณมากส่งไปยังคิวคาฟคา Storm ดึงข้อมูลจากคาฟคาและใช้การจัดการที่จำเป็นบางอย่าง ณ จุดนี้คุณมักต้องการได้รับประโยชน์บางอย่างจากข้อมูลนี้ดังนั้นคุณจึงส่งไปยังฐานข้อมูล Nosql บางส่วนเพื่อการคำนวณ BI เพิ่มเติมหรือคุณสามารถค้นหา NoSql นี้จากระบบอื่นก็ได้