สิ่งแรกที่ฉันคิดเมื่อใช้บริการใหม่ (เช่นที่เก็บข้อมูลที่ไม่ใช่ RDBMS หรือคิวข้อความ) คือ: "ฉันจะจัดโครงสร้างข้อมูลของฉันได้อย่างไร"
ฉันอ่านและดูเนื้อหาเบื้องต้นแล้ว โดยเฉพาะอย่างยิ่งใช้ตัวอย่างเช่นKafka: ระบบส่งข้อความแบบกระจายสำหรับการประมวลผลบันทึกซึ่งเขียน:
- "หัวข้อคือคอนเทนเนอร์ที่เชื่อมโยงข้อความ"
- "หน่วยคู่ขนานที่เล็กที่สุดคือพาร์ติชันของหัวข้อซึ่งหมายความว่าข้อความทั้งหมดที่ ... เป็นของพาร์ติชันเฉพาะของหัวข้อจะถูกบริโภคโดยผู้บริโภคในกลุ่มผู้บริโภค"
เมื่อรู้สิ่งนี้จะเป็นตัวอย่างที่ดีที่แสดงวิธีใช้หัวข้อและพาร์ติชันได้อย่างไร เมื่อไรควรเป็นหัวข้อ? เมื่อใดที่ควรเป็นพาร์ติชัน
ตัวอย่างเช่นสมมติว่าข้อมูล (Clojure) ของฉันดูเหมือน:
{:user-id 101 :viewed "/page1.html" :at #inst "2013-04-12T23:20:50.22Z"}
{:user-id 102 :viewed "/page2.html" :at #inst "2013-04-12T23:20:55.50Z"}
หัวข้อควรเป็นไปตามuser-id
? viewed
? at
? แล้วพาร์ติชั่นล่ะ
ฉันจะตัดสินใจได้อย่างไร