เรากำลังวางแผนที่จะซื้อคลัสเตอร์สำหรับการคำนวณทางวิทยาศาสตร์ขณะนี้เราอยู่ในขั้นตอนการรวบรวมข้อกำหนดต่างๆ เราไม่แน่ใจจริงๆสิ่งที่ควรจะเป็นข้อกำหนดของ เซิร์ฟเวอร์จัดเก็บข้อมูล .
คลัสเตอร์จะมี ~ 200 โหนดการคำนวณที่เชื่อมต่อโดยเครือข่ายความหน่วงต่ำ (สำหรับการคำนวณแบบขนาน) และจะถูกใช้โดยประมาณ ผู้ใช้ 25 คน
การจัดเก็บจะมีประมาณ พื้นที่ที่สามารถใช้งานได้ 200 TB และจะใช้สำหรับ การคำนวณ (โหนดการคำนวณจะไม่มีดิสก์) และควร ไม่ใช้เป็นข้อมูลสำรอง (เช่นเราไม่ต้องการการป้องกันข้อมูลสูญหายในระดับอุตสาหกรรม)
ฉันมาด้วยต่อไปนี้; ความคิดเห็นและข้อเสนอแนะที่ชื่นชมอย่างมาก
ข้อมูลจำเพาะ:
- เทคโนโลยี ZFS เพื่อสร้างโวลุ่มเดียวและป้องกันความล้มเหลวของไดรฟ์
- ใช้การตั้งค่าหลายพูลของการตั้งค่า RAID-Z2 หรือ RAID-Z3 ที่มีความเท่าเทียมกัน 25% ซึ่งหมายถึง 8 ดิสก์ต่อ RAID-Z2 หรือ 12 ดิสก์ต่อ RAID-Z3
- เทคโนโลยีการแคชบางชนิดโดยใช้ SSD (เพื่อเพิ่มความเร็ว i / o ของไฟล์ที่ใช้บ่อย)
- เครือข่าย 10 Gbit (หรือแม้กระทั่ง 100 Gbit ถ้าเป็นไปได้)
คำถาม & amp; หมายเหตุ:
- เรากังวลเกี่ยวกับความเร็ว I / O กระบวนการหลาย (25+) กระบวนการจะเขียนข้อมูลจำนวนมากไปยังที่เก็บข้อมูล
- เราจะไม่อ่าน / เขียนไฟล์ขนาดเล็กจำนวนมาก (จะไม่ได้รับอนุญาต)
- เราคาดหวังว่าดิสก์จะล้มเหลวในช่วงอายุการเก็บข้อมูล (~ 5 ปี) และเราไม่ต้องการที่จะสูญเสียข้อมูล แต่การสูญเสียข้อมูลบางส่วนในช่วงเวลานี้ (สมมติว่ามีครั้งเดียว) เป็นที่ยอมรับ
- เราควรขออะไหล่ร้อน (เทียบกับจำนวนดิสก์ทั้งหมด)
- ฉันไม่รู้จริง ๆ ว่าเทคโนโลยีแคชชนิดใด (ถ้ามี) มีให้ใช้งาน
- คอมโพเนนต์ของคลัสเตอร์จะดำเนินการโดย linux
แก้ไข:
โปรดทราบว่าฉันไม่ได้มองหาคำแนะนำเกี่ยวกับข้อมูลจำเพาะของฮาร์ดแวร์ - คำถามของฉันมีจุดมุ่งหมายที่ส่วนใหญ่ ฉันควรคาดหวังว่าพฤติกรรมแบบใดเมื่อใช้การตั้งค่า ZFS (RAID) ที่ระบุ . ข้อมูลจำเพาะฮาร์ดแวร์อยู่ที่นี่เพียงเพื่อระบุขนาดของระบบของฉัน