การกำหนดค่าและข้อมูลจำเพาะ RAID เซิร์ฟเวอร์หน่วยเก็บข้อมูลแบบคลัสเตอร์ (การตรวจสอบสติ)


0

เรากำลังวางแผนที่จะซื้อคลัสเตอร์สำหรับการคำนวณทางวิทยาศาสตร์ขณะนี้เราอยู่ในขั้นตอนการรวบรวมข้อกำหนดต่างๆ เราไม่แน่ใจจริงๆสิ่งที่ควรจะเป็นข้อกำหนดของ เซิร์ฟเวอร์จัดเก็บข้อมูล .

คลัสเตอร์จะมี ~ 200 โหนดการคำนวณที่เชื่อมต่อโดยเครือข่ายความหน่วงต่ำ (สำหรับการคำนวณแบบขนาน) และจะถูกใช้โดยประมาณ ผู้ใช้ 25 คน

การจัดเก็บจะมีประมาณ พื้นที่ที่สามารถใช้งานได้ 200 TB และจะใช้สำหรับ การคำนวณ (โหนดการคำนวณจะไม่มีดิสก์) และควร ไม่ใช้เป็นข้อมูลสำรอง (เช่นเราไม่ต้องการการป้องกันข้อมูลสูญหายในระดับอุตสาหกรรม)


ฉันมาด้วยต่อไปนี้; ความคิดเห็นและข้อเสนอแนะที่ชื่นชมอย่างมาก

ข้อมูลจำเพาะ:

  • เทคโนโลยี ZFS เพื่อสร้างโวลุ่มเดียวและป้องกันความล้มเหลวของไดรฟ์
  • ใช้การตั้งค่าหลายพูลของการตั้งค่า RAID-Z2 หรือ RAID-Z3 ที่มีความเท่าเทียมกัน 25% ซึ่งหมายถึง 8 ดิสก์ต่อ RAID-Z2 หรือ 12 ดิสก์ต่อ RAID-Z3
  • เทคโนโลยีการแคชบางชนิดโดยใช้ SSD (เพื่อเพิ่มความเร็ว i / o ของไฟล์ที่ใช้บ่อย)
  • เครือข่าย 10 Gbit (หรือแม้กระทั่ง 100 Gbit ถ้าเป็นไปได้)

คำถาม & amp; หมายเหตุ:

  • เรากังวลเกี่ยวกับความเร็ว I / O กระบวนการหลาย (25+) กระบวนการจะเขียนข้อมูลจำนวนมากไปยังที่เก็บข้อมูล
  • เราจะไม่อ่าน / เขียนไฟล์ขนาดเล็กจำนวนมาก (จะไม่ได้รับอนุญาต)
  • เราคาดหวังว่าดิสก์จะล้มเหลวในช่วงอายุการเก็บข้อมูล (~ 5 ปี) และเราไม่ต้องการที่จะสูญเสียข้อมูล แต่การสูญเสียข้อมูลบางส่วนในช่วงเวลานี้ (สมมติว่ามีครั้งเดียว) เป็นที่ยอมรับ
  • เราควรขออะไหล่ร้อน (เทียบกับจำนวนดิสก์ทั้งหมด)
  • ฉันไม่รู้จริง ๆ ว่าเทคโนโลยีแคชชนิดใด (ถ้ามี) มีให้ใช้งาน
  • คอมโพเนนต์ของคลัสเตอร์จะดำเนินการโดย linux

แก้ไข:

โปรดทราบว่าฉันไม่ได้มองหาคำแนะนำเกี่ยวกับข้อมูลจำเพาะของฮาร์ดแวร์ - คำถามของฉันมีจุดมุ่งหมายที่ส่วนใหญ่ ฉันควรคาดหวังว่าพฤติกรรมแบบใดเมื่อใช้การตั้งค่า ZFS (RAID) ที่ระบุ . ข้อมูลจำเพาะฮาร์ดแวร์อยู่ที่นี่เพียงเพื่อระบุขนาดของระบบของฉัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.