ความจริงบางประการเกี่ยวกับการจัดเก็บในบ้านหรือเหตุใดการจัดเก็บข้อมูลองค์กรจึงมีราคาแพง
ฮาร์ดไดรฟ์สำหรับผู้บริโภคมีพื้นที่จำนวนมากดังนั้นแม้แต่ผู้ใช้ที่ชาญฉลาดที่สุดของ * กระแอม * สตรีมมิ่งสื่อ * ไอ * สามารถซื้อได้มากพอที่จะเก็บสะสมหลายเทราไบต์ ในความเป็นจริงความจุของดิสก์เติบโตขึ้นเร็วกว่าที่ทรานซิสเตอร์ใช้กับซิลิคอนเป็นเวลาสองสามทศวรรษในขณะนี้
การจัดเก็บข้อมูล 'องค์กร' เป็นปัญหาที่ค่อนข้างซับซ้อนเนื่องจากข้อมูลมีข้อกำหนดด้านประสิทธิภาพและความสมบูรณ์ซึ่งกำหนดวิธีการที่ค่อนข้างหนากว่า ข้อมูลต้องมีการรับประกันความพร้อมใช้งานในกรณีที่เกิดความล้มเหลวของฮาร์ดแวร์และอาจต้องมีการแบ่งปันกับผู้ใช้จำนวนมากซึ่งจะสร้างคำขออ่าน / เขียนมากกว่าผู้ใช้คนเดียว
การแก้ไขปัญหาทางเทคนิคสำหรับปัญหานี้อาจมีราคาแพงกว่ากิกะไบต์ต่อกิกะไบต์สำหรับผู้บริโภค พวกเขายังต้องการการบำรุงรักษาทางกายภาพ การสำรองข้อมูลจะต้องดำเนินการและมักจะจัดเก็บนอกสถานที่เพื่อให้ไฟไม่ทำลายข้อมูล กระบวนการนี้จะเพิ่มค่าใช้จ่ายอย่างต่อเนื่อง
ประสิทธิภาพ
สำหรับผู้บริโภคขนาด 1TB หรือแม้กระทั่งองค์กรที่อยู่ใกล้กับสายการผลิตคุณมีเพียงหัวเดียว ดิสก์หมุนที่ 7200 RPM หรือ 120 รอบต่อวินาที ซึ่งหมายความว่าคุณสามารถรับการดำเนินการ I / O แบบสุ่มได้มากถึง 120 ครั้งต่อวินาทีในทางทฤษฎี * และค่อนข้างน้อยในทางปฏิบัติ ดังนั้นการคัดลอกไฟล์ขนาดใหญ่ในปริมาณ 1TB เดียวจึงค่อนข้างช้า
บนดิสก์อาเรย์ที่มีดิสก์ 14x72GB คุณมี 14 หัวเหนือดิสก์ที่ไปที่ (พูด) 15,000 RPM หรือประมาณ 250 รอบต่อวินาที สิ่งนี้จะช่วยให้คุณดำเนินการสุ่ม I / O ได้สูงสุด 3,500 ครั้งต่อวินาที * (อีกครั้งในทางปฏิบัติค่อนข้างน้อย) สิ่งอื่น ๆ ที่เท่าเทียมกันการคัดลอกไฟล์จะเร็วกว่ามากหลายเท่า
*
คุณสามารถเข้าถึงแบบสุ่มได้มากกว่าหนึ่งครั้งต่อการปฏิวัติของดิสก์หากรูปทรงเรขาคณิตของผู้อ่านอนุญาตให้ไดรฟ์ย้ายหัวและอ่านเซกเตอร์ที่เกิดขึ้นพร้อมใช้งานภายในหนึ่งรอบการปฏิวัติของดิสก์ หากการเข้าถึงดิสก์ถูกกระจายไปอย่างกว้างขวางคุณอาจเฉลี่ยน้อยกว่าหนึ่ง ในกรณีที่การจัดรูปแบบดิสก์อาร์เรย์ในเลย์เอาต์ (ดูด้านล่าง) คุณจะได้รับจำนวนสูงสุดหนึ่งสไทรป์อ่านต่อการปฏิวัติของดิสก์ในสถานการณ์ส่วนใหญ่และ (ขึ้นอยู่กับตัวควบคุม RAID) อาจน้อยกว่าหนึ่งโดยเฉลี่ย
ไดรฟ์ขนาด 7200 RPM 1TB น่าจะเร็วพอสำหรับ I / O ตามลำดับ อาร์เรย์ของดิสก์ที่จัดรูปแบบเป็นแบบสไทรพ์ (RAID-0, RAID-5, RAID-10 ฯลฯ ) โดยทั่วไปแล้วสามารถอ่านได้ที่หนึ่งแถบมากที่สุดต่อการปฏิวัติของดิสก์ ด้วยแถบ 64K ทำให้เราสามารถอ่านข้อมูล 64Kx250 = 16MB หรือต่อวินาทีจากดิสก์ 15,000 RPM สิ่งนี้ให้ปริมาณงานต่อเนื่องที่ประมาณ 220MB ต่อวินาทีบนอาเรย์ของดิสก์ 14 แผ่นซึ่งไม่เร็วเท่าไหร่บนกระดาษมากกว่า 150MB / วินาทีหรือยกมาสำหรับดิสก์ SATA 1TB รุ่นใหม่
สำหรับการสตรีมวิดีโอ (ตัวอย่าง) อาร์เรย์ของดิสก์ SATA 4 ตัวใน RAID-0 ที่มีขนาดแถบใหญ่ (คอนโทรลเลอร์ RAID บางตัวจะรองรับขนาดแถบสูงสุด 1MB) มีปริมาณงานต่อเนื่องค่อนข้างมาก ตัวอย่างนี้ในทางทฤษฎีสามารถสตรีมได้ประมาณ 480MB / วินาทีซึ่งสะดวกสบายพอที่จะทำการตัดต่อวิดีโอ HD แบบเรียลไทม์ที่ไม่มีการบีบอัด ดังนั้นเจ้าของ Mac Pros และฮาร์ดแวร์ที่คล้ายกันสามารถทำงาน HD Compiting Computing ได้ซึ่งจะต้องใช้เครื่องจักรที่มีไฟเบอร์แบบต่อพ่วงโดยตรงเพียงไม่กี่ปีที่ผ่านมา
ประโยชน์ที่แท้จริงของดิสก์อาเรย์คืองานฐานข้อมูลซึ่งมีลักษณะเป็นคำขอ I / O ขนาดเล็กกระจัดกระจายจำนวนมาก เกี่ยวกับประสิทธิภาพการทำงานของภาระงานประเภทนี้ถูก จำกัด โดยความหน่วงทางกายภาพของบิตของโลหะในดิสก์ที่ไปรอบและรอบและกลับมา การวัดนี้เรียกว่า IOPS (การดำเนินการ I / O ต่อวินาที) ดิสก์ทางกายภาพที่คุณมีมากขึ้น - โดยไม่คำนึงถึงความจุ - ยิ่งมี IOPS มากขึ้นในทางทฤษฎี IOPS เพิ่มเติมหมายถึงการทำธุรกรรมมากขึ้นต่อวินาที
ความสมบูรณ์ของข้อมูล
นอกจากนี้การกำหนดค่า RAID ส่วนใหญ่ยังให้ข้อมูลซ้ำซ้อนกับคุณซึ่งต้องใช้ดิสก์ทางกายภาพมากกว่าหนึ่งแผ่นตามคำจำกัดความ การรวมกันของรูปแบบการจัดเก็บข้อมูลที่มีความซ้ำซ้อนดังกล่าวและไดรฟ์จำนวนมากขึ้นทำให้ระบบมีความสามารถในการรองรับปริมาณงานธุรกรรมขนาดใหญ่ได้อย่างน่าเชื่อถือ
โครงสร้างพื้นฐานสำหรับดิสก์อาร์เรย์ (และ SAN ในกรณีที่รุนแรงที่สุด) ไม่ได้เป็นรายการตลาดที่แน่นอน นอกจากนี้ก็เป็นหนึ่งในบิตที่จริงๆไม่สามารถล้มเหลว การรวมกันของมาตรฐานการสร้างและปริมาณการตลาดที่น้อยลงนั้นไม่ได้ราคาถูก
ค่าใช้จ่ายในการจัดเก็บรวมรวมถึงการสำรองข้อมูล
ในทางปฏิบัติค่าใช้จ่ายที่ใหญ่ที่สุดในการรักษาข้อมูล 1TB นั้นน่าจะเป็นการสำรองและกู้คืน เทปไดรฟ์และเทป SDLT หรือ ultrium 34 ชุดสำหรับวงจรการสำรองข้อมูลและการกู้คืนแบบเต็มตาของคุณปู่อาจมีราคาสูงกว่าดิสก์อาร์เรย์ 1TB เพิ่มค่าใช้จ่ายในการจัดเก็บนอกสถานที่และเงินเดือนของลิงเทปเดี่ยวและทันใดนั้นข้อมูล 1TB ของคุณก็ไม่ถูกเลย
ค่าใช้จ่ายของดิสก์มักเป็นวิธีที่ยุติธรรมในการลดลำดับชั้นของต้นทุนการจัดเก็บข้อมูลหลัก ที่ธนาคารแห่งหนึ่งฉันมีโอกาสได้ทำงานกับที่เก็บข้อมูล SAN ซึ่งมีค่าใช้จ่ายอยู่ที่£ 900 / GB สำหรับระบบการพัฒนาและ 5,000 ปอนด์ / GB สำหรับดิสก์บนเซิร์ฟเวอร์ที่ใช้งานจริง แม้กระทั่งราคาของผู้จำหน่ายระดับองค์กรค่าใช้จ่ายทางกายภาพของดิสก์ก็เป็นเพียงเล็กน้อยเท่านั้น อีกตัวอย่างหนึ่งที่ฉันทราบว่ามีการตั้งค่าคอนฟิก (ค่อนข้าง) ของ IBM Shark SAN ที่ราคาค่อนข้างเกิน 1 ล้านปอนด์ เฉพาะที่จัดเก็บข้อมูลจริงบนอุปกรณ์นี้มีค่าใช้จ่ายประมาณ 9 ปอนด์ / กิกะไบต์หรือประมาณ 9,000 ปอนด์สำหรับพื้นที่เทียบเท่ากับ HDD 1TB สำหรับผู้ใช้ทั่วไป