ประเด็นหลักในการหลีกเลี่ยง RAID5 กับ SSD คืออะไร


16

ความเข้าใจของฉันคือ SSD มีจำนวน จำกัด ในการเขียน RAID5 ทำการเขียนจำนวนมากเนื่องจากข้อมูลพาริตีทั่วไดรฟ์ ดังนั้นการให้เหตุผลระบุว่า RAID5 จะฆ่าและลดประสิทธิภาพของไดรฟ์ Solid State ในอัตราที่เร็วกว่า

ข้อความต่อไปนี้จากบทความนี้ทำให้ฉันคิดว่าฉันไม่เข้าใจอย่างสมบูรณ์หรืออาจไม่ถูกต้องด้วยเหตุผลข้างต้นของฉัน

ช่องสำหรับ SSD ที่มีความทนทานสูงอีกตัวอยู่ในอาร์เรย์ RAID แบบพาริตี้ SLC เนื่องจากความหน่วงในการเขียนและความทนทานที่เหนือกว่าโดยเนื้อแท้ของมันเหมาะอย่างยิ่งสำหรับการใช้งานประเภทนี้


1
คุณต้องจำไว้ว่าต้องใช้จำนวนมากในการเขียนเพื่อฆ่า SSD ... บางอย่างเช่น 1 หรือ 1.5 ล้านสำหรับ SSD ระดับผู้บริโภค
แช้ดแฮร์ริสัน

@hydroparadise ปัจจุบัน (มิถุนายน 2556, 20nm MLC) SSDs สำหรับผู้บริโภคมีระดับแฟลชประมาณ 3000 รอบการเขียน / ลบ พวกเขาไม่หยุดทำงานทันทีหลังจากการเขียนเต็ม 3000 แต่จะล้มเหลวเร็วกว่าการเขียนนับล้านครั้ง
Daniel Lawson

คำตอบ:


11

การใช้เหตุผลของคุณถูกต้องแม้ว่าคุณจะไม่มีปัญหา

Enterprise SSD นั้นถูกสร้างขึ้นด้วยเซลล์ MLC ที่มีความทนทานและสามารถทนต่อการเขียนที่สูงมาก SLC ยังคงพ่น MLC ความทนทานสูงออกจากน้ำ แต่ในกรณีส่วนใหญ่ความทนทานในการเขียนตลอดอายุของ HE-MLC เกินอายุการใช้งานที่คาดหวังของ SSD

วันนี้ความอดทนถูกระบุว่าเป็น "Lifetime Writes" บนแผ่นข้อมูลจำเพาะ

จากตัวอย่างนี้ Seagate 600 Pro SSD มีรายชื่อของสิ่งนี้ประมาณ:

Model   Endurance
100GB       220TB
200GB       520TB
400GB      1080TB

ด้วยอายุการใช้งาน 5 ปีในการเข้าถึงความทนทานที่ระบุไว้สำหรับไดรฟ์ 100GB นั้นคุณต้องเขียน 123GB ลงในไดรฟ์นั้นต่อวัน นั่นอาจน้อยเกินไปสำหรับคุณซึ่งเป็นสาเหตุที่ทำให้มีความอดทนสูงกว่าในตลาด Stec ผู้ให้บริการ OEM สำหรับผู้จำหน่ายชั้นนำบางรายมีไดรฟ์ที่ระบุไว้สำหรับ "การเขียนไดรฟ์เต็ม 10x 10 ปี" นี่คืออุปกรณ์ eMLC ทั้งหมด

ใช่ R5 มีการขยายการเขียน อย่างไรก็ตามมันไม่สำคัญสำหรับกรณีใช้งานส่วนใหญ่


มีปัญหาอื่นที่นี่เช่นกัน SSD สามารถเขียน (และอ่าน) ได้อย่างรวดเร็วจนคอขวด I / O เคลื่อนที่ไปที่คอนโทรลเลอร์ RAID นี่เป็นกรณีที่มีไดรฟ์โลหะหมุนอยู่ แต่จะถูกใส่ลงไปในแสงโดยสิ้นเชิงเมื่อ SSD มีส่วนเกี่ยวข้อง การคำนวณแบบพาริตีนั้นมีราคาแพงและคุณจะถูกกดดันอย่างหนักเพื่อให้ได้ประสิทธิภาพ I / O ของคุณจาก R5 LUN ที่สร้างขึ้นด้วย SSD


SLC, MLC, HE-MLC และ eMLC คืออะไร
mdpc

1
ขอบคุณสำหรับตัวอย่างและการให้เหตุผล มีเหตุผล. เจ้านายของฉันบอกฉันเสมอว่าไม่เคยใช้ RAID5 กับ SSD แทนที่จะใช้ RAID0, RAID1 หรือ RAID10 เพียงไม่เข้าใจเพียงพอที่จะอภิปรายอย่างเหมาะสม
Damainman

1
@Damainman เหตุผลหลักที่ไม่ใช้ R5 กับ SSD คือคุณทิ้งประสิทธิภาพไว้มากมายเมื่อคุณทำเช่นนั้น ไม่ใช่เพราะการสวมใส่สิ่งต่าง ๆ ได้เร็วขึ้น (อีกต่อไป)
sysadmin1138

1
นอกจากนี้อย่าใช้ RAID0 หากคุณใส่ใจกับข้อมูลของคุณ SSD ไม่ได้ล้มเหลวบ่อยเท่าที่เกิดสนิมขึ้น แต่ก็ล้มเหลว โหมดความล้มเหลวที่พบบ่อยที่สุดใน SSD ที่ฉันเห็นคือความล้มเหลวของคอนโทรลเลอร์ที่สมบูรณ์ในรูปแบบใดรูปแบบหนึ่งซึ่งหมายถึงการสูญเสียทั้งหมด - RAID0 ของคุณเสียแล้ว
Daniel Lawson

2
หากคุณสนใจข้อมูลของคุณให้สำรองข้อมูลไว้ RAID มีไว้เพื่อให้ทุกสิ่งที่ทำงานในระหว่างที่ดิสก์ทำงานล้มเหลว
จอห์นฮันท์

9

ฉันพบบทความวิจัย 2 เรื่องเกี่ยวกับหัวข้อนี้:

  1. การอัพเดตแบบ Parity จะเพิ่มปริมาณงานเขียนและการใช้พื้นที่

    บทนำ

    [... ] ผลลัพธ์จากแบบจำลองการวิเคราะห์ของเราแสดงให้เห็นว่า RAID5 มีความน่าเชื่อถือน้อยกว่าการสตริปด้วยอุปกรณ์จำนวนน้อยเนื่องจากการเขียนแอมพลิฟายเออร์

    ข้อสรุป

    [... ] มีการสำรวจปัจจัยต่าง ๆ เช่นจำนวนอุปกรณ์และปริมาณข้อมูลและผลลัพธ์บ่งบอกว่า RAID5 ไม่ได้รับประโยชน์อย่างกว้างขวางในการปรับปรุงความน่าเชื่อถือของระบบที่ใช้ SSD

    ที่มา: อย่าปล่อยให้ RAID Raid อายุการใช้งานของอาเรย์ SSD ของคุณ
    (เผยแพร่เมื่อ 02/2012)

  2. อายุที่เท่ากันของ SSD ทั้งหมดนั้นมีความเสี่ยงที่จะเกิดความล้มเหลวพร้อมกัน (RAID1 และ RAID6 ได้รับผลกระทบเช่นกัน!)

    บทคัดย่อ

    [... ] โซลูชันการสำรองข้อมูลเช่น RAID อาจถูกนำมาใช้เพื่อป้องกัน Bit Error Rate (BER) ของ SSD ที่มีอายุมาก แต่น่าเสียดายที่การแก้ปัญหาดังกล่าวทำให้อุปกรณ์ซ้ำซ้อนในอัตราที่ใกล้เคียงกันทำให้เกิดความล้มเหลวที่สัมพันธ์กันเมื่ออายุอาร์เรย์พร้อมเพรียงกัน [ ... ]

    5. ผลการจำลอง

    [... ] Conventional RAID-5 ทำให้ SSD ทุกรุ่นมีอายุในแบบล็อคขั้นตอนและ RAID-4 ทั่วไปนั้นทำกับอุปกรณ์ข้อมูล; เป็นผลให้ความน่าจะเป็นของการสูญเสียข้อมูลในความล้มเหลวของ SSD เพิ่มขึ้นเกือบ 1 สำหรับโซลูชั่นทั้งสองเมื่ออายุอาเรย์และรีเซ็ตเป็นระยะเกือบศูนย์เมื่อใดก็ตามที่ SSD ทั้งหมดถูกแทนที่พร้อมกัน [ ... ]

    แหล่งที่มา: ดิฟเฟอเรนเชียลที่แตกต่าง: ทบทวน RAID สำหรับ SSD ความน่าเชื่อถือ
    (เผยแพร่เมื่อ 03/2012)

    เพื่อป้องกันกระดาษนี้เสนอระดับ RAID ใหม่ที่เรียกว่าDiff-RAIDซึ่งจะสับเปลี่ยนโดยอัตโนมัติตามอายุเมื่อเปลี่ยนอุปกรณ์)

    คุณสามารถปกป้องจากสิ่งนี้ได้ด้วยการตรวจสอบตัวบ่งชี้การเสื่อมสภาพของ SSD ด้วยตนเองและการเปลี่ยนไดรฟ์เชิงรุกด้วยแผ่นดิสก์สำรองเพื่อไม่ให้แผ่นดิสก์หลายแผ่นมีอายุวิกฤตเท่ากัน


1
ว้าว. นั่นเป็นเวิร์มกระป๋อง
Patrick

7

Parity RAID จะผลักดัน SATA SSD บนเดสก์ท็อปของคุณ $ 300 มันจะไม่ได้ใส่ลงใน SSD ระดับองค์กร $ 3,000

ทุกอย่างเกี่ยวกับสิ่งที่คุณซื้อและกรณีการใช้งานของคุณคืออะไร SSD เป็นเทคโนโลยีที่โตกว่าที่เคยเป็นมา ในตอนท้ายการเขียน MTBF และแม็กซ์กำลังใกล้เคียงกับความน่าเชื่อถือเช่นเดียวกับ HDD เชิงกล

เหตุผลหนึ่งที่คุณอาจไม่ต้องการใช้ parity RAID บน SSD ก็คือคุณสามารถทำให้แบ็คเพลนหรือบัสคอนโทรลเลอร์อย่างรวดเร็วด้วยกลุ่ม RAID RAID ที่มีสมาชิกจำนวนมาก มีผลตอบแทนลดลงอย่างรวดเร็วมากด้วยความเร็วในการอ่านของ SSD ระดับสูงและแบนด์วิดท์บัส / แบ็กเพลนของคอนโทรลเลอร์ RAID ปัจจุบัน ไม่ต้องพูดถึงว่าถ้าสิ่งเหล่านี้เป็นโฮสต์ของข้อมูลที่ถูก dished ผ่านเครือข่ายอาจเป็นไปได้ทั้งหมดว่าอินเตอร์เฟสเครือข่ายของคุณจะเป็นคอขวดก่อนดิสก์ IO คือเมื่อคุณพูดถึง SSD RAID ขนาดใหญ่

โดยทั่วไปการเขียนอายุการใช้งานไม่ว่าใหญ่ของการจัดการยกเว้นกรณีที่คุณกำลังสร้างเซิร์ฟเวอร์ "" ของคุณจาก Newegg, แต่มีบางสาเหตุอื่น ๆ ที่คุณอาจจะเสียเงินใส่ลงไปในความเท่าเทียมกัน SSDs ขนาดใหญ่ชุด RAID


3
มันค่อนข้างง่ายที่จะพบปัญหาคอขวดในการรับส่งข้อมูลดิบตามลำดับเมื่อใช้ SSD แม้แต่กับตัวควบคุม RAID รุ่นล่าสุด อย่างไรก็ตามมันเป็นเรื่องยากมากที่จะตีคอขวด IO แบบสุ่ม แม้ว่าคุณจะไม่สามารถอิ่มตัว SSD ทั้งหมดของคุณตามลำดับ แต่คุณจะยังคงได้รับประสิทธิภาพที่เพิ่มขึ้นในปริมาณงานแบบสุ่ม
Daniel Lawson

1
@MDMarra ขอบคุณสำหรับการตอบกลับฉันได้อัปโหลดคำตอบของคุณเนื่องจากรายละเอียดที่ให้ไว้ :)
Damainman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.