สถานะปัจจุบัน (2016) ของ SSD ใน RAID คืออะไร


51

มีแหล่งข้อมูลออนไลน์มากมายที่พูดคุยเกี่ยวกับการใช้ไดรฟ์ SSD ในการกำหนดค่า RAID - อย่างไรก็ตามสิ่งเหล่านี้ส่วนใหญ่ย้อนหลังไปไม่กี่ปีและระบบนิเวศของ SSD นั้นเคลื่อนไหวรวดเร็วมาก - ทันทีที่เราคาดหวังการเปิดตัวผลิตภัณฑ์ "Optane" ของ Intel ในปลายปีนี้ ซึ่งจะเปลี่ยนทุกอย่าง ... อีกครั้ง

ฉันจะนำเสนอคำถามของฉันโดยยืนยันว่ามีความแตกต่างเชิงคุณภาพระหว่าง SSD ระดับผู้บริโภค (เช่น Intel 535) และ SSDs ระดับศูนย์ข้อมูล (เช่น Intel DC S3700)

ความกังวลหลักของฉันเกี่ยวข้องกับการTRIMสนับสนุนในสถานการณ์ RAID เพื่อความเข้าใจของฉันแม้ว่าจะมีมากกว่า 6 ปีแล้วที่ SSD ถูกนำมาใช้ในคอมพิวเตอร์ระดับผู้บริโภคและ 4 ปีนับตั้งแต่ NVMe มีวางจำหน่ายทั่วไป - คอนโทรลเลอร์ RAID ในปัจจุบันยังคงไม่รองรับการออกTRIMคำสั่งไปยัง SSD ที่เชื่อมต่อยกเว้นตัวควบคุม RAID ของ Intel ในโหมด RAID-0

ฉันประหลาดใจที่ไม่มีTRIMการสนับสนุนในโหมด RAID-1 เนื่องจากวิธีการที่ไดรฟ์สะท้อนซึ่งกันและกันดูเหมือนว่าตรงไปตรงมา แต่ฉันเชือนแช

ฉันทราบว่าถ้าคุณต้องการความผิดพลาดกับดิสก์ (ทั้ง HDD และ SSD) คุณจะใช้มันในการกำหนดค่า RAID - แต่เนื่องจาก SSD จะไม่มี TRIM หมายความว่าพวกเขาจะได้รับการเขียนเพิ่มซึ่งส่งผลให้เกิดการสึกหรอเพิ่มเติมซึ่ง ในทางกลับกันจะทำให้ SSD ล้มเหลวก่อนกำหนด - นี่คือการประชดโชคร้าย: ระบบที่ออกแบบมาเพื่อป้องกันความล้มเหลวของไดรฟ์อาจสิ้นสุดลงโดยตรงส่งผลให้มัน

ดังนั้น:

  1. คือTRIMการสนับสนุนที่จำเป็นสำหรับการที่ทันสมัย (2015-2016 ยุค) SSDs?

    1.1 ความต้องการการTRIMสนับสนุนระหว่าง SSD, SATA-Express และ NVMe นั้นแตกต่างกันหรือไม่?

  2. บ่อยครั้งที่โฆษณาไดรฟ์ว่ามีการปรับปรุงการรวบรวมขยะในตัว ไม่ยกเลิกความต้องการTRIM? กระบวนการ GC ของพวกเขาทำงานในสภาพแวดล้อม RAID ได้อย่างไร

    1.1 ตัวอย่างเช่นดู QA นี้ตั้งแต่ปี 2010 ซึ่งอธิบายถึงการเสื่อมประสิทธิภาพที่ไม่ดีนักเนื่องจากไม่ใช่ -Trimming ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) และสิ่งนี้ บทความจากปี 2558 ทำให้เป็นกรณีที่แนะนำให้ใช้ TRIM ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim) - ขวา / ) การตอบสนองของคุณเพื่อการขัดแย้งที่แข็งแกร่งเหล่านี้สำหรับความจำเป็นของการคืออะไรTRIM?

  3. บทความและการสนทนาจำนวนมากจากปีก่อนหน้าเกี่ยวข้องกับ SLC vs MLC แฟลชและ SLC เป็นที่นิยมมากกว่าเนื่องจากอายุการใช้งานที่ยาวนานกว่ามาก - อย่างไรก็ตามดูเหมือนว่า SSD ทั้งหมดในวันนี้ (ไม่ว่าพวกเขาจะนั่งอยู่ที่ใด วันนี้ - ความแตกต่างของความเกี่ยวข้องนี้อีกต่อไปหรือไม่

    1.1 แล้วแฟลช TLC ล่ะ?

  4. Enterprise SSD นั้นมีความทนทาน / ขีด จำกัด การเขียนสูงกว่ามาก (มักวัดจากจำนวนครั้งที่คุณสามารถเขียนทับไดรฟ์ได้อย่างสมบูรณ์ในหนึ่งวันตลอดอายุการใช้งาน 5 ปีของไดรฟ์) - หากขีด จำกัด การเขียนรอบสูงมาก (เช่น การเขียนที่สมบูรณ์ 100 ฉบับต่อวัน) หมายความว่าพวกเขาไม่ต้องการTRIMเลยเพราะข้อ จำกัด เหล่านั้นสูงมากหรือ - ตรงกันข้าม - ข้อ จำกัด เหล่านั้นสามารถทำได้โดยการใช้เท่านั้นTRIM?


6
ในขณะที่ฉันไม่สามารถตอบคำถามของคุณฉันคิดว่ามันควรได้รับการพิจารณาในความจริงที่ว่าอุตสาหกรรมของเราพยายามอย่างดีที่สุดที่จะกำจัด RAID RAID ที่เป็นกรรมสิทธิ์ แต่ผู้ให้บริการคลาวด์สาธารณะทั้งหมดใช้ SSD ตอนนี้ในการคำนวณและบริการจัดเก็บข้อมูล ด้วยซอฟต์แวร์การลบรหัส ฯลฯ นวัตกรรมการประมวลผลแบบคลาวด์ได้เปิดเผยสิ่งต่าง ๆ เช่นฮาร์ดแวร์ RAID, Cisco IOS และเครือข่ายพื้นที่เก็บข้อมูลที่เป็นกรรมสิทธิ์ซึ่งเป็นสินค้าไร้จุดหมายที่ผ่านกระบวนการหมักที่ด้านบนสุดของห่วงโซ่อาหารและขัดขวางนวัตกรรมจริง ๆ ฮาร์ดแวร์ RAID ไม่สามารถขายได้ในระดับ (ถึง AWS, Azure, CERN) ดังนั้น ....
Sum1sAdmin

@ Sum1s ระบุว่าผู้ให้บริการคลาวด์สาธารณะทั้งหมดใช้ SSD ในการคำนวณและบริการจัดเก็บคุณกำลังบอกว่า AWS หรือ BlackBlaze จัดเก็บข้อมูลบน SSD เท่านั้นหรือไม่
อัล

@ ไม่ดีฉันแค่ชี้ให้เห็นว่าข้อเสนอ SSD สำหรับบล็อกไฟล์วัตถุและที่เก็บชั่วคราว
Sum1sAdmin

ฉันไม่เห็นด้วยกับ "ความแตกต่างเชิงคุณภาพ" อย่างสมบูรณ์ระหว่างการค้าและผู้บริโภค ฉันสามารถรับประกันคุณได้ว่าไม่มีความแตกต่างในการผลิต NAND มีผู้ผลิตที่แตกต่างกันอย่างแน่นอน (Samsung vs Intel) แต่ไม่มีกระบวนการผลิตผู้บริโภคแบบพิเศษ มีความแตกต่างของคุณสมบัติอย่างแน่นอน แต่ไม่ใช่ความแตกต่างด้านคุณภาพ
Jim B

เมื่อพูดถึง Optane เราเกือบจะถึงครึ่งทางจนถึงปี 2559 และไม่มีใครเห็น ... ใครรู้ว่าข้อตกลงคืออะไร?
Jeff Meden

คำตอบ:


24

ลองตอบคำถามทีละคำถาม:

  • TRIM รองรับ SSD รุ่นใหม่ (ยุค 2558-2559) หรือไม่?

คำตอบสั้น ๆ : ในกรณีส่วนใหญ่ไม่มี คำตอบที่ยาวนาน: ถ้าคุณจองพื้นที่ว่างเพียงพอ (~ 20%) แม้กระทั่งไดรฟ์ระดับผู้บริโภคก็มักจะมีค่าความสม่ำเสมอของประสิทธิภาพที่ดีพอสมควร (แต่คุณต้องหลีกเลี่ยงไดรฟ์ที่ใช้แทน ไดรฟ์ระดับองค์กรดียิ่งขึ้นทั้งคู่เนื่องจากมีพื้นที่ว่างสูงกว่าโดยค่าเริ่มต้นและเนื่องจากคอมโบของคอนโทรลเลอร์ / เฟิร์มแวร์นั้นได้รับการปรับให้เหมาะสมกับการใช้งานไดรฟ์อย่างต่อเนื่อง ตัวอย่างเช่นลองดูที่ไดรฟ์ S3700 ที่คุณอ้างอิงถึงแม้จะไม่มีการตัดแต่ง แต่ก็มีความสอดคล้องในการเขียนที่ดีมาก

  • บ่อยครั้งที่โฆษณาไดรฟ์ว่ามีการปรับปรุงการรวบรวมขยะในตัวซึ่งไม่จำเป็นต้องใช้ TRIM หรือไม่ กระบวนการ GC ของพวกเขาทำงานอย่างไรในสภาพแวดล้อม RAID

ตัวเก็บรวบรวมขยะของไดรฟ์ทำสิ่งมหัศจรรย์ในกล่องทรายของไดรฟ์ - มันไม่ทราบอะไรเกี่ยวกับสภาพแวดล้อมภายนอก ซึ่งหมายความว่าจะไม่ได้รับผลกระทบจากระดับ RAID ของอาเรย์ ที่กล่าวว่าระดับ RAID บางระดับ (ระดับความเท่าเทียมกันโดยทั่วไป) บางครั้งสามารถ (และในการใช้งานเฉพาะบางอย่าง) เพิ่มปัจจัยการขยายการเขียนดังนั้นสิ่งนี้จะหมายถึงการทำงานที่สูงขึ้นสำหรับรูทีน GC

  • บทความและการอภิปรายจำนวนมากจากปีก่อนหน้าเกี่ยวข้องกับ SLC vs MLC แฟลชและ SLC เป็นที่นิยมมากกว่าเนื่องจากอายุการใช้งานที่ยาวนานขึ้นอย่างไรก็ตามดูเหมือนว่า SSD ทั้งหมด (ไม่ว่าพวกเขาจะนั่งอยู่ที่สเปกตรัม Consumer-to-Enterprise) คือ MLC - นี่คือความแตกต่างของความเกี่ยวข้องอีกต่อไป

ไดรฟ์ SLC นั้นได้หายไปจากองค์กรโดยส่วนใหญ่แล้วจะถูกผลักไสให้เข้าสู่การทหารและงานอุตสาหกรรม ตอนนี้องค์กรที่ทำเครื่องหมายแบ่งออกเป็นสามเกรด:

  • แฟลช HMLC / MLCe เป็นหนึ่งเดียวกับชิป MLC binned ที่ดีกว่าและได้รับการรับรองเพื่อรักษารอบการเขียนใหม่อย่างน้อย 25,000/30000 รอบ
  • ชิป 3D MLC ได้รับการจัดอันดับที่ประมาณ 5,000-10,000 รอบการเขียนใหม่;
  • ชิประนาบ MLC ปกติและ 3D TLC ได้รับการจัดอันดับที่ประมาณ 3000 รอบการเขียนใหม่

ในความเป็นจริงแฟลชชนิดใดประเภทหนึ่งข้างต้นควรมีความสามารถในการเขียนทั้งหมดและในความเป็นจริงคุณสามารถค้นหาไดรฟ์ระดับองค์กรที่มีประเภทแฟลชด้านบนทั้งหมดได้

ความแตกต่างที่แท้จริงระหว่างองค์กรและผู้บริโภคคือ:

  • คอมโบคอนโทรลเลอร์ / เฟิร์มแวร์ที่มีไดรฟ์ระดับองค์กรยากที่จะตายเนื่องจากข้อผิดพลาดของคอนโทรลเลอร์ที่ไม่คาดคิด;
  • แคชการเขียนที่ป้องกันไฟเป็นสิ่งสำคัญอย่างยิ่งในการป้องกันความเสียหายของ Flash Translation Layer (FTL) ซึ่งถูกจัดเก็บไว้ในแฟลช

ไดรเวอร์เกรดองค์กรส่วนใหญ่จะดีกว่าเนื่องจากตัวควบคุมและตัวเก็บประจุไฟแทนที่จะเป็นแฟลชที่ดีกว่า

  • Enterprise SSD มีแนวโน้มที่จะมีความอดทน / ขีด จำกัด การเขียนสูงกว่ามาก (มักวัดจากจำนวนครั้งที่คุณสามารถเขียนทับไดรฟ์ได้อย่างสมบูรณ์ในหนึ่งวันตลอดอายุการใช้งาน 5 ปีของไดรฟ์) ซึ่งจะขจัดความกังวลใด ๆ ไม่ได้ใช้ TRIM?

ตามที่ระบุไว้ข้างต้นไดรฟ์ระดับองค์กรมีพื้นที่ว่างเริ่มต้นที่สูงขึ้นมาก (~ 20%) ซึ่งในทางกลับกันจะลดความต้องการ TRIM ปกติลงอย่างมาก

อย่างไรก็ตามโปรดพิจารณาซอฟต์แวร์ RAID บางตัวที่รองรับ TRIM (มีคนพูดว่าLinux MDRAID หรือไม่ )


เพียง 35000 รอบการเขียน?! นั่นฟังดูไม่ค่อยมากนัก ฉันคิดว่ามันสมเหตุสมผลถ้าการเปลี่ยนไดรฟ์ที่เพิ่มขึ้นนั้นถูกกว่าการซื้อความจุเดียวกันใน SLC
user253751

รอบการเขียนซ้ำขั้นต่ำที่รับประกัน 30000 นั้นไม่มีอะไรเลวร้าย: ด้วยความจุที่เพิ่มขึ้นจากสวิตช์ไปสู่ ​​NAND แบบ 2 บิตต่อเซลล์ไดรฟ์ MLC นั้นถูกกว่า SLC มากในขณะที่ยังคงความทนทานต่อระดับที่ใกล้เคียงกัน ยิ่งไปกว่านั้นวันที่เซลล์ SLC ระดับ 50 นาโนเมตรได้รับการจัดอันดับที่มากกว่า 100,000 รอบการเขียนใหม่อาจจะหมดไป: แม้แต่ไดรฟ์ระดับองค์กรก็มีแฟลชคลาส 34 / 25nm (หรือเล็กกว่า) พร้อมกับความอดทนที่ต่ำกว่า
shodanshok

@shodanshok ข้อสรุปของคุณคือ "ใช้ SSD ระดับองค์กร (SAS) ที่ต่ออยู่กับคอนโทรลเลอร์ RAID ปกติและไม่ต้องกังวลกับมัน" - และฉันจะไม่เห็นประสิทธิภาพใน 5 ปีที่ไดรฟ์รับประกันหรือไม่ และปัญหาด้านประสิทธิภาพที่บันทึกโดยผู้ใช้รายอื่นจะมีผลกับไดรฟ์ระดับผู้บริโภคเท่านั้นหรือไม่
Dai

@ ไดสำหรับไดรฟ์ "ระดับองค์กร" ฉันไม่ได้หมายถึง SAS SSD เท่านั้น แต่ยังเลือก SATA SSD ที่ถือเป็น "ระดับองค์กร" และใช่ไดรฟ์ระดับองค์กรมีความสอดคล้องด้านประสิทธิภาพที่ดีมากแม้อยู่ในสภาพเสถียร (เช่น: เต็มสมบูรณ์) สำหรับตัวอย่างของไดรฟ์ดังกล่าวให้ดูที่นี่ แม้แต่ไดรฟ์สำหรับผู้บริโภคบางตัวเมื่อรวมกับการให้การ overprovision ที่พอเหมาะก็สามารถทำได้เหมือนกัน ดูที่นี่สำหรับตัวอย่าง
shodanshok

1
Binning เป็นกระบวนการผ่านซิลิคอนชิปที่ตรวจสอบและจัดกลุ่มตามคุณภาพของพวกเขา ดังนั้นชิป MLC NAND สำหรับองค์กรจึงเป็น "ทำดีกว่า" ชิปที่ผ่านการทดสอบที่ดีกว่า
shodanshok

9

TRIM ไม่ใช่สิ่งที่ฉันกังวลเมื่อใช้ SSD กับคอนโทรลเลอร์ RAID ที่ทันสมัย SSD ได้รับการปรับปรุงคุณสมบัติการควบคุมฮาร์ดแวร์ RAID ได้รับการปรับให้เหมาะสมกับภาระงานเหล่านี้และมักจะมีการรายงานความทนทาน

TRIM ใช้สำหรับไดร์ฟ SATA ระดับล่างสุด สำหรับ SAS SSD เรามี SCSI unmap และนั่นอาจเป็นเหตุผลที่ฉันไม่ต้องการ TRIM ...

แต่ผู้วิจารณ์คนอื่น ๆ นั้นถูกต้อง Software-Defined Storage (SDS) กำลังเปลี่ยนแปลงวิธีที่เราใช้ SSD ในโซลูชั่น SDS คอนโทรลเลอร์ RAID ไม่เกี่ยวข้อง และสิ่งต่าง ๆ เช่น TRIM นั้นมีความสำคัญน้อยกว่าเพราะ SSD กำลังเติมบทบาทที่ระบุไว้ ฉันคิดว่า Nimble storage cache อ่านหรือ ZFS L2ARC และ ZIL ... พวกเขาทั้งหมดตอบสนองความต้องการเฉพาะและซอฟต์แวร์ใช้ทรัพยากรอย่างชาญฉลาดมากขึ้น


3
UNMAP และ TRIM ทำสิ่งเดียวกัน
Michael Hampton

2
จำเป็นต้องมีการตัด / unmap เสมอโดยที่คุณไม่จำเป็นต้องพึ่งพาการรวบรวมขยะภายในอย่างสมบูรณ์
Jim B

การรวบรวมขยะภายในไม่สามารถทดแทน TRIM ได้ ไม่มีฟังก์ชั่นเฟิร์มแวร์ที่สามารถแทนที่สิ่งที่ TRIM ทำ มันน่าตกใจเล็กน้อยที่คำตอบมากมายที่นี่ไม่เข้าใจว่า TRIM ทำอะไรได้จริงและทำไมจึงจำเป็น อ้างถึงบทความต่าง ๆ เช่นarstechnica.com/gadgets/2015/04/
Shiv

1

ระดับ RAID พร้อม SSD คำตอบข้างต้นแสดงให้เห็นว่าระดับ RAID ที่มีพาริตี้เช่น RAID 5 เพิ่มการขยายการเขียน มีมากกว่าหนึ่งวิธีในการตีความว่า: ผลกระทบต่อหนึ่งไดรฟ์หรือผลกระทบกับชุดของไดรฟ์

เมื่อเปรียบเทียบกับไม่มีความซ้ำซ้อน RAID 5 จะเพิ่มการเขียนลงในชุดเมื่อเพิ่มการตรวจสอบพาริตี เมื่อเปรียบเทียบกับไดรฟ์ RAID 0 (n-1) ผลกระทบต่อไดรฟ์ของอาร์เรย์ RAID 5 ที่มีไดรฟ์ n ไม่มีอะไร ไดรฟ์ n แต่ละตัวจะได้รับการเขียนจำนวนมาก RAID 5 เพิ่มการเขียนพิเศษ 1 / (n-1) ลงในชุด อย่างไรก็ตาม RAID 1 และ RAID 10 เพิ่มการเขียนพิเศษ 100% ลงในชุดเพราะทุกอย่างที่เขียนไปยัง SSD หนึ่งตัวจะถูกเขียนไปยังมิเรอร์

ดังนั้นในแง่ของการเขียนไปยังชุด RAID 5 เทียบกับชุด RAID 10 ที่มีจำนวนไดรฟ์เท่ากัน SSDs ในชุด RAID 5 จะได้รับการเขียนน้อยลง และนั่นยังคงเป็นจริงแม้ว่าคุณจะเพิ่มจำนวน SSD ในชุด RAID 10 เพื่อให้ความสามารถในการใช้งานเท่ากัน


0

shodanshok ได้สัมผัสกับคำตอบที่แท้จริงที่นี่ หากคุณจองพื้นที่เพิ่มเติม "การจัดสรรเกิน" ความอดทนของ SSD และความสอดคล้องในการเขียนของคุณจะได้รับการปรับปรุงเมื่อเวลาผ่านไปและการขาดการสนับสนุน TRIM จะไม่เกี่ยวข้องกันเป็นส่วนใหญ่ ขอสงวนพื้นที่พิเศษที่สามารถทำได้โดยเริ่มจาก SSD ใหม่โดยแบ่งพาร์ติชันน้อยกว่าความจุเต็ม คอนโทรลเลอร์ในไดรฟ์ส่วนใหญ่ปฏิบัติต่อพื้นที่ที่ไม่เคยใช้เหมือนกับพื้นที่สงวนและจึงลดการขยายการเขียนลงอย่างมาก สำหรับการบู๊ตและระบบปฏิบัติการพื้นที่สงวน 10% อาจเพียงพอ สำหรับไดรฟ์ที่เขียนซ้ำบ่อยเพิ่มพื้นที่นั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.