คอนโทรลเลอร์ RAID มีปัญหาเรื่องความเข้ากันได้ของแบรนด์ไดรฟ์ SATA หรือไม่?


22

เราได้ต่อสู้กับคอนโทรลเลอร์ RAID ในเซิร์ฟเวอร์ฐานข้อมูลของเราLenovo ThinkServer RD120 มันเป็น Adaptec แบรนที่ Lenovo / IBM dubs ServeRAID 8k

เราได้ทำการอัพเดท ServeRAID 8k เป็นเวอร์ชั่นล่าสุดและยอดเยี่ยมที่สุดแล้ว:

  • รุ่น RAID bios
  • RAID backplane bios เวอร์ชัน
  • ไดรเวอร์ Windows Server 2008

คอนโทรลเลอร์ RAID นี้มีอัปเดต BIOS ที่สำคัญหลายตัวแม้ในช่วงเวลาสั้น ๆ 4 เดือนที่เราได้เป็นเจ้าของและประวัติการเปลี่ยนแปลงนั้นเป็นเพียงแค่ .. น่ากลัว

เราได้ลองใช้กลยุทธ์การเขียนและการเขียนบนไดรฟ์แบบลอจิคัล RAID เรายังคงได้รับข้อผิดพลาด I / O เป็นระยะ ๆ ภายใต้กิจกรรมบนฮาร์ดดิสก์ พวกเขาจะไม่ทั่วไป แต่ร้ายแรงเมื่อพวกเขาเกิดขึ้นเนื่องจากพวกเขาทำให้เกิดการหมดเวลาของ I / O SQL Server 2008 และบางครั้งความล้มเหลวของพูลการเชื่อมต่อ SQL

เราอยู่ท้ายเชือกเพื่อแก้ไขปัญหานี้ ขาดสิ่งที่ไม่ยอมใครง่ายๆเช่นการเปลี่ยนเซิร์ฟเวอร์ทั้งหมดหรือเปลี่ยนฮาร์ดแวร์ RAID เราเริ่มสิ้นหวัง

เมื่อฉันได้เซิร์ฟเวอร์ครั้งแรกฉันมีปัญหาที่ไดรฟ์เบย์ # 6 ไม่ได้รับการยอมรับ การเปลี่ยนฮาร์ดไดรฟ์ให้เป็นยี่ห้อที่แตกต่างแปลกประหลาดแก้ไขปัญหานี้ - และอัปเดต RAID BIOS (เป็นครั้งแรกในหลาย ๆ ครั้ง) แก้ไขอย่างถาวรดังนั้นฉันจึงสามารถใช้ไดรฟ์เดิม "ที่เข้ากันไม่ได้" ในช่อง 6 โหนกผมเริ่มคิดว่าฮาร์ดไดรฟ์ Western Digital SATA ที่ฉันเลือกนั้นเข้ากันไม่ได้กับคอนโทรลเลอร์ ServeRAID 8k

การซื้อฮาร์ดไดรฟ์ใหม่ 6 ตัวเป็นหนึ่งในตัวเลือกที่ถูกกว่าบนโต๊ะดังนั้นฉันจึงเลือกใช้ฮาร์ดไดรฟ์6 Hitachi (aka IBM, aka Lenovo)ภายใต้ทฤษฏีว่าตัวควบคุม RAID ของ IBM / Lenovo มีแนวโน้มที่จะทำงานกับไดรฟ์โดยทั่วไป ขายพร้อม

ดูเหมือนว่าลางสังหรณ์นั้นได้รับการจ่ายออก - เราได้ผ่านสามวันของการรับภาระที่หนักที่สุดของเรา (จันทร์, อังคาร, พุธ) โดยไม่มีข้อผิดพลาด I / O เดียวทุกชนิด ก่อนหน้านี้เรามี "เหตุการณ์" I / O อย่างน้อยหนึ่งรายการในกรอบเวลานี้ ดูเหมือนว่าการสลับแบรนด์ของฮาร์ดไดรฟ์จะแก้ไขปัญหา RAID I / O ที่ไม่ต่อเนื่องของเรา!

ในขณะที่ฉันเข้าใจว่า IBM / Lenovo อาจทดสอบตัวควบคุม RAID โดยเฉพาะกับฮาร์ดไดรฟ์ของตัวเอง แต่ฉันก็สับสนว่าตัวควบคุม RAID จะมีปัญหา I / O ที่ละเอียดอ่อนกับฮาร์ดไดรฟ์ยี่ห้อใดยี่ห้อหนึ่ง

ดังนั้นคำถามของฉันคือความเข้ากันไม่ได้ของไดรฟ์ SATA ชนิดนี้เป็นเรื่องธรรมดากับตัวควบคุม RAID หรือไม่? มีไดรฟ์บางยี่ห้อที่ทำงานได้ดีกว่าไดรฟ์อื่น ๆ หรือมีการ "ตรวจสอบ" กับตัวควบคุม RAID โดยเฉพาะหรือไม่ ฉันสันนิษฐานว่าฮาร์ดไดรฟ์ SATA สินค้าทั้งหมดเหมือนกันและจะทำงานได้ดีพอสมควรในคอนโทรลเลอร์ RAID ที่กำหนด (คุณภาพเพียงพอ)

คำตอบ:


6

ใช่ฉันพบสิ่งนี้กับการ์ดระดับล่างและไดรเวอร์ buggy อย่างไรก็ตามไม่ไม่ได้อยู่ในการ์ดที่เปลี่ยนโฉมใหม่ของ Adaptec ว้าวคือทั้งหมดที่ฉันสามารถพูดได้ สิ่งหนึ่งที่ควรพิจารณาอาจเป็นข้อผิดพลาดกับไดรฟ์มากกว่าคอนโทรลเลอร์ RAID

ฉันไม่ได้คำตอบที่ดี แต่ดูเหมือนคุณจะหมดตัวเลือกส่วนใหญ่นอกเหนือจากการเปลี่ยนการ์ด (และการเปลี่ยนไดรฟ์นั้นเป็นกลอุบาย) ต่อไปนี้เป็นแนวคิดบางประการที่คุณควรพิจารณาสำหรับการแก้ปัญหาของคุณ:

  • ไดรฟ์ WD เป็นไดรฟ์ RE (RAID Edition) ใช่ไหม การกู้คืนข้อผิดพลาดที่ จำกัด เวลาเป็นสิ่งสำคัญดังนั้นหากคุณไม่มีและไดรฟ์กำลังพยายามกู้คืนเซกเตอร์คุณจะได้หยุด looooong ชั่วคราวจากไดรฟ์ หากคอนโทรลเลอร์ RAID กำลังอดทนและไม่ปล่อยไดร์ฟคุณจะมีปัญหาใหญ่ในมือคุณ

  • ตรวจสอบข้อมูล SMART บนไดรฟ์ที่คุณลบออกและดูว่ามีสิ่งใดที่น่าสนใจ

ความคิดเห็นอื่นเกี่ยวกับความสำคัญของคุณลักษณะการกู้คืนข้อผิดพลาดแบบ จำกัด เวลา (TLER) จากการสนับสนุนผู้จำหน่าย NAS / RAID:

ดังที่ฉันพูดถึงก่อนหน้านี้เราแนะนำให้ลูกค้าใช้ไดรฟ์ระดับองค์กรเสมอหากใช้ไดรฟ์ในการตั้งค่า RAID ไดรฟ์ระดับองค์กรมีเวลาตอบสนองที่สอดคล้องกันมากขึ้นเพื่อให้ RAID ปลอดภัยยิ่งขึ้น


dunno แต่พวกเขาก็มี "เวลา RAID เฉพาะการกู้คืนข้อผิดพลาด จำกัด" ตามที่ปรากฏในรายละเอียดแท็บนี่ .. newegg.com/Product/Product.aspx?Item=N82E16822136143
Jeff Atwood

ใช่คุณมีสิ่งที่ถูกต้อง (สังเกต RE2 ที่อยู่ในชื่อเรื่อง) ซึ่งเป็นการทำลายทฤษฎีนั้นลงไป! แน่นอนฉันจะยังคงตรวจสอบข้อมูลสมาร์ทเพียงในกรณีที่ (ใช่ฉันรู้ว่ามันไม่ค่อยมีประโยชน์) ...
TorgoGuy

มันกลับกลายเป็นว่าไดรฟ์นั้นไม่สม่ำเสมอ แต่อย่างใด Brent Ozar รับมรดกไดรฟ์เก่าของเราและมีการ RMA อย่างน้อยหนึ่งของพวกเขาสำหรับ weirdnesses ..
Jeff Atwood

นอกจากนี้ยังมีการอภิปรายที่น่าสนใจเกี่ยวกับคุณสมบัติ TLER ซึ่งดูเหมือนว่าผู้ค้าบางรายมองว่าเป็นบิตซอฟต์แวร์พิเศษที่พวกเขาพลิกเพื่อให้ไดรฟ์ "enterprisey" อย่างน่าอัศจรรย์ .. fatwallet.com/forums/expired-deals/993547
Jeff Atwood

13

แม้แต่ฮาร์ดไดรฟ์บนเดสก์ท็อปธรรมดาที่ไม่ใช่ RAID การซื้อไดรฟ์จากผู้จำหน่าย (ตามมาร์กอัปที่ไร้สาระที่คาดหวัง) ก็สามารถสร้างความแตกต่างได้ ตัวอย่างเช่น Apple ระมัดระวังที่จะจัดส่งไดรฟ์ที่สามารถให้การF_FULLSYNC fcntl()ตั้งค่าสถานะของ Mac OS X ได้จริงเท่านั้นซึ่งจะช่วยให้แน่ใจได้ว่าการสำรองข้อมูลTime Machineทำงานได้อย่างน่าเชื่อถือ

นี่เป็นเดสก์ท็อปธรรมดาที่ไม่มีการใช้ RAID อะไรที่ซับซ้อนกว่านั้นและคุณต้องการซื้อแน่นอนถ้าไม่ใช่ไดรฟ์ที่มีราคาสูงเกินไปของผู้จำหน่ายดังนั้นอย่างน้อยไดรฟ์รุ่นที่คุณรู้ว่าอยู่ในรายการ "อนุมัติ" ของผู้ขาย

ดังนั้นเพื่อตอบคำถามของคุณเป็นเรื่องปกติหรือไม่ ฉันจะบอกว่าใช่ธรรมดากว่าที่คุณคิดแม้แต่ในขอบเขตขององค์กร


ฉันอยากได้รุ่นของไดรฟ์ที่ผู้ขายมักจะขายถ้าคุณจะอัพเกรดไดรฟ์แบบ DIY เพื่อลดต้นทุน ฉันขอแนะนำว่าอย่าซื้อไดรฟ์ (หรือตัวควบคุม) ระบบเพิ่งเริ่มจัดส่งด้วยดังนั้นคุณจะไม่ต้องเป็นคนที่พบข้อบกพร่อง! SATA ดูเหมือนเป็นขุยมากกว่า SAS ในส่วนนี้ด้วยเหตุผลบางอย่าง ...
คริสเอ็ดเวิร์ดส์

4

ฉันไม่คิดว่ามันเป็นเรื่องธรรมดาต่อ se อย่างไรก็ตามทันทีที่คุณเริ่มใช้ตัวควบคุมที่จัดเก็บข้อมูลองค์กรไม่ว่าจะเป็นตัวควบคุม RAID ของ SAN หรือแบบสแตนด์อโลนโดยทั่วไปคุณจะต้องปฏิบัติตามรายการความเข้ากันได้ของพวกเขาอย่างใกล้ชิด

คุณอาจประหยัดราคาสติกเกอร์ด้วยการซื้อดิสก์ราคาถูก แต่นั่นอาจเป็นหนึ่งในพื้นที่สุดท้ายที่ฉันต้องการประหยัดเงินโดยให้ความสำคัญกับข้อมูลในสถานการณ์ส่วนใหญ่

กล่าวอีกนัยหนึ่งคือความไม่ลงรอยกันอย่างชัดเจนนั้นเป็นเรื่องแปลกมาก


4

ฉันจะไม่ฝันที่จะใช้ดิสก์ SATA สำหรับเซิร์ฟเวอร์ - ไม่มีพวกเขาที่มีรอบการทำงานที่คาดหวังของไดรฟ์ที่มีคุณภาพของเซิร์ฟเวอร์และพวกเขาไม่มีชุดคำสั่งมากมายที่ SCSI / SAS มีสำหรับการตรวจสอบประสิทธิภาพและสุขภาพ เซิร์ฟเวอร์ Lenovo มีราคาถูกและยอดเยี่ยมหากคุณมีเซิร์ฟเวอร์จำนวนมากโดยที่ไม่มีสิ่งใดสำคัญ แต่มีเหตุผลที่เซิร์ฟเวอร์ 300 ซีรีส์ของ HP คิดเป็น 40% ของตลาดซึ่งทำงานได้ โดยเฉพาะอย่างยิ่งตัวควบคุมดิสก์ 'SmartArray' ไม่มีที่เปรียบในเรื่องความน่าเชื่อถือและประสิทธิภาพและการรับประกันความล้มเหลวก่อนเกิดเหตุเป็นสิ่งที่น่ายินดียิ่ง ไม่ใช่ราคาที่ถูกที่สุด แต่เวลาของคุณมีค่าเท่าไหร่? ฉันได้ซื้อเซิร์ฟเวอร์ของพวกเขา (ดี Compaq แรก tbh) มายี่สิบปีแล้วและไม่มีปัญหาใด ๆ ที่จะซื้อใหม่ 500-800 ต่อปีที่ฉันทำ ตรวจสอบพวกเขาอย่างจริงจัง


2

คำตอบเช่นเคยคือ "มันขึ้นอยู่กับ"

สำหรับพื้นที่เก็บข้อมูลระดับองค์กรบางส่วน (เช่น EMC) ผู้ขายจะมีคุณสมบัติพิเศษสำหรับไดรฟ์และแม้กระทั่งไปจนถึงการโหลดเฟิร์มแวร์ที่กำหนดเอง

อย่างที่มาร์คบอกฉันพบว่ามันดีที่สุดเมื่อคุณทำตามรายชื่อที่ได้รับอนุมัติจากผู้ขายหากมี การประหยัดต้นทุนเริ่มแรกนั้นเกินดุลตามเวลาที่พยายามไล่ตาม gremlins


จริง แต่ไดรฟ์ฮิตาชิ "พิเศษ" ของเลโนโว SATA คือ $ 250 และฉันสามารถซื้อไดรฟ์ฮิตาชิเดียวกันในราคา $ 60 นั่นคือค่าที่ต่างกันเกือบ 5 เท่าในคำอื่น ๆ .. $ 1250 เทียบกับ $ 300 ฉันยินดีที่จะทำทดลองบางอย่างสำหรับแกรนด์ ..
Jeff Atwood

ฉันรู้ว่ามาร์กอัปนั้นบางครั้งไร้สาระคุณควรเห็นราคาของไดรฟ์ EMC! แต่มันจะลดลงเรื่อย ๆ ตามมูลค่าข้อมูลของคุณ การมีที่เก็บข้อมูลที่เชื่อถือได้นั้นมีค่าใช้จ่าย $$$ Don MacAskill จาก Smugmug ได้พูดเพ้อเจ้อเกี่ยวกับ Sun 7410 และนั่นอาจเป็นสิ่งที่คุณต้องการตรวจสอบ
Jauder Ho

ฉันสงสัยว่ามีการ์ด 3ware ที่รองรับหรือไม่ ฉันมีประสบการณ์ที่ดีกับพวกเขาตลอดหลายปีที่ผ่านมา
Jauder Ho

2

คุณมีคอนโทรลเลอร์ SAS ซึ่งอาจเป็นปัญหา ในขณะที่โปรโตคอล SAS สามารถใช้ในการสั่งการทันเนล ATA การส่งสัญญาณที่ระดับฟิสิคัลจะแตกต่างกันเล็กน้อย (SAS ใช้แรงดันไฟฟ้าที่สูงกว่าและส่วนต่างที่กว้างกว่า) ตัวควบคุมเกือบทั้งหมดสามารถพูดกับไดรฟ์ SATA ได้โดยตรง แต่ถ้ามีแบ็คเพลน (ใหญ่มาก) ตรงกลางสัญญาณอาจหยุดชะงัก โดยปกติในโลกธุรกิจการติดตั้งไดรเวอร์ SATA โดยตรงกับคอนโทรลเลอร์ SAS ไม่ได้รับการสนับสนุนอย่างเป็นทางการคุณควรใช้ interposer (บอร์ดตรรกะขนาดเล็กที่เชื่อมต่อโดยตรงกับดิสก์ที่ด้านหนึ่งเข้าใจโปรโตคอล SAS แบบเต็มในอีกด้านหนึ่งพูด ATA - ด้วยวิธีนี้ backplane จะส่งสัญญาณ SAS ที่สูงกว่า)

ค่อนข้างเกี่ยวข้อง: การผสมไดรฟ์ SAS และ SATA บนแบ็คเพลนเดียวกันมีแนวโน้มที่จะล้มเหลวเนื่องจากการส่งสัญญาณของไดรฟ์ทั้งหมด (รวมถึง SAS) จะลดลงถึงระดับ SATA


1

ส่วนใหญ่อาจไดรฟ์ WD ของคุณต้องมีการอัปเดตเฟิร์มแว ดูIBM note นี้สำหรับการดาวน์โหลดและปรับใช้การอัพเดต ดังที่คุณเห็นได้จากคำแนะนำไดร์ฟ WD นั้นห่างไกลจากตัวเดียวที่มีปัญหา

หากคุณกำลังจะทำให้ไดรฟ์ของคุณอยู่ในสภาพแวดล้อมของเซิร์ฟเวอร์ที่ต้องเสียภาษีคุณจะต้องพบกับปัญหามากกว่าการกำหนดค่าเดสก์ท็อปที่ชื่นชอบทั่วไป

คุณอาจจะให้ความเห็นเกี่ยวกับสาเหตุที่คุณเลือกไปกับชุดเดสก์ท็อประดับไดรฟ์ของDeskstarแทนที่จะเป็นชุดUltrastar สำหรับคลาส Enterprise / RAID ? คุณรู้สึกว่าค่าใช้จ่ายเพิ่มเติมไม่คุ้มกับความน่าเชื่อถือและความเร็วที่เพิ่มขึ้นหรือไม่


เมื่อพูดถึงฮาร์ดไดรฟ์ฉันเชื่อในตัวเองมากมาย - ราคาถูกและเปลี่ยนได้ง่ายซึ่งประสิทธิภาพมาจากสเกล
เจฟฟ์แอด

ระวังเมื่อใช้ไดรฟ์ระดับเดสก์ท็อปกับตัวควบคุมที่เก็บข้อมูลระดับองค์กร ไดรฟ์ระดับองค์กร (ปกติ) รองรับคำสั่งและการสอบถามที่ไดรฟ์ระดับเดสก์ท็อปไม่ เซิร์ฟเวอร์องค์กรที่ฉันเคยได้รับนั้นใช้ไดรฟ์ระดับเดสก์ท็อปและพบข้อผิดพลาดบ่อยครั้งเนื่องจากคอนโทรลเลอร์พยายามรับข้อมูลอุณหภูมิและสุขภาพของไดรฟ์จากไดรฟ์ เนื่องจากตัวควบคุมองค์กรสมมติว่าคุณจะใช้ไดรฟ์ระดับองค์กรตัวควบคุมจึงไม่สามารถจัดการไดรฟ์ที่ไม่ตอบสนองต่อการสอบถามเหล่านี้ได้อย่างสง่างาม (เนื่องจากไม่ใช่การตั้งค่าที่รองรับ) มันคือ YMMV มาก
bta

0

ในฐานะวิศวกรที่ทำงานกับตัวควบคุม RAID ฉันสามารถพูดได้ว่าไม่ใช่เรื่องแปลกสำหรับไดรฟ์บางยี่ห้อที่มีปัญหากับตัวควบคุม RAID บางตัว ไดรฟ์ทุกตัวมีองค์ประกอบเฉพาะและรูปแบบไดรฟ์ที่ระบุไว้ในรายการ "อุปกรณ์ที่ใช้งานร่วมกันได้" ของคอนโทรลเลอร์จะมีองค์ประกอบที่เป็นองค์ประกอบของตัวควบคุม สำหรับรุ่นของไดรฟ์ที่จะแสดงในรายการนั้นจะต้องเป็นไปตามมาตรฐานของผู้ผลิตคอนโทรลเลอร์สำหรับประสิทธิภาพและความน่าเชื่อถือ ไดรฟ์ใด ๆ ที่ไม่อยู่ในรายการนี้อาจใช้งานได้ แต่เนื่องจากไม่ได้ผ่านการทดสอบอย่างเข้มงวดเช่นเดียวกับอุปกรณ์ "ที่ได้รับการอนุมัติ" YMMV

โดยเฉพาะอย่างยิ่งโปรโตคอล SATA ช่วยให้คำสั่งเฉพาะผู้ขาย (ไม่ได้มาตรฐาน) ที่สามารถกำหนดโดยไดรฟ์หรือตัวควบคุม ในกรณีของคุณคุณอาจเห็นตัวควบคุมที่คาดว่าไดรฟ์จะตอบสนองต่อคำสั่งกรรมสิทธิ์เฉพาะหรือไดรฟ์ที่คาดว่าจะเห็นคำสั่งกรรมสิทธิ์ที่ไม่เคยมาถึง

ความเป็นไปได้อีกอย่างหนึ่งคือไดรฟ์ที่มีปัญหาของคุณทำงานได้ไม่ดีนักภายใต้ภาระงานบางอย่างและพฤติกรรมที่คุณเห็นนั้นเพียงพอสำหรับ Adaptec / IBM ที่จะไม่แสดงรายการรุ่นของไดรฟ์ดังกล่าว

โชคไม่ดีที่โปรโตคอลการจัดเก็บ (SATA, SAS ฯลฯ ) นั้นไม่ดีเท่าอินเตอร์เฟสมาตรฐานอื่น ๆ (USB, PCI, ฯลฯ ) ที่คุณต้องมีเพียงบัสและอุปกรณ์ที่พูดภาษาเดียวกันและทุกอย่างก็ดี โดยเฉพาะอย่างยิ่งเมื่อพูดถึงอุปกรณ์ระดับองค์กรผู้ผลิตอุปกรณ์และผู้ผลิตไดรฟ์ใช้เวลาและพลังงานในการทำงานร่วมกันเป็นจำนวนมากเพื่อให้แน่ใจว่าลูกค้าจะได้รับประสิทธิภาพที่ดีที่สุดเท่าที่จะเป็นไปได้จากการกำหนดค่าที่ลูกค้าส่วนใหญ่ใช้ รายการ "อุปกรณ์ที่รองรับ") ไดรฟ์ที่ไม่อยู่ในรายชื่อนั้นอาจได้รับการออกแบบมาเพื่อให้ทำงานได้อย่างมีประสิทธิภาพสูงสุดด้วยคอนโทรลเลอร์ยี่ห้ออื่นและข้อผิดพลาดที่คุณเห็นนั้นเป็นผลข้างเคียงของการปรับให้เหมาะสม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.