ฉันจะเผาไหม้ฮาร์ดไดรฟ์ได้อย่างไร


41

Google ทำการศึกษาอย่างละเอียดมากเกี่ยวกับความล้มเหลวของฮาร์ดไดรฟ์ซึ่งพบว่าฮาร์ดไดรฟ์ส่วนสำคัญล้มเหลวภายใน 3 เดือนแรกของการใช้งานหนัก

เพื่อนร่วมงานของฉันและฉันคิดว่าเราสามารถใช้กระบวนการเบิร์นอินสำหรับฮาร์ดไดรฟ์ใหม่ของเราที่อาจช่วยให้เราปวดใจจากการเสียเวลากับฮาร์ดไดรฟ์ใหม่ที่ยังไม่ผ่านการทดสอบ แต่ก่อนที่เราจะใช้กระบวนการเบิร์นอินเราต้องการทราบข้อมูลเชิงลึกจากผู้อื่นที่มีประสบการณ์มากกว่านี้:

  • การเผาไหม้ฮาร์ดไดรฟ์สำคัญแค่ไหนก่อนที่จะเริ่มใช้งาน
  • คุณใช้กระบวนการเบิร์นอินอย่างไร
    • คุณเบิร์นฮาร์ดไดรฟ์นานเท่าใด
    • คุณใช้ซอฟต์แวร์ใดในการเขียนในไดรฟ์
  • ความเครียดเท่าไหร่สำหรับกระบวนการเบิร์นอินมากเกินไป?

แก้ไข: เนื่องจากลักษณะของธุรกิจ RAID จึงไม่สามารถใช้เวลาส่วนใหญ่ได้ เราต้องพึ่งพาไดรฟ์เดียวที่ได้รับจดหมายทั่วประเทศค่อนข้างบ่อย เราสำรองข้อมูลไดรฟ์โดยเร็วที่สุดเท่าที่จะทำได้ แต่เรายังคงพบกับความล้มเหลวที่นี่และก่อนที่เราจะมีโอกาสในการสำรองข้อมูล

UPDATE

บริษัท ของฉันใช้กระบวนการเบิร์นอินมาระยะหนึ่งแล้วและพิสูจน์แล้วว่ามีประโยชน์อย่างยิ่ง เราเขียนไดรฟ์ใหม่ทั้งหมดที่เรามีอยู่ในสต็อกทันทีทำให้เราพบข้อผิดพลาดมากมายก่อนที่การรับประกันจะหมดอายุและก่อนที่จะติดตั้งลงในระบบคอมพิวเตอร์ใหม่ มันยังพิสูจน์แล้วว่ามีประโยชน์ในการตรวจสอบว่าไดรฟ์เสีย เมื่อคอมพิวเตอร์เครื่องหนึ่งของเราเริ่มพบข้อผิดพลาดและฮาร์ดไดรฟ์เป็นผู้ต้องสงสัยหลักเราจะเรียกใช้กระบวนการเบิร์นอินใหม่บนไดรฟ์นั้นและดูข้อผิดพลาดใด ๆ เพื่อให้แน่ใจว่าไดรฟ์เป็นปัญหาจริง ๆ ก่อนเริ่มกระบวนการ RMA มันในถังขยะ

กระบวนการเบิร์นอินของเรานั้นง่าย เรามีระบบอูบุนตูที่กำหนดไว้พร้อมพอร์ต SATA จำนวนมากและเราเรียกใช้แบดบล็อคในโหมดอ่าน / เขียนด้วยการส่งผ่าน 4 ครั้งในแต่ละไดรฟ์ เพื่อให้สิ่งต่าง ๆ ง่ายขึ้นเราได้เขียนสคริปต์ที่พิมพ์คำเตือน "ข้อมูลจะถูกลบออกจากไดรฟ์ทั้งหมดของคุณ" และจากนั้นเรียกใช้ badblocks ในทุกไดรฟ์ยกเว้นไดรฟ์ระบบ


15
อยากรู้ว่าทำไมคุณถึงส่งไดรฟ์ทั่วประเทศ ดูเหมือนว่าคุณมีแนวโน้มที่จะพบกับความล้มเหลวของไดรฟ์ซึ่งเป็นผลมาจากความล้มเหลวของการสั่นสะเทือนและความผิดพลาดทั่วไปของบริการไปรษณีย์โดยสาเหตุที่การเผาไหม้ตรวจพบได้
Paperjam

6
@Lie Ryan: ฮาร์ดแวร์การจัดเก็บข้อมูลทางไปรษณีย์ยังคงเป็นวิธีที่เร็วที่สุดในการถ่ายโอนข้อมูล อินเทอร์เน็ตช้ามากและถ้าคุณต้องการผ่านเครือข่ายสถาบันและไฟร์วอลล์มันยิ่งแย่ลงไปอีก
Jonas

4
@Lie ไรอัน: ถ้าคุณกำลังจัดการกับรัฐบาลจัดข้อมูลลับSSH จะไม่ทำ โดยทั่วไปคอมพิวเตอร์ที่มีข้อมูลนั้นอาจไม่สามารถเชื่อมต่อกับอินเทอร์เน็ตสาธารณะได้ หากคุณมีข้อมูลที่ถูกจัดประเภทเป็นกิกะไบต์การถ่ายโอนไดรฟ์ที่เข้ารหัสเป็นตัวเลือกที่มีประสิทธิภาพที่สุด
benzado

3
@Lie Ryan: แน่นอน แม้จะมีการเชื่อมต่ออินเทอร์เน็ตที่รวดเร็วจริงๆคุณก็สามารถใช้งานได้หนึ่งเดือนในการส่งมอบ 7TB (และนั่นคือถ้าคุณมีความหรูหราในการควบคุมปริมาณงานและผู้รับของคุณ) ด้วย UPS จะมีขนาด 7TB ในวันถัดไป
Jonas

5
มันดีและทุกอย่างยกเว้นเมื่อคุณมีทีมมือถืออยู่บนท้องถนนเพื่อรวบรวมข้อมูลจำนวนมหาศาล หมายความว่าคุณต้องพึ่งพาโรงแรมหรือการเชื่อมต่ออินเทอร์เน็ตบนมือถือและคุณจะไม่เคยอยู่ในจุดเดียวนานกว่า 8 ชั่วโมง
Phil

คำตอบ:


36

การเผาไหม้ฮาร์ดไดรฟ์สำคัญแค่ไหนก่อนที่จะเริ่มใช้งาน

หากคุณมีการสำรองข้อมูลที่ดีและระบบความพร้อมใช้งานที่ดีก็ไม่มาก ตั้งแต่การกู้คืนจากความล้มเหลวควรจะค่อนข้างง่าย

คุณใช้กระบวนการเบิร์นอินอย่างไร คุณใช้ซอฟต์แวร์ใดในการเขียนในไดรฟ์ ความเครียดเท่าไหร่สำหรับกระบวนการเบิร์นอินมากเกินไป?

โดยทั่วไปฉันจะเรียกใช้badblocksกับไดรฟ์หรือระบบใหม่เมื่อฉันได้รับ ฉันจะเรียกใช้เมื่อใดก็ตามที่ฉันฟื้นคอมพิวเตอร์จากกองอะไหล่ คำสั่งเช่นนี้ ( badblocks -c 2048 -sw /dev/sde) จะเขียนไปยังบล็อกทุก ๆ 4 ครั้งในแต่ละครั้งด้วยรูปแบบที่แตกต่างกัน (0xaa, 0x55, 0xff, 0x00) การทดสอบนี้ไม่ได้ทำอะไรเพื่อทดสอบการอ่าน / เขียนแบบสุ่มจำนวนมาก แต่ควรพิสูจน์ว่าทุก ๆ บล็อกสามารถเขียนและอ่านได้

คุณสามารถเรียกใช้bonnie ++หรือiometerซึ่งเป็นเครื่องมือเปรียบเทียบ สิ่งเหล่านี้ควรพยายามทำให้ไดรฟ์ของคุณเครียด ไดรฟ์ไม่ควรล้มเหลวแม้ว่าคุณจะพยายามใช้ให้เกิดประโยชน์สูงสุด ดังนั้นคุณอาจลองดูว่าพวกเขาสามารถทำอะไรได้บ้าง ฉันไม่ทำเช่นนี้แม้ว่า การได้รับมาตรฐาน I / O ของระบบจัดเก็บข้อมูลของคุณ ณ เวลาติดตั้ง / การตั้งค่าอาจมีประโยชน์มากในอนาคตเมื่อคุณกำลังดูปัญหาด้านประสิทธิภาพ

คุณเบิร์นฮาร์ดไดรฟ์นานเท่าใด

การทำงานของแบดบล๊อกครั้งเดียวเพียงพอในความคิดของฉัน แต่ฉันเชื่อว่าฉันมีระบบสำรองข้อมูลที่แข็งแกร่งมากและความต้องการ HA ของฉันก็ไม่สูงมาก ฉันสามารถจ่ายเงินได้เพื่อหยุดการให้บริการในระบบส่วนใหญ่ที่ฉันสนับสนุน หากคุณเป็นห่วงคุณคิดว่าอาจจำเป็นต้องมีการตั้งค่าแบบมัลติพาสคุณอาจมี RAID การสำรองข้อมูลที่ดีและการตั้งค่า HA ที่ดีอยู่แล้ว

หากฉันรีบร้อนฉันอาจข้ามแผลไหม้ได้ สำเนาสำรองของฉันและ RAID ควรใช้ได้


49

IMNSHO คุณไม่ควรพึ่งพากระบวนการเบิร์นอินเพื่อกำจัดไดรฟ์ที่ไม่ดีและ "ปกป้อง" ข้อมูลของคุณ การพัฒนาขั้นตอนนี้และการนำไปใช้จะใช้เวลานานกว่าที่จะสามารถใช้งานได้ดีกว่าที่อื่นและแม้ว่าไดรฟ์จะผ่านการเบิร์นอิน

คุณควรใช้ RAID และการสำรองข้อมูลเพื่อปกป้องข้อมูลของคุณ เมื่ออยู่ในตำแหน่งแล้วให้มันกังวลเกี่ยวกับไดรฟ์ ตัวควบคุม RAID ที่ดีและระบบย่อยของหน่วยเก็บข้อมูลจะมีกระบวนการ 'ขัดถู' ที่ผ่านข้อมูลทุก ๆ ครั้งและทำให้แน่ใจว่าทุกอย่างดี

เมื่อทุกอย่างได้รับการดูแลแล้วก็ไม่จำเป็นต้องทำการขัดดิสก์อีกต่อไป แต่อย่างที่คนอื่น ๆ พูดไปแล้วว่ามันไม่เจ็บเลยที่จะทำการทดสอบโหลดระบบเพื่อให้แน่ใจว่าทุกอย่างทำงานได้ตามที่คุณคาดหวัง ฉันจะไม่กังวลเกี่ยวกับดิสก์ส่วนบุคคลเลย


ดังที่ได้กล่าวไว้ในความคิดเห็นมันไม่สมเหตุสมผลในการใช้ฮาร์ดไดรฟ์สำหรับกรณีการใช้งานเฉพาะของคุณ การจัดส่งสินค้าเหล่านั้นมีแนวโน้มที่จะทำให้เกิดข้อผิดพลาดของข้อมูลที่จะไม่เกิดขึ้นเมื่อคุณเบิร์นอิน

สื่อเทปถูกออกแบบมาเพื่อส่งมอบ คุณสามารถรับ 250MBps (หรือบีบอัดได้มากถึง 650MBps) ด้วยไดรฟ์ IBM TS1140 หนึ่งอันซึ่งควรเร็วกว่าฮาร์ดไดรฟ์ของคุณ และใหญ่กว่าเช่นกัน - ตลับเดียวสามารถให้คุณมากถึง 4TB (ไม่บีบอัด)

หากคุณไม่ต้องการใช้เทปให้ใช้ SSD พวกเขาสามารถปฏิบัติได้ไกลกว่าฮาร์ดไดรฟ์และตอบสนองความต้องการทั้งหมดที่คุณให้มา


ท้ายที่สุดนี่คือคำตอบสำหรับคำถามของคุณ:

  • การเผาไหม้ฮาร์ดไดรฟ์สำคัญแค่ไหนก่อนที่จะเริ่มใช้งาน
    ไม่ใช่เลย.
  • คุณใช้กระบวนการเบิร์นอินอย่างไร
    • คุณเบิร์นฮาร์ดไดรฟ์นานเท่าใด
      หนึ่งหรือสองวิ่ง
    • คุณใช้ซอฟต์แวร์ใดในการเขียนในไดรฟ์
      ใช้งานง่ายพูดshredและbadblocksจะทำ ตรวจสอบข้อมูล SMART ในภายหลัง
  • ความเครียดเท่าไหร่สำหรับกระบวนการเบิร์นอินมากเกินไป?
    ไม่มีความเครียดมากเกินไป คุณควรจะโยนอะไรลงในดิสก์โดยไม่ทำให้มันระเบิด

1
สิ่งเดียวที่ฉันเสียใจเกี่ยวกับโพสต์นี้คือฉันสามารถอัปโหลดได้เพียงครั้งเดียว @ ฟิลคุณกำลังคิดค้นวงล้อใหม่ที่นั่น วิธีที่จะทำให้แน่ใจว่าคุณจะไม่สูญเสียข้อมูลไปที่ความล้มเหลวของไดรฟ์แบบสุ่ม (หรือฮาร์ดแวร์อื่น ๆ ที่เกี่ยวข้อง) คือการสำรองข้อมูลและอาร์เรย์ RAID
Rob Moir

8
ฉันเห็นด้วยที่คุณไม่ควรเชื่อถือ แต่การเรียกใช้การสแกนกับระบบก่อนที่จะมีการผลิตได้ระบุปัญหาที่อาจเกิดขึ้นกับฉันสองสามครั้ง หากคุณไม่เร่งรีบอย่างมากการปล่อยให้คอมพิวเตอร์สแกนตัวเองหนึ่งวันหรือสองวันมักจะไม่ทำร้ายอะไรเลย
Zoredache

7
คำตอบนี้มีคะแนนโหวตสูงสุด แต่ไม่สามารถตอบคำถามได้มากที่สุด OP ระบุว่า RAID เป็นไปไม่ได้ หาก "ไดรฟ์เดี่ยวกำลังได้รับการจัดส่งทางไปรษณีย์ทั่วประเทศ" จะไม่สามารถสร้างการโจมตีได้ มีกระบวนการสำรองข้อมูลอยู่ แต่ดูเหมือนว่า OP ต้องการหาอะไรและทุกอย่างเพื่อช่วยประหยัดเวลาในกรณีที่ไดรฟ์เสีย (หมายเหตุ: ฉันทำงานที่ บริษัท เดียวกับ OP ดังนั้นฉันจึงรู้สถานการณ์ข้อมูลจะถูกคัดลอกไปยัง RAID ทันทีที่มีการส่งมอบ) ถ้าคุณต้องการเขียนลงในไดรฟ์สมมุติว่าคุณจะเป็นอย่างไร
jsmith

3
ในกรณีนั้นคำถามควรระบุบริบทนี้ จากสิ่งที่คุณพูดคำถามควรจะ "เราต้องส่งฮาร์ดไดรฟ์ผ่านหอยทาก / ค่าระวางเราจะทดสอบเบิร์นอินได้อย่างไรก่อนจัดส่งให้เพื่อลดความล้มเหลว" สนุกพอคำตอบก็ไม่เปลี่ยน ส่งไดรฟ์! หรือดีกว่าใช้เทป เทปถูกออกแบบมาเพื่อใช้ในลักษณะนี้ HDD ไม่ใช่ ข้อมูลเพิ่มเติมนำไปสู่คำตอบที่ต่างออกไป
MikeyB

2
เทปไม่สามารถเขียนข้อมูลเร็วเท่าฮาร์ดไดรฟ์ได้หรือไม่ 250MBps (ไม่บีบอัด) ไม่ดีพอสำหรับคุณใช่ไหม ฉันจะบอกว่ากระบวนการเบิร์นอินนั้นไม่ได้ช่วยป้องกันความล้มเหลวด้วยกรณีการใช้งานของคุณ
MikeyB

8

การชี้แจงของคุณไม่เหมือนกระบวนการเบิร์นอินที่จะเป็นประโยชน์กับคุณ ไดรฟ์ล้มเหลวเป็นหลักเนื่องจากปัจจัยทางกลมักจะร้อนและการสั่นสะเทือน ไม่ใช่เพราะระเบิดเวลาที่ซ่อนอยู่ กระบวนการ "เบิร์นอิน" ทดสอบสภาพแวดล้อมการติดตั้งให้มากที่สุด เมื่อคุณย้ายสิ่งต่าง ๆ คุณจะกลับไปที่จุดเริ่มต้น

แต่นี่เป็นคำแนะนำเล็ก ๆ น้อย ๆ ที่อาจช่วยคุณได้:

โดยปกติแล้วแล็ปท็อปไดรฟ์ได้รับการออกแบบให้ทนทานต่อแรงกระแทกและการสั่นสะเทือนมากกว่าไดรฟ์เดสก์ท็อป เพื่อนของฉันที่ทำงานในร้านกู้คืนข้อมูลมักจะจัดส่งข้อมูลไปยังลูกค้าบนไดรฟ์แล็ปท็อปด้วยเหตุผลนั้น ฉันไม่เคยทดสอบข้อเท็จจริงนี้ แต่ดูเหมือนว่าจะเป็น "ความรู้ทั่วไป" ในอุตสาหกรรมที่เลือก

แฟลชไดรฟ์ (เช่นธัมบ์ไดรฟ์ USB) มีความทนทานต่อแรงกระแทกสูงสุดของสื่อใด ๆ ที่คุณพบ ควรมีโอกาสน้อยที่คุณจะสูญเสียข้อมูลระหว่างทางหากคุณใช้สื่อแฟลช

หากคุณจัดส่งไดรฟ์ Winchester ให้ทำการสแกนพื้นผิวก่อนนำไปใช้งาน หรือดีกว่าเพียงแค่อย่านำไปใช้ แต่คุณอาจต้องการกำหนดให้ไดรฟ์บางตัวเป็นไดรฟ์ "การจัดส่ง" ซึ่งจะเห็นการละเมิดทั้งหมด แต่คุณไม่ต้องพึ่งพาความถูกต้องของข้อมูล (เช่น: คัดลอกข้อมูลไปยังไดรฟ์สำหรับการจัดส่งคัดลอกออกหลังจากการจัดส่งตรวจสอบอย่างมากทั้งสองด้านของสิ่งนั้น)


"เมื่อคุณย้ายสิ่งต่าง ๆ คุณจะกลับสู่จุดเริ่มต้น" - ไม่จริง. นี่คือลักษณะกราฟ MTTF สำหรับดิสก์: cs.cmu.edu/~bianca/fast/img13.png cs.ucla.edu/classes/spring09/cs111/scribe/16/…การทดสอบในช่วงแรกสามารถกรองได้ จากไดรฟ์ที่มีปัญหามากมายผู้ผลิตทำการทดสอบความเครียดเหล่านี้เพื่อให้ผลิตภัณฑ์มีความน่าเชื่อถือมากขึ้น แต่แน่นอนว่ามันไม่ประหยัดที่จะทำการทดสอบจนกว่ากราฟจะแผ่ออกมา
Karoly Horvath

3
@ yi_h: ฉันคิดว่า tylerl อาจหมายความว่าสาเหตุของความล้มเหลวในช่วงต้นอาจเกิดจากกระบวนการจัดส่งเอง (ซึ่งไม่น่าเป็นไปได้ฉันอยากเห็นกราฟแสดงความล้มเหลวของไดรฟ์เทียบกับความถี่ในการส่งจดหมาย) ดังนั้นหากคุณจัดส่งฮาร์ดไดรฟ์ ทั่วประเทศจากนั้น MTTF จะรีเซ็ต; ดังนั้นถ้าคุณส่งไดรฟ์ทุก ๆ สามเดือนคุณจะอยู่ในเขตล้มเหลวก่อนเสมอ
Lie Ryan

5

กระบวนการของคุณผิด คุณควรใช้อาร์เรย์ RAID ที่ทำงานของฉันเราได้สร้างอาร์เรย์การโจมตีที่ทนทานซึ่งออกแบบมาเพื่อการเคลื่อนย้ายไปรอบ ๆ มันไม่ใช่วิทยาศาสตร์จรวด การติดตั้งไดรฟ์แบบช็อตในตู้ขนาดใหญ่ที่มีตัวแยกการสั่นสะเทือนของยางขนาดใหญ่ (ไดรฟ์กลุ่มดาวหาง Seagate เป็นตัวอย่างที่ได้รับการจัดอันดับสำหรับช็อต 300G แต่มีการสั่นสะเทือน 2G เท่านั้นไม่ทำงาน: ดังนั้นกรณีการจัดส่งต้องสั่นสะเทือนแยกไดรฟ์http://www.novibes.com/Products&productID=62หรือhttp : //www.novibes.com/Products&productId=49 [ตอนที่ 50178]

อย่างไรก็ตามคุณต้องการเผาไหม้ในฮาร์ดไดรฟ์ทดสอบจริง ๆ

ฉันทำงานกับระบบต่าง ๆ เช่นฮาร์ดไดรฟ์และเขียนปัญหาบางอย่าง แต่ ...

สำหรับการทดสอบวงจรชีวิตของ PCB ที่เร่งความเร็วเพื่อขจัดข้อผิดพลาดจะไม่มีอะไรเต้นรอบร้อน / เย็น (การใช้วงจรร้อน - เย็นทำงานได้ดีกว่า ... แต่มันยากสำหรับคุณที่จะทำโดยเฉพาะกับธนาคาร HDD)

ทำให้ตัวเองเป็นห้องด้านสิ่งแวดล้อมที่ใหญ่พอสำหรับจำนวนไดรฟ์ที่คุณได้รับในแต่ละครั้ง (อันนี้ค่อนข้างแพงมันถูกกว่าที่จะจัดส่งเรย์อาร์เรย์ไปรอบ ๆ ) คุณไม่สามารถอ่านในห้องทดสอบได้คุณจะต้องควบคุมความชื้นและทางลาดที่ตั้งโปรแกรมได้

ตั้งโปรแกรมในทางลาดที่มีอุณหภูมิซ้ำสองครั้งจนถึงอุณหภูมิหน่วยความจำต่ำสุดจนถึงอุณหภูมิหน่วยความจำสูงสุดทำให้ทางลาดชันสูงพอที่จะทำให้วิศวกรแอพพลิเคชั่นเสียผู้ผลิตฮาร์ดไดรฟ์ของคุณ 3 รอบร้อนเย็นใน 12 ชั่วโมงควรเห็นไดรฟ์ล้มเหลวอย่างรวดเร็วสวย เรียกใช้ไดรฟ์อย่างน้อย 12 ชั่วโมงเช่นนี้ หากทำงานหลังจากนั้นฉันจะแปลกใจ

ฉันไม่ได้คิดแบบนี้: สถานที่แห่งหนึ่งที่ฉันทำงานเรามีวิศวกรการผลิตทำสิ่งนี้เพื่อรับผลิตภัณฑ์เพิ่มเติมที่มาพร้อมกับอุปกรณ์ทดสอบเดียวกันมีข้อผิดพลาดมากมายในการทดสอบ แต่ความตายจากอัตราการมาถึงก็ลดลง ศูนย์.


5

ฉันไม่เห็นด้วยกับคำตอบทั้งหมดที่พูดโดยทั่วไปว่า "อย่ากังวลกับการเบิร์นอินมีการสำรองข้อมูลที่ดี"

ในขณะที่คุณควรมีการสำรองข้อมูลอยู่เสมอฉันใช้เวลา 9 ชั่วโมงเมื่อวานนี้ (อยู่เหนือการเปลี่ยนแปลง 10 ชั่วโมงตามปกติ) การกู้คืนจากข้อมูลสำรองเนื่องจากระบบกำลังทำงานกับไดรฟ์ที่ไม่ได้ถูกเผา

มี 6 ไดรฟ์ในการกำหนดค่า RAIDZ2 (ZFS เทียบเท่ากับ RAID-6) และเรามีไดรฟ์ 3 ตัวตายในช่วงเวลา 18 ชั่วโมงบนกล่องที่ใช้งานมานานประมาณ 45 วัน

ทางออกที่ดีที่สุดที่ฉันพบคือซื้อไดรฟ์จากผู้ผลิตรายใดรายหนึ่ง (ไม่มิกซ์แอนด์แมตช์) จากนั้นเรียกใช้เครื่องมือที่มีให้เพื่อใช้งานไดรฟ์

ในกรณีของเราเราซื้อ Western Digital และใช้การวินิจฉัยไดรฟ์ที่ใช้ DOS จาก ISO ที่สามารถบู๊ตได้ เราเริ่มต้นขึ้นเรียกใช้ตัวเลือกในการเขียนขยะแบบสุ่มไปยังดิสก์ทั้งหมดจากนั้นเรียกใช้การทดสอบ SMART แบบสั้นตามด้วยการทดสอบ SMART แบบยาว ซึ่งเพียงพอที่จะกำจัดส่วนที่ไม่ดีทั้งหมด reallocations อ่าน / เขียน ฯลฯ ...

ฉันยังคงพยายามหาวิธีที่ดีในการ 'batch' เพื่อให้สามารถเรียกใช้กับ 8 ไดรฟ์ในเวลาเดียวกัน อาจใช้ 'dd if = / dev / urandom ของ = / dev / ก็ตามใน Linux หรือ' badblocks '

แก้ไข: ฉันพบวิธีที่ดีกว่าในการ 'แบทช์' มัน ในที่สุดฉันก็เริ่มตั้งค่าเซิร์ฟเวอร์การบูต PXE บนเครือข่ายของเราเพื่อตอบสนองความต้องการเฉพาะและสังเกตว่า Ultimate Boot CD สามารถบูต PXE ได้ ขณะนี้เรามีเครื่องขยะจำนวนหนึ่งนั่งอยู่รอบ ๆ ซึ่งสามารถบูตด้วย PXE เพื่อเรียกใช้การวินิจฉัยไดรฟ์


3
คุณรู้อะไร? คำตอบที่ตอบคำถามและไม่ได้เทศนาที่ OP +1
elBradford

3
หากคุณต้องการให้ข้อมูลแบบสุ่มเขียนลงในไดรฟ์อย่าอ่านจาก / dev / urandom มันไม่ช้าเท่ากับการบล็อกลูกพี่ลูกน้อง / dev / สุ่ม แต่มันยังช้าและมันไม่ได้อะไรเลย ให้ตั้งค่าการจับคู่ dm-crypt ธรรมดาด้วยคีย์สุ่ม (ซึ่งคุณสามารถรับจาก / dev / urandom หรือ / dev / random) จากนั้นเพียงแค่ dd / dev / ศูนย์ลงในอุปกรณ์ที่แมป มันอาจจะเป็นที่ใดก็ได้ระหว่างสองครั้งที่รวดเร็วและลำดับความสำคัญเร็วขึ้น gitlab.com/cryptsetup/cryptsetup/wikis/FrequentlyAskedQuestions "ฉันจะล้างอุปกรณ์ด้วยการสุ่มระดับ crypto ได้อย่างไร" มีตัวอย่างของวิธีการทำเช่นนั้น
CVn

ข้อเสนอแนะที่ยอดเยี่ยม @ MichaelKjörling
Aaron C. de Bruyn

3

การเผาไหม้ฮาร์ดไดรฟ์สำคัญแค่ไหนก่อนที่จะเริ่มใช้งาน

มันขึ้นอยู่กับ.
หากคุณใช้มันใน RAID ที่ให้ความซ้ำซ้อน (1, 5, 6, 10) ไม่มาก.
หากคุณใช้งาน standaolone นิดหน่อย แต่คุณดีกว่าที่จะใช้ smartd หรืออะไรที่ต้องติดตามแทนอย่างน้อยก็ในความคิดของฉัน

สิ่งนี้นำไปสู่คำตอบของฉันตามธรรมชาติต่อ " คุณจะใช้กระบวนการเบิร์นอินได้อย่างไร " - ฉันทำไม่ได้
แทนที่จะพยายามที่จะ "เบิร์นอิน" ดิสก์ฉันเรียกใช้พวกเขาเป็นคู่ที่ซ้ำซ้อนและใช้การตรวจสอบแบบคาดการณ์ล่วงหน้า (เช่น SMART) เพื่อบอกฉันเมื่อไดรฟ์สกปรก ฉันพบว่าเวลาพิเศษที่ต้องใช้ในการเบิร์นอิน (การออกกำลังกายทั้งดิสก์จริงๆ) มีราคาแพงกว่าการจัดการกับความล้มเหลวของดิสก์และการสลับออก
การรวม RAID และการสำรองข้อมูลที่ดีของคุณควรมีความปลอดภัยมากแม้ในขณะที่ต้องรับมือกับการเสียชีวิตของทารก


1
จะทำอย่างไรถ้าไม่สามารถตรวจสอบไดรฟ์ได้เนื่องจากอยู่ในตำแหน่งที่ไม่คงที่? :)
jsmith

2
@jsmith - จากนั้นให้คุณส่งการแจ้งเตือนแทนที่จะโพลจากโฮสต์การตรวจสอบ - เกือบจะไม่มีสถานการณ์ที่คุณไม่สามารถตรวจสอบบางสิ่งบางอย่างได้อย่างแท้จริงมีเพียงสิ่งที่ต้องใช้ความคิดสร้างสรรค์เล็กน้อย :)
voretaq7

2

Spinrite (grc.com) จะอ่านและเขียนข้อมูลทั้งหมดในไดรฟ์ เป็นสิ่งที่ดีที่จะทำกับไดรฟ์ใหม่แม้ว่าคุณจะไม่ได้พยายามทำให้มันล้มเหลวก็ตาม ใช้เวลานานในการรันที่ระดับ 4 ซึ่งโดยปกติจะใช้เวลาสองสามวันสำหรับไดรฟ์ขนาดปัจจุบัน ฉันควรเพิ่มว่ามันไม่เป็นอันตราย ในความเป็นจริงหากมีข้อมูลในจุดที่ไม่ดีมันจะย้ายและกู้คืน แน่นอนว่าคุณจะไม่มีวันใช้งานบน SSD


1

ฉันแน่ใจว่าการเปรียบเทียบและการตรวจสอบข้อผิดพลาดสัปดาห์ละครั้งจะเพียงพอในฮาร์ดไดรฟ์ "เบิร์นที่" แม้ว่าตั้งแต่โพสต์ของคุณฉันไม่เคยได้ยินเรื่องแบบนี้มาก่อน

ยกมาจาก "6_6_6" บน Stroagereview.com

1. Connect the drive to a running system. Read SMART values.

2. Do a SMART short self test. Do a SMART long self-test.

3. Zero fill / Wipe the drive with the manufacturer's utility. Entire drive.

4. Run HDTach full read/write. Everest / Sandra, etc all have stress tests. Run hard drive part continously for hours.

5. Run Victoria for Windows Read/Write test and make sure no slow sectors.

6. Drop to DOS. Run MHDD, run a LBA test and see check for slow sectors. Run Read/Write/Verify test. Run drive internal ATA secure erase command.

7. Do a full format.

8. Compare SMART values. If no anomalies, all good to go. Install your OS and continue.

โดยส่วนตัวแล้วฉันคิดว่ามันเป็นความคิดที่ไม่ดี

แก้ไข: Scource: http://forums.storagereview.com/index.php/topic/27398-new-hdd-burn-in-routines/


0

อันดับแรกฉันเห็นด้วยกับโปสเตอร์อื่น ๆ ที่กรณีการใช้งานของคุณแนะนำว่าเทปไดรฟ์จะเป็นตัวเลือกที่ดีกว่า

หากไม่สามารถทำได้หากคุณต้องบินผ่านไดรฟ์ทั่วประเทศ RAID ที่แท้จริงก็ไม่ได้เป็นตัวเลือกเนื่องจากคุณจะต้องมีไดรฟ์จำนวนมากที่ถูกขนส่งเพื่อเพิ่มความเสี่ยงของความล้มเหลว อย่างไรก็ตามสิ่งที่เกี่ยวกับรูปแบบการมิเรอร์อย่างง่ายส่งไดรฟ์หนึ่งและเก็บที่อื่นที่ไซต์ต้นทาง

จากนั้นหากไดรฟ์ล้มเหลวเมื่อเดินทางมาถึงคุณสามารถสร้างและส่งสำเนาใหม่ได้ หากไดรฟ์ดีเมื่อมาถึงคุณสามารถนำอะไหล่สำรองกลับมาใช้ใหม่ไม่ว่าจะเป็นการส่งหรือสำรองข้อมูลดั้งเดิม


0

คุณไม่ได้พูดจริง ๆ ว่าเพราะเหตุใดจึงมีการส่งมอบไดรฟ์ - นี่เป็นเพียงวิธีการส่งข้อมูลมีแอพพลิเคชั่น / อิมเมจ OS ที่สมบูรณ์พร้อมสำหรับการบู๊ตในพีซีหรืออย่างอื่นหรือไม่?

ฉันเห็นด้วยกับคำตอบอื่น ๆ ที่ RAID หรือการสำรองข้อมูลดีกว่าการสแกนเนื่องจากความเสี่ยงของการจัดส่งไดรฟ์ที่ก่อให้เกิดปัญหาทางกล

วิธีทั่วไปในการวางสิ่งนี้คือ "พึ่งพาข้อมูลซ้ำซ้อนเพื่อตรวจจับและแก้ไขข้อผิดพลาด" - จัดส่งไดรฟ์ 2 ชุดสำหรับชุดข้อมูลแต่ละชุดหรือจัดส่งข้อมูลซ้ำซ้อนในไดรฟ์เดียว บางอย่างเช่นParchiveช่วยให้คุณสามารถเพิ่มระดับความซ้ำซ้อนของข้อมูลในระดับที่กำหนดการเปิดใช้การกู้คืนแม้ว่าข้อมูลส่วนใหญ่จะเสียหาย ตั้งแต่วันนี้ดิสก์มีราคาค่อนข้างถูกเพียงแค่ซื้อดิสก์ที่มีขนาดใหญ่กว่าที่ต้องการอย่างเข้มงวดมักจะถูกกว่าการสแกนไดรฟ์การจัดส่งไดรฟ์สำรองหรือการจัดส่งไดรฟ์ 2 ไดรฟ์

วิธีนี้จะช่วยป้องกันความล้มเหลวที่ไม่ใช่ความหายนะของไดรฟ์ - แต่ก็ยังดีที่สุดที่จะไม่ใช้ไดรฟ์ที่จัดส่งอีกครั้งยกเว้นการจัดส่งตามที่แนะนำไว้ก่อนหน้านี้เช่นดูเทปที่ต้องถูกแยกออก ติดตั้งและไม่ได้จัดส่งทุกที่

สิ่งนี้จะช่วยให้คุณสามารถจัดส่งข้อมูลจำนวนมาก (หรือแม้แต่อิมเมจแอปพลิเคชัน / ระบบปฏิบัติการ) และลดผลกระทบของข้อผิดพลาดของดิสก์ในระดับใดก็ตามที่ประหยัด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.