วิธีการตรวจสอบฮาร์ดไดรฟ์ภายนอกสำหรับคุณภาพ / สุขภาพของข้อมูล


1

ไม่ทราบอะไรเกี่ยวกับฮาร์ดไดรฟ์ฉันสงสัยว่าผู้ให้บริการคลาวด์ตรวจสอบฮาร์ดไดรฟ์ของพวกเขาสำหรับปัญหา (ข้อมูลเสียหายการสูญเสียข้อมูลความล้มเหลวของฮาร์ดไดรฟ์ ฯลฯ ) การค้นหา google ไม่ได้เปิดเผยอะไรมากไปกว่า "ดาวน์โหลดชุดซ่อมผู้ผลิตฮาร์ดไดรฟ์และกดซ่อมแซม" ฉันต้องการทราบว่าเกิดอะไรขึ้นในกระบวนการซ่อมแซมและที่ดีกว่าคือวิธีที่ผู้ให้บริการคลาวด์ตรวจสอบฮาร์ดไดรฟ์เป็นประจำเพื่อตรวจสอบคุณภาพ ฉันอ่านบางที่ BackBlaze ทำการวิเคราะห์สถิติของ SMART รายวันเพื่อดูว่าฮาร์ดไดรฟ์ของพวกเขากำลังทำอะไร แต่ฉันไม่แน่ใจจริงๆว่ามันหมายถึงอะไร

เราใช้Smartmontoolsเพื่อเก็บข้อมูล SMART

repo อยู่ที่นี่แต่ฉันอยากจะรู้ว่า Smartmontools นี้กำลังทำอะไรอยู่ ไม่จำเป็นต้องมีรายละเอียด แต่เป็นโครงร่างอย่างรวดเร็ว ไม่สามารถบอกได้จาก repo จริงๆว่ามันทำอะไร

สิ่งที่ฉันคิดว่าจะเกิดขึ้น (เพื่อตรวจสอบฮาร์ดไดรฟ์) คือสิ่งนี้ สร้างฐานข้อมูลด้วย MD5 hash ของทุกไฟล์ สแกนฮาร์ดไดรฟ์ทั้งหมดเป็นระยะและทำการตรวจสอบกับทุกไฟล์กับแฮช MD5 ที่บันทึกไว้ แต่ดูเหมือนว่ามันจะช้ามากโดยเฉพาะในฮาร์ดไดรฟ์เทราไบต์ ฉันไม่แน่ใจว่าคุณมีความล้มเหลวแบบใดและการแจ้งเตือนแบบไหนที่คุณจะได้รับ บางทีคุณสามารถใช้เหตุการณ์ระบบไฟล์แต่ฉันไม่แน่ใจว่าจะทำงานกับไดรฟ์ภายนอกได้อย่างไรแทนที่จะใช้กับเครื่องหลัก แต่แม้ว่ามันจะทำงานบนฮาร์ดไดรฟ์ภายนอกฉันไม่แน่ใจว่ามันจะได้รับแจ้งเมื่อข้อมูลเกิดความเสียหายเนื่องจากอุปกรณ์เก่า ดังนั้นดูเหมือนว่าวิธีเดียวที่จะตรวจสอบว่าข้อมูลถูกต้องคือการเปรียบเทียบข้อมูลปัจจุบันกับข้อมูลเก่า แต่นอกเหนือจากการตรวจสอบฉันไม่แน่ใจจริงๆว่าวิธีที่มีประสิทธิภาพสามารถทำได้เพื่อทำ

สิ่งสำคัญที่คุณต้องการในกระบวนการตรวจสอบคือการรู้ว่าเมื่อไดรฟ์เริ่มทำงานได้ไม่ดีดังนั้นคุณจึงพร้อมที่จะเปลี่ยนแปลงได้ การซ่อมแซมไดรฟ์เป็นอีกสิ่งหนึ่งที่ฉันไม่รู้ว่ามันใช้งานได้อย่างไร แต่ฉันจะไม่ถามที่นี่ ฉันแค่อยากจะรู้ว่าคุณมักจะตรวจสอบฮาร์ดไดรฟ์ภายนอกอย่างไรและคุณรู้ได้อย่างไรว่าเมื่อใดที่เริ่มทำงานไม่ถูกต้อง (เช่นคุณรู้ได้อย่างไรว่าข้อมูลเสียหาย / สูญหายอย่างมีประสิทธิภาพและสิ่งต่าง ๆ เช่นนั้น) .

นี้ดูเหมือนว่าจะมีข้อมูลบางอย่าง

แทนที่จะเพียงแค่รู้ว่า "เพียงแค่ใช้เทคโนโลยี x" ฉันอยากจะรู้วิธีนำไปใช้จริงเช่นแอพพลิเคชั่นหรือบางสิ่งบางอย่าง


1
สิ่งหนึ่งที่ฉลาดในการตรวจสอบคือ ECC หรือจำนวนการแก้ไขข้อผิดพลาดที่กระทำโดยฮาร์ดไดรฟ์ ตอนแรกมันจะเป็น 0 แต่เมื่อฮาร์ดไดรฟ์มีอายุมากขึ้นมันจะเพิ่มขึ้นและถึงแม้จะอยู่ใน 100 ล้าน (ณ จุดนี้ไดรฟ์จะชะลอตัวลงอย่างเจ็บปวด (เชื่อฉันฉันได้สัมผัสมันด้วยมือแรก)) ECC แต่ละอันจะช้าลงรอบการอ่าน / เขียนดังนั้นความเร็วจะลดลงเมื่อเวลาผ่านไป
cybernard

คำตอบ:


0

"ฉันสงสัยว่าผู้ให้บริการคลาวด์ตรวจสอบฮาร์ดไดรฟ์ของพวกเขาสำหรับปัญหา"

พวกเขาไม่ได้จริงๆ ไดรฟ์มักจะล้มเหลวทันที คำตอบคือการสร้างระบบที่รอดพ้นจากความล้มเหลว บริการคลาวด์ขนาดใหญ่ใช้เซิร์ฟเวอร์จำนวนมากในหลาย ๆ อาคารมีเซิร์ฟเวอร์ที่ใช้อาร์เรย์ RAID ที่ทำมิร์เรอร์ (ซึ่งเก็บข้อมูลซ้ำซ้อน) และมีเซิร์ฟเวอร์ที่ทำมิเรอร์เซิร์ฟเวอร์อื่น ๆ

ตำแหน่งที่ตั้งที่ซ้ำซ้อนดังนั้นเซิร์ฟเวอร์ที่ซ้ำซ้อนไดรฟ์ที่ซ้ำซ้อนในเซิร์ฟเวอร์

Google ได้ออกการศึกษาเกี่ยวกับอัตราความล้มเหลวของดิสก์เป็นต้นและโดยทั่วไป: สมาร์ทนั้นไม่มีประโยชน์ส่วนใหญ่และความล้มเหลวของไดรฟ์จะเพิ่มขึ้นอย่างมากในเวลาประมาณ 3 ปี

รับไดรฟ์ที่สองในการผสมกระจกพวกเขา (robocopy (ส่วนหนึ่งของ windows) เป็นทางเลือกที่ดีสำหรับผู้บริโภค) และแทนที่พวกเขาทุก ๆ สามปี หากคุณสามารถรับสำเนาข้อมูลนอกสถานที่ให้ทำ

การแก้ไขไดรฟ์นั้นดีสำหรับการลบสิ่งเหล่านั้นออกไปโดยที่คุณไม่มีการสำรองข้อมูล คุณไม่สามารถเชื่อถือได้อีกต่อไปและควรทิ้งไว้ หากคุณมีการสำรองข้อมูลแบบมิเรอร์คุณเพียงแทนที่ไดรฟ์ที่ล้มเหลวในการทำมิรเรอร์ข้อมูลที่มีอยู่ลงบนมันแล้วไปต่อ

ฉันใช้อุปกรณ์ที่ใช้พลังงานต่ำเป็นเซิร์ฟเวอร์บน LAN ของฉันด้วยไดรฟ์ภายนอกที่จับคู่สองตัว (ฉันมองหาบางอย่างที่มีมูลค่าประมาณ $ 100) ฉันส่งสำเนาสำรองไปยังไดรฟ์เซิร์ฟเวอร์และเซิร์ฟเวอร์กำหนดเวลาการดำเนินการมิเรอร์ตามปกติเพื่อทำสำเนาสำรองไปยังไดรฟ์อื่น ฉันยังนึกภาพเครื่องจักรสำคัญของฉันอยู่ครู่หนึ่งเพื่อให้ฉันสามารถกู้คืนการติดตั้งระบบปฏิบัติการได้หากจำเป็น

ฉันเปลี่ยนดิสก์ภายนอกทุก ๆ สองสามปีและมักจะเลิกขับรถออกจากกล่องหุ้มและใช้เพื่อเก็บข้อมูลที่ไม่สำคัญเช่นเกมในเครื่องหลักของฉันจนกว่าจะถึงรอบต่อไป

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.