RAID ทำการซิงค์อีกครั้งโดยอัตโนมัติหรือไม่

11

ฉันค่อนข้างสุ่มตรวจสอบสถานะของอาร์เรย์ RAID ของฉันด้วยcat/proc/mdstatและตระหนักว่าหนึ่งในอาร์เรย์ของฉันดูเหมือนจะทำการซิงค์อีกครั้ง:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

ทำไมสิ่งนี้และมันหมายความว่าอย่างไร ฉันดูเหมือนจะสามารถเข้าถึงจุดเมานต์ได้ดีกับr/wสิทธิ์

แก้ไข 1 (ตอบสนองต่อคำตอบของ SLM )

ฉันไม่เห็นอะไรเลยถ้าฉันgrepผ่านdmesgและ--detailสวิตช์ไม่ได้บอกอะไรฉันมากนักเช่นมันแสดงว่า resync กำลังดำเนินการอยู่ ... แต่ไม่มีคำใบ้สำหรับเหตุผลหรือสาเหตุที่ทำให้ซิงค์หายไป .. - ฉันคิดว่าฉันอาจต้องจับตามองมันก่อนที่ฉันจะเริ่มแลกเปลี่ยนฮาร์ดแวร์ของฉัน

mdadm synchronization

— stdcerr
แหล่งที่มา

10

ดูเหมือนว่าจะเป็นการบ่งชี้ว่าการซิงค์ระหว่างสมาชิก 2 คนของ RAID ไม่ได้ซิงค์กัน

1. ตรวจสอบบันทึก

ฉันจะตรวจสอบdmesgบันทึกของคุณและดูว่ามีข้อความใดที่ระบุว่า HDD จริงที่ประกอบขึ้นเป็นอาร์เรย์นี้กำลังมีฮาร์ดแวร์ล้มเหลวหรือไม่

2. ตรวจสอบ mdadm

นอกจากนี้คุณยังสามารถปรึกษาการmdadmใช้--detailสวิตช์เพื่อค้นหาข้อมูลเพิ่มเติมเกี่ยวกับ resync ดังนี้:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

หากอุปกรณ์ทั้งคู่ดูเหมือนดีและคุณไม่สามารถระบุได้ว่าอุปกรณ์ใดมีปัญหาคุณอาจต้องการเรียกใช้เครื่องมือวิเคราะห์เช่น HDAT2 หรือ SpinRite กับ HDD แต่ละตัวชั่วคราวเพื่อยืนยันสุขภาพของอุปกรณ์เหล่านั้น

3. เดินสาย

หาก HDDs ตรวจสอบแล้วฉันจะเริ่มกลั่นกรองสายเคเบิลฉันมักจะสลับเหล่านี้ออก

4. ตัวควบคุม

ฉันจะตรวจสอบตัวควบคุมต่อไปไม่ว่าจะนำไดรฟ์ออกจากระบบที่ได้รับผลกระทบและวินิจฉัยพวกเขาในระบบรองหรือเพิ่มการ์ดคอนโทรลเลอร์ของบุคคลที่สามลงในระบบที่ได้รับผลกระทบเพื่อวินิจฉัยปัญหาเพิ่มเติม

5. แหล่งจ่ายไฟ

เชื่อหรือไม่ว่าฉันเคยมีปัญหาในอดีตกับ HDD และ RAID ที่การสลับแหล่งจ่ายไฟล้มเหลวหรือกำลังจะล้มเหลวแหล่งจ่ายไฟแก้ไขปัญหาสุขภาพ RAID ของฉัน

— slm
แหล่งที่มา

@cerr - ใช่ถ้า resyncs เพิ่งเกิดขึ้นในสิ่งที่ดูเหมือนจะเป็นช่วงเวลาแบบสุ่มแล้วก็น่าจะเป็นหนึ่งใน HDDs อยู่ในทางออกหรือ 3,4 หรือ 5 การรวมตัวกันที่คุณอธิบายฉันได้เกิดขึ้น ไม่กี่ครั้งที่ตัวเองและเป็นสถานการณ์ที่แก้ไขข้อผิดพลาดเหล่านี้สำหรับฉันในอดีต

— slm

8

ตรวจสอบไฟล์ cron ของคุณ distros จำนวนมากทำการ resync ตามกำหนดเวลา / ตรวจสอบใหม่สัปดาห์ละครั้ง

บน CentOS 7.1 อยู่ใน /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

เพื่อกำหนดค่าการแก้ไขพฤติกรรม / etc / sysconfig / raid-check

— เซร์คิโอ
แหล่งที่มา

แม้ว่าปกติจะเป็นเพียงการตรวจสอบไม่ resync ...

— frostschutz

2

@frostschutz ... เว้นเสียแต่ว่าจะเป็นวันอาทิตย์แรกของเดือน: serverfault.com/a/255549/299551ในกรณีนั้น resync จะถูกบังคับ

— ด่าน

2

ใน Debian มันทำจาก:

/etc/cron.d/mdadm

วิธีปิดใช้งาน:

chmod -x /usr/share/mdadm/checkarray

ดูสิ่งนี้ด้วย.

— sanmai
แหล่งที่มา