ในช่วงสัปดาห์ที่ผ่านมาเซิร์ฟเวอร์ของฉัน (ใช้งาน Debian Jessie) ได้รีบูตเครื่องสองครั้ง ใน syslog ฉันเห็นสิ่งนี้ก่อนการรีบูตแต่ละครั้งและไม่มีประเด็นอื่น:
Aug 15 13:32:58 hoshimiya kernel: [296512.005355] {1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 1
Aug 15 13:32:58 hoshimiya kernel: [296512.005360] {1}[Hardware Error]: It has been corrected by h/w and requires no further action
Aug 15 13:32:58 hoshimiya kernel: [296512.005361] {1}[Hardware Error]: event severity: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005362] {1}[Hardware Error]: Error 0, type: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005363] {1}[Hardware Error]: fru_text: CorrectedErr
Aug 15 13:32:58 hoshimiya kernel: [296512.005364] {1}[Hardware Error]: section_type: memory error
Aug 15 13:32:58 hoshimiya kernel: [296512.005365] [Firmware Warn]: error section length is too small
googling บางอย่างทำให้ฉันเชื่อว่าสิ่งนี้จะทำอย่างไรกับ ECC RAM ของฉันที่ตรวจจับและกู้คืนจากข้อผิดพลาด ถูกต้องหรือไม่ หากกำลังกู้คืนระบบจะรีบูตทำไม ฉันต้องการป้องกันไม่ให้ระบบทำการรีบูตถ้าเป็นไปได้