ข้อยกเว้นการตรวจสอบเครื่อง :
เครื่องตรวจสอบข้อยกเว้น (MCE)เป็นชนิดของการผิดพลาดของฮาร์ดแวร์คอมพิวเตอร์ที่เกิดขึ้นเมื่อหน่วยประมวลผลกลางของคอมพิวเตอร์ตรวจพบปัญหาฮาร์ดแวร์
คอมพิวเตอร์ของคุณประสบข้อผิดพลาดด้านฮาร์ดแวร์และเคอร์เนลบันทึกเหตุการณ์ในบัฟเฟอร์ คุณสามารถใช้mcelog
เพื่อบันทึกและดูเหตุการณ์การตรวจสอบเครื่อง จากmcelog
manpage :
X86 CPUs รายงานข้อผิดพลาดที่ตรวจพบโดย CPU เป็นเหตุการณ์การตรวจสอบเครื่อง (MCEs) สิ่งเหล่านี้สามารถตรวจพบความเสียหายของข้อมูลในแคชของ CPU ในหน่วยความจำหลักโดยคอนโทรลเลอร์หน่วยความจำในตัวข้อผิดพลาดในการถ่ายโอนข้อมูลบนบัสด้านหน้าหรือการเชื่อมต่อระหว่าง CPU หรือข้อผิดพลาดภายในอื่น ๆ สาเหตุที่เป็นไปได้คือรังสีคอสมิค, แหล่งจ่ายไฟที่ไม่เสถียร, ปัญหาการระบายความร้อน, ฮาร์ดแวร์ที่ชำรุด, ระบบที่ไม่มีข้อมูลหรือโชคไม่ดี
ข้อผิดพลาดส่วนใหญ่สามารถแก้ไขได้โดย CPU โดยกลไกการแก้ไขข้อผิดพลาดภายใน ข้อผิดพลาดที่ไม่ถูกแก้ไขทำให้เกิดข้อยกเว้นการตรวจสอบเครื่องซึ่งอาจฆ่ากระบวนการหรือทำให้เครื่องตกใจ ข้อผิดพลาดที่ถูกแก้ไขจำนวนเล็กน้อยมักไม่ใช่สาเหตุของความกังวล แต่จำนวนมากสามารถบ่งบอกถึงความล้มเหลวในอนาคต
เมื่อข้อผิดพลาดที่ถูกแก้ไขหรือกู้คืนเกิดขึ้นเคอร์เนล x86 จะเขียนบันทึกอธิบาย MCE ลงในบัฟเฟอร์วงแหวนภายในที่มีอยู่ผ่านอุปกรณ์ / dev / mcelog mcelog ดึงข้อผิดพลาดจาก / dev / mcelog ถอดรหัสพวกเขาในรูปแบบที่มนุษย์สามารถอ่านได้และพิมพ์พวกเขาในการส่งออกมาตรฐานหรือเลือกลงในบันทึกของระบบ
หากคุณไม่ได้สังเกตเห็นความผิดพลาดใด ๆ อาจเป็นไปได้ว่าข้อผิดพลาดนั้นได้รับการแก้ไขเรียบร้อยแล้ว ถึงกระนั้นฉันขอแนะนำให้คุณติดตั้งmcelog
เพื่อติดตามเหตุการณ์ดังกล่าว:
sudo apt-get install mcelog
/var/log/mcelog
เหตุการณ์ที่เกิดขึ้นจะได้รับการบันทึกลงใน คุณยังสามารถเรียกใช้:
sudo mcelog --client
เพื่อสอบถามmcelog
daemon สำหรับข้อผิดพลาด