ข้อยกเว้นการตรวจสอบเครื่องรายงานโดยเคอร์เนล


3

ฉันสร้างคอมพิวเตอร์เครื่องใหม่:

  • Intel Core i7 4770K
  • Gigabyte Z87N-WIFI
  • ซัมซุง 840 Evo S x2 (ใน RAID 0)
  • 450w Corsair RM 80Plus
  • การระบายความร้อน Dark Rock Pro 3
  • Kingston 1600 DDR3
  • ไม่ทุ่มเท GPU

ระบบปฏิบัติการ:

  • Linux Mint 16 Petra

การตั้งค่า BIOS เป็นค่าเริ่มต้นโดยสมบูรณ์ยกเว้นการกำหนดค่า RAID ซีพียูไม่โอเวอร์คล็อกและไม่เคยมีมาตั้งแต่ซื้อมา

ประมาณ 3 ครั้งต่อวันตั้งแต่ฉันสร้างระบบมันจะผิดพลาดอย่างกะทันหันและไปที่หน้าจอสีดำว่า "Machine Check Exception ... ", ภาพด้านล่าง:

enter image description here

อุณหภูมิดูดี:

➜  ~  sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:        +27.8°C  (crit = +105.0°C)
temp2:        +29.8°C  (crit = +105.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:         +40.0°C  (high = +80.0°C, crit = +100.0°C)
Core 1:         +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 2:         +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 3:         +40.0°C  (high = +80.0°C, crit = +100.0°C)

pkg-temp-0-virtual-0
Adapter: Virtual device
temp1:        +42.0°C 

อัพเดต BIOS เป็นรุ่นล่าสุด

ใครสามารถบอกฉันว่าปัญหาอาจเกิดขึ้น?


2
ฟังดูเหมือนปัญหาฮาร์ดแวร์ CPU ทำงานมาก่อนหรือไม่ คุณตรวจสอบพินที่งอบนเมนบอร์ดหรือไม่? คุณลอง distros นอกเหนือจาก Mint 16 แล้วหรือยัง
DanteTheEgregore

ลองใช้ Linux distros เป็นจำนวนมาก: Fedora, Ubuntu และ Linux Mint ด้วย PCRE พวกเขาทั้งหมดล้มเหลวในทำนองเดียวกัน มีแนวโน้มว่าจะเป็นเมนบอร์ดที่มีข้อผิดพลาดหรือ CPU ผิดพลาดที่ทำให้เกิดข้อผิดพลาดนี้หรือไม่?
StuR

มันอาจจะเป็นความล้มเหลวของ CPU ลองดาวน์โหลด Prime95 (ไม่ต้องกังวลกับการลงทะเบียน) และทำการทดสอบแบบผสมผสาน ( mprime -m เพื่อเรียกใช้ยูทิลิตี้การตั้งค่า) เป็นเวลา 6-8 ชั่วโมง (ขั้นต่ำ 3 ครั้ง) มันจะทำงานต่อไปจนกว่าคุณจะหยุดหรือพบข้อผิดพลาด
DanteTheEgregore

อุณหภูมิ ACPI ไม่ดี เซิร์ฟเวอร์ของฉันรายงานอุณหภูมิที่แน่นอนเหล่านี้ - ตามเวลาที่กำหนด ลองใช้ดู lm_sensors.
Daniel B

คำตอบ:


2

นี่เป็นปัญหาฮาร์ดแวร์อย่างแน่นอน mcelog --ascii รายงานต่อไปนี้:

Hardware event. This is not a software error.
CPU 0 BANK 4 TSC 2d95278285f8
RIP !INEXACT! 10:ffffffff816f6570
MISC 0
TIME 1398091195 Mon Apr 21 16:39:55 2014
MCG status:RIPV MCIP
MCi status:
Uncorrected error
Error enabled
MCi_MISC register valid
Processor context corrupt
MCA: Internal unclassified error: 402
STATUS ba00000052000402 MCGSTATUS 5
CPUID Vendor Intel Family 6 Model 60
SOCKET 0 APIC 0 microcode 9

... ซึ่งน่าเสียดายที่ไม่ค่อยมีประโยชน์ อาจเป็นข้อผิดพลาดของ CPU ภายในที่ไม่มีเอกสาร ทางออกที่ดีที่สุดของคุณคือไปแลกเปลี่ยนการรับประกัน (ของ CPU ของคุณ) ถ้าเป็นไปได้


คุณพูดถูกมันเป็นซีพียูที่ผิดปกติ
StuR
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.