ข้อผิดพลาดของฮาร์ดแวร์ CPU ใน Ubuntu 17.04


12

ใครช่วยอธิบายสิ่งที่ฉันได้รับข้อความแสดงข้อผิดพลาดเมื่อฉันดูใน dmesg? ฉันใหม่สำหรับ Ubuntu และ Linux World

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

ฉันใช้งาน Ubuntu 17.04 พร้อมกับรหัสทั่วไปของ 4.10.0-29


หรือเป็นข้อผิดพลาดซอฟต์แวร์ฉันมีเหมือนกันในบันทึกของฉันของ Lenovo T480S ใหม่ดูbugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

คำตอบ:


8

CPU ร้อนเกินไปและเข้าสู่ MCE (เหตุการณ์ตรวจสอบเครื่อง) ... เช่น: มันหยุดทำงาน หากคุณไม่เห็นเหตุการณ์ที่เกี่ยวข้องกับอุณหภูมิอื่น ๆ ใน syslog อาจเป็นเพราะ CPU Cooler / fan / heat pipe / paste ความร้อนไม่ทำงาน

  • ตรวจสอบ syslog ด้วยterminalคำสั่งนี้...

    grep -i -e temp -e therm /var/log/syslog*
    
  • หากเครื่องสกปรก / มีฝุ่นมากอาจมีบทบาทสำคัญในการทำให้เครื่องร้อนเกินไป ทำความสะอาดออก

  • หากเครื่องของคุณมีโปรเซสเซอร์ Intel ตรวจสอบให้แน่ใจว่าintel-microcodeได้ติดตั้งแล้ว

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • ติดตั้งthermaldเพื่อลองและควบคุมอุณหภูมิ

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • ตรวจสอบเวอร์ชั่น BIOS ของคุณ ป้อน BIOS ของคุณในเวลาที่กำหนดและบันทึกรุ่น # ไปที่เว็บไซต์ของผู้ผลิตที่มียี่ห้อ / รุ่นของคอมพิวเตอร์ของคุณ ไปที่ส่วนการสนับสนุน / ดาวน์โหลดและดูว่ามี BIOS รุ่นใหม่กว่าหรือไม่

  • สุดท้ายและเป็นไปได้มากหากนี่เป็นเครื่องจักรที่เก่ากว่าสารประกอบความร้อนที่อยู่ระหว่างโปรเซสเซอร์และฮีทไปป์ / ฮีทเตอร์พัดลมจะต้องถูกนำมาใช้ใหม่ ต้องมีประสบการณ์ด้านเทคนิค


1
สิ่งที่มีผลกระทบต่อintel-micorocodeอุณหภูมิ?
gene_wood

@ gene_wood อย่างที่ฉันพูดถึงอาจเป็นปัญหาฝุ่นพัดลมหรือสารประกอบความร้อนและการตรวจสอบไมโครโค้ดเป็นอีกขั้นตอนหนึ่งในการช่วยวินิจฉัยปัญหาจากระยะไกล ไมโครโค้ดเก่าที่ใช้งานอยู่ของ CPU อาจทำให้เกิดปัญหาต่าง ๆ วินาทีในการตรวจสอบ
heynnema
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.