ระบบค้างอย่างต่อเนื่องกับ Ryzen x1700 และ Ubuntu 18.04


2

ฉันสั่งเซิร์ฟเวอร์เฉพาะกับ AMD Ryzen x1700 ติดตั้งที่นี่ Ubuntu 18.04

Kernel is 4.15.0-29-generic

มี 2x500SSD และ 1x4000HDD ติดตั้งและใช้งานได้ RAM 64GB

root @ 159: ~ # fdisk -l

Disk /dev/sda: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0xf3b7577b

Device     Boot    Start        End   Sectors   Size Id Type
/dev/sda1           2048   67110911  67108864    32G 82 Linux swap / Solaris
/dev/sda2       67110912   68159487   1048576   512M 83 Linux
/dev/sda3       68159488 1000213167 932053680 444.4G 83 Linux


Disk /dev/sdb: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/sdc: 3.7 TiB, 4000787030016 bytes, 7814037168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes

root @ 159: ~ # ฟรี

              total        used        free      shared  buff/cache   available
Mem:       65985312     1111648    63810352       31760     1063312    64219256
Swap:      33554428           0    33554428

ระบบค้างทุกวัน 1-3 ครั้งอย่างต่อเนื่องในสัปดาห์ที่ผ่านมา ไม่มีอะไรน่าสงสัยใน syslog / dmesg ครั้งสุดท้ายที่มันเกิดขึ้นหน้าจอบันทึก (ก่อนหน้านี้ไม่มีอะไรเลย): http://prntscr.com/kjd2wl เพียงแค่หยุดและไม่สามารถเข้าถึงได้จนกว่าจะรีบูตอย่างหนัก

ฉันตรวจสอบฮาร์ดไดรฟ์ผ่าน fsck -f แล้วก็ใช้ได้

อุณหภูมิของ CPU และฮาร์ดไดรฟ์นั้นดีโดยไม่มีเซิร์ฟเวอร์ ไม่รู้จะตรวจสอบอะไรอีก ฉันได้อ่านหลายหัวข้อแล้ว แต่ไม่มีอะไรเหมือนกันกับฉันทุกหัวข้อเป็นรุ่นเก่าหรือสำหรับรุ่นเก่ากว่าของ kernel / ubuntu


1
แรมเท่าไหร่ แลกเปลี่ยนเท่าไหร่ สิ่งที่ไม่freeแสดง? วิธีแก้ปัญหาแบบเก่าอาจยังใช้งานได้หรืออย่างน้อยก็ชี้ให้คุณเห็นสิ่งต่างๆ ใหม่ Ubuntu รุ่นไม่แตกต่างจากเดิม 100%
waltinator

@waltinator เพิ่มข้อมูลในโพสต์เริ่มต้น
เจ้าของ

คำตอบ:


0

แก้ไขปัญหา. ฉันสั่งตรวจสอบฮาร์ดแวร์เต็มและ hoster ส่งความเห็นมาให้ฉัน

ลูกค้าที่รัก,

น่าเสียดายที่เซิร์ฟเวอร์ของคุณเกิดข้อผิดพลาดขณะตรวจสอบฮาร์ดแวร์ดังนั้นเราจึงตัดสินใจเปลี่ยนเซิร์ฟเวอร์ แต่เชื่อมต่อไดรฟ์เก่า

หลังจากนั้นเราตรวจสอบไดรฟ์ของคุณและเห็นว่าไดรฟ์ 4 TB ของคุณไม่ทำงานและจะไม่เริ่มทำงานอีกต่อไป ดังนั้นโปรดยืนยันการสูญเสียข้อมูลไปยังไดรฟ์

เซิร์ฟเวอร์ของคุณถูกบูทเข้าสู่ระบบช่วยเหลือแล้ว

ฉันจะพยายามทำงานกับฮาร์ดแวร์ใหม่หากยังมีปัญหาอยู่ที่นี่ฉันจะแจ้งให้ทราบ


0

หลังจาก 2 วันของการทำงานเซิร์ฟเวอร์หยุดชะงักอีกครั้งด้วยฮาร์ดไดรฟ์ใหม่ ตอนนี้พวกเขาแก้ไข BIOS และทำงานได้ 2 วันโดยไม่มีการค้าง ชนะ?


มันเคยผิดพลาดอีกครั้งหลังจาก "BIOS fix" หรือไม่?
cherouvim

1
ไม่ไม่เคย. ทำงานเกือบ 10 เดือนโดยไม่ต้องบูตเครื่องใหม่
wtfowned

คุณรู้หรือไม่ว่าพวกเขาเปลี่ยนแปลงอะไรใน BIOS? อัปเกรดเฟิร์มแวร์หรือไม่ หรืออาจปิดการใช้งาน C6 หรือ C-States?
cherouvim

ฉันขอโทษฉันไม่รู้
เจ้าของ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.