คำถามติดแท็ก server-crashes

5
มีคนอื่นที่ประสบปัญหาอัตรา Linux เซิร์ฟเวอร์ล่มในช่วงวันที่สองหรือไม่?
* หมายเหตุ: หากเซิร์ฟเวอร์ของคุณยังคงมีปัญหาเนื่องจากเคอร์เนลสับสนและคุณไม่สามารถรีบูทได้ - วิธีที่ง่ายที่สุดที่เสนอโดยติดตั้งวันที่ gnu บนระบบของคุณคือ: date -s now สิ่งนี้จะรีเซ็ตตัวแปร "time_was_set" ภายในของเคอร์เนลและแก้ไข CPU hogging futex ลูปใน java และเครื่องมือ userspace อื่น ๆ ฉันสั่งคำสั่งนี้ในระบบของฉันแล้วยืนยันว่ามันทำในสิ่งที่มันบอกในกระป๋อง * การชันสูตรศพ Anticlimax: สิ่งเดียวที่เสียชีวิตคือการเชื่อมโยง VPN (openvpn) ของฉันไปยังคลัสเตอร์ดังนั้นจึงมีช่วงเวลาที่น่าตื่นเต้นไม่กี่วินาทีในขณะที่สร้างขึ้นใหม่ ทุกอย่างอื่นดีและเริ่มต้นขึ้น ntp ไปอย่างหมดจดหลังจากการก้าวกระโดดครั้งที่สองผ่านไป ฉันเขียนประสบการณ์เต็มรูปแบบของวันที่http://blog.fastmail.fm/2012/07/03/a-story-of-leaping-seconds/ ถ้าคุณดูบล็อกของ Marco ที่http://my.opera.com/marcomarongiu/blog/2012/06/01/an-humble-attempt-to-work-around-the-leap-second-เขามีทางออกสำหรับ การยุติการเปลี่ยนแปลงเวลาในช่วง 24 ชั่วโมงโดยใช้ ntpd -x เพื่อหลีกเลี่ยงการข้าม 1 วินาที นี่เป็นวิธีการทางเลือกอื่นในการรันโครงสร้างพื้นฐาน ntp ของคุณเอง เพียงแค่วันนี้วันเสาร์ที่ 30 …

2
เซิร์ฟเวอร์ขัดข้องด้วยอักขระ ASCII NUL ใน syslog (^ @ ^ @ ^ @ …)
ฉันมีเซิร์ฟเวอร์เฉพาะที่โฮสต์โดย OVH (ผู้ให้บริการฝรั่งเศส) ระบบปฏิบัติการ: Ubuntu 12.04 x64 ไม่กี่เดือนที่ผ่านมาหนึ่งในเซิร์ฟเวอร์ของฉันทำงานล้มเหลว สิ่งเดียวที่แปลกคือ caracters "ASCII NUL" ใน syslog: ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ …

2
โครงสร้างการทุจริตที่สำคัญบน Windows Server 2012 R2
ฉันมีเครื่องเสมือน Windows Server 2012 R2 ใช่กับการอัปเดตทั้งหมด ซอฟต์แวร์เพิ่มเติมรวมถึง Microsoft SQL Server 2014 (เดิมเป็น 2012 บน VM ก่อนหน้า) บริษัท เว็บโฮสติ้งมี xenpci.sys (EJBPV XenPCI Driver (Checked Build), James Harper) เป็นส่วนหนึ่งของการติดตั้งเริ่มต้นบน VMs และ Plesk ทั้งหมด ระบบปฏิบัติการอาจหยุดทำงานหน้าจอสีน้ำเงินหรือบูตใหม่เป็นระยะ ๆ ฉันได้รับการถ่ายโอนข้อมูลขนาดเล็ก แต่ไม่ใช่ตลอดเวลา ปัญหาปกติคือ: ข้อผิดพลาด: CRITICAL_STRUCTURE_CORRUPTION ไฟล์ระดับบนสุดที่เฉพาะเจาะจงไม่ได้เกิดจากสาเหตุที่แตกต่างกัน: win32k.sys, ntoskrnl.exe, xenpci.sys (ไดรเวอร์ Xen แต่ปรากฏขึ้นเพียงสองสามครั้ง) และ ndis.sys ตัววิเคราะห์ OSR (Open …

4
วิธีใช้ kdump / crash เพื่อตรวจสอบปัญหา OOM?
ปัญหา เซิร์ฟเวอร์ทำงานล้มเหลวหลังจากมีข้อความ "หน่วยความจำไม่พอ" หลายข้อความและฉันพยายามระบุผู้กระทำผิด หากอยู่ใน userland - กระบวนการใด หากอยู่ในเคอร์เนล - โมดูลเคอร์เนลใด รายละเอียด ฉันพยายามค้นหาวิธีใช้ยูทิลิตีความผิดพลาดเพื่อตรวจสอบสิ่งที่เรียกใช้ OOM บนเซิร์ฟเวอร์ ในฐานะที่เป็นส่วนหนึ่งของการติดตั้งคู่ใหม่ของเซิร์ฟเวอร์ที่ฉันเริ่มต้นการเริ่มต้นของ 14TB DRBDอุปกรณ์ ในช่วงเวลานั้นขณะที่เล่นกับการกำหนดค่าอัตราการซิงค์ DRBD และทำให้อินเทอร์เฟซเครือข่ายถูกผูกมัดบางส่วนขึ้นและลงเซิร์ฟเวอร์ตัวใดตัวหนึ่งทำงานล้มเหลว ในช่วงเวลา 30 วินาทีมันผลิต 39 Out of memory: Kill process ####ข้อความ จากนั้นมันก็ล้มเหลวด้วย: Kernel panic - not syncing: Out of memory and no killable processes... ความผิดพลาดของระบบเรียกkdump ตอนนี้ฉันมีvmcore.flatไฟล์ที่ดีซึ่งควรตรงไปตรงมาเพื่อใช้ในการตรวจสอบปัญหา แต่ฉันมีเวลายากที่จะหาว่าหน่วยความจำทั้งหมดไปที่ใด ทรัพยากรเท่านั้นฉันรู้คือเว็บไซต์ของ Dedoimedoซึ่งมีคำแนะนำที่ดีและเคอร์เนลชนหนังสือ สิ่งเหล่านี้ก็เป็นแหล่งข้อมูลเดียวที่แนะนำในคำตอบดังนั้นฉันคิดว่านั่นcrashเป็นวิธีเดียวที่จะตรวจสอบ …

3
วิธีการตรวจสอบสาเหตุของความผิดพลาดของระบบ?
เซิร์ฟเวอร์ของฉันล่มสัปดาห์ละครั้งและไม่ทิ้งร่องรอยใด ๆ ว่าเป็นสาเหตุอะไร ฉันได้ตรวจสอบ/var/log/messagesแล้วและจะหยุดการบันทึก ณ จุดหนึ่งและเริ่มที่ข้อมูลการโพสต์คอมพิวเตอร์เมื่อฉันทำการรีบูตเครื่อง มีบางอย่างที่ฉันสามารถตรวจสอบหรือซอฟต์แวร์ที่ฉันสามารถติดตั้งที่สามารถระบุสาเหตุได้หรือไม่? ฉันใช้ CentOS 7 อยู่ นี่เป็นข้อผิดพลาด / ปัญหาเดียวใน/var/log/dmesg: https://paste.netcoding.net/cosisiloji.log [ 3.606936] md: Waiting for all devices to be available before autodetect [ 3.606984] md: If you don't use raid, use raid=noautodetect [ 3.607085] md: Autodetecting RAID arrays. [ 3.608309] md: Scanned 6 and added …

4
คุณจะแยกแยะความแตกต่างระหว่างการหยุดทำงานและการรีบูตบน RHEL7 ได้อย่างไร
มีวิธีการตรวจสอบว่าเซิร์ฟเวอร์ RHEL7 ถูกรีบูทผ่าน systemctl (หรือรีบูต / ปิดนามแฝง) หรือไม่หรือว่าเซิร์ฟเวอร์ล้มเหลวหรือไม่ Pre-systemd นี้ค่อนข้างง่ายต่อการตรวจสอบlast -x runlevelแต่ RHEL7 ไม่ชัดเจนนัก

2
ทำไม Linux kdump ถึงไม่เขียนถึง / var / crash?
มันเกิดขึ้นอีกครั้ง! ฉันมีเซิร์ฟเวอร์ 4 เครื่องซึ่งหยุดทำงานเป็นระยะและไม่มีข้อมูลที่พิมพ์ไปยังบันทึกระบบหรือคอนโซลอนุกรม นอกจากนี้ลินุกซ์บริการ kdump/var/crashไม่ได้เขียนทิ้งหลักในการตั้งค่าเริ่มต้นของ คุณช่วยฉันหาสาเหตุได้ไหม มันสำคัญไหมถ้าระบบไฟล์รูทของฉันเป็นโวลุ่ม LVM นี่คือสิ่งที่ฉันได้ลอง ระบบของฉันคือ Scientific Linux 6.5 พร้อมเคอร์เนลล่าสุด [root@host1 ~]# uname -r 2.6.32-431.11.2.el6.x86_64 [root@host1 ~]# cat /etc/issue Scientific Linux release 6.5 (Carbon) ไฟล์/etc/kdump.confนี้เป็นไฟล์วานิลลาที่มีการตั้งค่าเริ่มต้น สายส่วนใหญ่จะออกความเห็นมีเพียงสองสายที่ใช้งานและpathcore_collector #net my.server.com:/export/tmp #net user@my.server.com path /var/crash core_collector makedumpfile -c --message-level 1 -d 31 #core_collector scp ฉันแน่ใจว่าkdumpบริการกำลังทำงานและที่ไม่จำเป็นต้องสร้างของฉันkdumpinitrd [root@host1 ~]# chkconfig …

2
อะไรสามารถทำให้บริการทั้งหมดบนเซิร์ฟเวอร์ล่ม แต่ยังคงตอบสนองต่อการ ping และวิธีการคิดออก
มันเกิดขึ้นกับฉันแล้วสองครั้งภายในไม่กี่วันที่เซิร์ฟเวอร์ของฉันลงไปอย่างสมบูรณ์หมายถึง http, ssh, ftp, dns, smtp โดยทั่วไปบริการทั้งหมดหยุดตอบสนองราวกับว่าเซิร์ฟเวอร์ถูกปิดยกเว้นว่ามันยังตอบสนองต่อ ping ซึ่งเป็นสิ่งที่ฉันบุฟเฟ่ต์มากที่สุด ฉันมีสคริปต์ php บางตัวที่ทำให้เกิดการโหลดจำนวนมาก (cpu และหน่วยความจำ) บนเซิร์ฟเวอร์ในช่วงเวลาสั้น ๆ ที่ใช้โดยผู้ใช้กลุ่มเล็ก ๆ แต่โดยปกติแล้วเซิร์ฟเวอร์ "อยู่รอด" ได้ดีกับการระเบิดเหล่านี้อย่างสมบูรณ์ ไม่ตรงกับยอดการใช้งานดังกล่าว (ฉันไม่ได้บอกว่ามันไม่เกี่ยวข้อง แต่มันไม่ได้เกิดขึ้นหลังจากนั้น) ฉันไม่ได้ขอให้คุณสามารถบอกสาเหตุที่แท้จริงของการล่มเหล่านี้ได้อย่างน่าอัศจรรย์คำถามของฉันคือ: มีกระบวนการเดียวที่ความตายอาจทำให้บริการทั้งหมดเหล่านี้ลงไปพร้อมกันหรือไม่? สิ่งที่ตลกคือบริการเครือข่ายทั้งหมดลงไปยกเว้น ping หากเซิร์ฟเวอร์มี CPU 100% ที่กินเข้าไปในบางกระบวนการมันจะไม่ตอบสนองต่อการ ping เช่นกัน หาก apache ขัดข้องเนื่องจาก (ตัวอย่าง) สคริปต์ php ที่ใช้งานไม่ได้ซึ่งจะมีผลกับ http เท่านั้นไม่ใช่ ssh และ dns .... เป็นต้น ระบบปฏิบัติการของฉันคือ Cent …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.