เรามีเครื่องจักรผลิตที่หยุดทำงานเป็นประจำ สภาพแวดล้อมการจัดเตรียมของเราทำงานได้ดี แต่เมื่อมีการปรับใช้แอปพลิเคชันกับการผลิตเครื่องผลิตจะขัดข้องหลังจากสองหรือสามวัน
เราไม่สามารถค้นหาสถานการณ์ใด ๆ บนสภาพแวดล้อมการจัดเตรียมซึ่งทำให้เครื่องขัดข้อง มีวิธีใดบ้างในการพิจารณาว่ากระบวนการใดที่กำลังทำงานอยู่เมื่อเครื่องขัดข้อง?
สิ่งนี้อาจบ่งบอกถึงปัญหาของแอปพลิเคชันหรือเครื่อง
คุณมีการติดตั้ง linux จากรอยขีดข่วนหรือคุณใช้ distro เฉพาะหรือไม่
—
Lorenzo Von Matterhorn
ลักษณะการใช้งานคืออะไร เว็บ? DB? คุณได้ตรวจสอบบันทึกที่เกี่ยวข้องภายใต้ / var / log
—
Steve N
ดังที่ @SteveN กล่าวให้ตรวจสอบตำแหน่งทั่วไปเพื่อดูบันทึกเหตุการณ์ที่อาจตรงกับความต้องการของคุณ (/ var / log, / var / log / messages) - สำหรับการบันทึกที่คุณมี
—
Lorenzo Von Matterhorn
syslogd
และklogd
แพคเกจที่ใช้มากที่สุด
ผมเคยได้ผ่านปัญหาที่คล้ายกันในอดีตวิธีการที่ผมได้แก้ไขมันเป็นโดยการเรียกใช้ cronjob ซึ่งดำเนินการเป็นระยะ ๆ คำสั่งที่จะมีการส่งออกของพวกเขายืนกรานที่จะ logfile เช่นการส่งออกของที่
—
Marcel
dmesg -c
, ps aux
, cat /proc/net/sockstat
หมู่คนอื่น ๆ จากนั้นทุกวันฉันจะเปรียบเทียบผลลัพธ์เพื่อค้นหาเบาะแสว่าจะเริ่มแก้ไขปัญหาที่ไหน นั่นอาจเป็นจุดเริ่มต้นหนึ่ง
รีสตาร์ทแอพพลิเคชั่นใหม่ทุก ๆ 24 ชั่วโมงและตรวจสอบว่านี่เป็นการเพิ่มเวลาที่ผิดพลาดสำหรับเครื่องที่ใช้งานจริงหรือไม่
—
nik