คำถามติดแท็ก monitoring

แอพพลิเคชั่นหรืออุปกรณ์ที่สังเกตเครื่องจักรระบบและเครือข่ายเพื่อค้นหาปัญหาและแจ้งผู้ดูแลระบบ

2
สีในแถบสถานะ htop มีความหมายว่าอย่างไร
ตามค่าเริ่มต้นhtopจะแสดงแถบสถานะสีสำหรับโปรเซสเซอร์หน่วยความจำและการสลับ จากซ้ายไปขวาแถบมีสีเขียวน้ำเงินเหลืองและแดงขึ้นอยู่กับเกณฑ์บางอย่าง หมายความว่าอย่างไรเมื่อแถบหน่วยความจำมีระดับสีเขียวและสีน้ำเงินเล็กน้อยและส่วนที่เหลือเกือบทั้งหมดเป็นสีเหลือง แถบสลับว่างเปล่า การตั้งค่าสีสำหรับ htop เป็น "ค่าเริ่มต้น"

30
คุณใช้เครื่องมือใดในการตรวจสอบเซิร์ฟเวอร์ของคุณ
สำหรับรายการที่ครอบคลุมมากขึ้นของการตรวจสอบเครื่องมือและคุณสมบัติของพวกเขาตรวจสอบหน้าวิกิพีเดียนี้ ดังที่คำถามระบุเครื่องมือที่ใช้บ่อยที่สุดสำหรับงานนี้คืออะไรจุดแข็งและจุดอ่อนของพวกเขาคืออะไร
187 monitoring 

13
วิธีการตรวจสอบไฟล์บันทึกของ windows ในเวลาจริง? [ปิด]
มีคำถามที่ถามเกี่ยวกับการเปิดไฟล์บันทึกขนาดใหญ่ แต่ความตั้งใจของฉันแตกต่าง มีแอพพลิเคชั่นใดบ้างที่ตรวจสอบล็อกไฟล์และอัปเดตเนื่องจากมีการอัปเดตตามเวลาจริงหรือไม่ แพลตฟอร์ม : เซิร์ฟเวอร์ Windows XP / 2003/2008 [อัพเดต]มันมีประโยชน์มากสำหรับการตรวจสอบอย่างรวดเร็ว (ขอบคุณคำตอบของ Ckarras ) ภาพหน้าจอด่วนของ PowerShell type -wait(ประเภทเป็นนามแฝงสำหรับget-content)

19
ใครสามารถแนะนำบริการตรวจสอบสถานะเว็บไซต์หรือไม่ [ปิด]
ผู้คนกำลังใช้บริการติดตามเว็บไซต์อะไรบ้าง ฉันหมายถึงบริการที่ฉันสามารถกำหนดค่าการเข้าชมเฉพาะเจาะจงให้กับเว็บไซต์ของฉันเพื่อตรวจสอบว่าเว็บไซต์ดังกล่าวทำงานอยู่หรือไม่ ฉันกำลังมองหาบริการภายนอกที่จะไปยังเซิร์ฟเวอร์ของฉันจากหลายสถานที่และจะแจ้งให้ฉันทราบหากเว็บไซต์ไม่ตอบสนองภายในระยะเวลาที่แน่นอน สามารถฟรีหรือจ่ายเงิน

2
ipmitool - ไม่พบ / dev / ipmi0 หรือ / dev / ipmidev / 0
จากคำถามก่อนหน้านี้ฉันติดตั้งipmitool ( yum install ipmitool) แม้หลังจากรีบูต แต่ฉันได้รับข้อผิดพลาดต่อไปนี้เมื่อพยายามเรียกใช้ipmitool power status: Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory Unable to get Chassis Power Status นี่เป็นปัญหาของระบบปฏิบัติการ / ฮาร์ดแวร์ (CentOS 6.3 x64 บนเครื่องโฮสต์ในศูนย์ข้อมูลระยะไกล - ไม่แน่ใจในผู้จำหน่ายฮาร์ดแวร์) หรือไม่ หรือฉันได้พลาดอะไรบางอย่างที่เป็นองค์ประกอบในการติดตั้งไปแล้วipmitool?

30
สุดยอดสมาร์ทโฟนสำหรับดูแลระบบ?
ฉันต้องการโทรศัพท์มือถือที่จะคอยจับตาดูเซิร์ฟเวอร์และบริการของฉันเมื่อฉันไม่อยู่ที่คอมพิวเตอร์ / โต๊ะทำงาน คุณจะแนะนำสมาร์ทโฟนรุ่นใดสำหรับ sysadmins ต้องมีไคลเอ็นต์ SSH ฉันไม่ได้ใช้ iPhone แต่ฉันคิดว่าการใช้คีย์บอร์ดจะดีกว่า ขณะนี้ฉันกำลังดูตัวเลือกนี้: iPhone จะเป็นสมาร์ทโฟน "เริ่มต้น" Nokia E71 ได้รับคำแนะนำที่ดีรวมถึงจาก Joel Spolky แพลตฟอร์ม Android ดูดี แต่ฉันไม่แน่ใจว่ามีกี่รุ่น (HTC G1 / HTC Magic / HTC Dream) นั้นโตพอ ฉันไม่แน่ใจเกี่ยวกับ Blackberry โทรศัพท์ WinCE / Windows Mobile? โทรศัพท์ Nokia รุ่นใดที่ดีกว่ารุ่น E71 คุณเลือกตัวเลือกใด คุณจะแนะนำอะไร

5
monit: ตรวจสอบกระบวนการที่ไม่มี pidfile
ฉันกำลังมองหาวิธีที่จะฆ่ากระบวนการทั้งหมดด้วยชื่อที่กำหนดซึ่งใช้เวลานานกว่า X ฉันวางไข่หลายครั้งของการปฏิบัติการที่เฉพาะเจาะจงนี้และบางครั้งมันก็ตกอยู่ในสภาพไม่ดีและทำงานตลอดไปโดยใช้ซีพียูมากมาย ฉันใช้ monit อยู่แล้ว แต่ฉันไม่รู้วิธีตรวจสอบกระบวนการที่ไม่มีไฟล์ pid กฎจะเป็นดังนี้: kill all processes named xxxx that have a running time greater than 2 minutes คุณจะแสดงสิ่งนี้ในหน่วย monit อย่างไร
36 monitoring  monit 

2
รับการแจ้งเตือนจากหัวหน้างานเมื่อออกจากงาน
มีวิธีใดบ้างที่supervisordสามารถรีสตาร์ทงานที่ล้มเหลว / ออก / สิ้นสุดโดยอัตโนมัติและส่งอีเมลแจ้งเตือนพร้อมกับดัมพ์ของไฟล์บันทึกการทำงาน x บรรทัดสุดท้าย?

6
ดูเนื้อหาของ memcached
มีเครื่องมือใดบ้างในการสำรวจสิ่งที่แคชในปัจจุบันในพูล memcached หรือไม่? มีกราฟไม่มากนัก แต่มีคีย์ / ค่าจริงที่เก็บอยู่ในปัจจุบัน

24
อะไรคือปลั๊กอิน Nagios ที่มีประโยชน์ที่สุดของคุณ [ปิด]
เรากำลังขยายการติดตั้ง Nagios 3 ของเราและมักจะเจอปลั๊กอิน NRPE หรือปลั๊กอิน Nagios ทั่วไปเพื่อทดสอบโครงสร้างพื้นฐานที่มีอยู่ของเรา นี่เป็นเรื่องเล่าและเรื่องน่าเบื่อ - มันจะมีประโยชน์ที่จะได้รับบทสรุปของปลั๊กอินที่ผู้ใช้ Nagios ให้ความสำคัญมากที่สุด โปรดแสดงรายการปลั๊กอินหนึ่งรายการต่อการโพสต์ควรมีคำอธิบายสั้น ๆ ว่าทำไมคุณถึงชอบและลิงค์ไปยังเว็บไซต์ MonitoringExchange หรือปลั๊กอินสำหรับนักพัฒนา วิธีนี้คนทั่วไปสามารถลงคะแนนสำหรับปลั๊กอินที่ระบุไว้แล้วและเราสามารถดูได้ในลำดับพิเศษ มันจะเป็นการดีกว่าถ้าจะไม่แสดงรายการปลั๊กอินที่คนอื่นพูดถึงไปแล้วด้วยเหตุผลเดียวกัน หากคุณมีสิ่งที่ต้องเพิ่มเติมเกี่ยวกับปลั๊กอินที่มีคนอื่นอยู่ในรายการโปรดแสดงความคิดเห็นไว้ในคำตอบ ขอบคุณ!

7
Colorize การตรวจสอบบันทึก
ฉันตรวจสอบบางครั้ง apache และ php บันทึกข้อผิดพลาดโดยใช้tailภายใต้ FreeBSD มีวิธีการรับเอาท์พุท colorized ไม่ว่าจะใช้tailหรือแอพบรรทัดคำสั่งอื่น ๆ ? อีกวิธีหนึ่งที่คุณชื่นชอบในการตรวจสอบบันทึกต่างๆที่เกี่ยวข้องกับเว็บในแบบเรียลไทม์คืออะไร?

6
Linux: logwatch (8) มีเสียงดังเกินไป ฉันจะควบคุมระดับเสียงได้อย่างไร
ระบบ Linux ของเราใช้ยูทิลิตีlogwatch (8)ตามค่าเริ่มต้น ในระบบ RedHat / CentOS / SL Logwatch จะถูกเรียกโดย/etc/cron.daily/cronjob ซึ่งจะส่งอีเมลรายวันพร้อมผลลัพธ์ อีเมลเหล่านี้มีหัวเรื่องดังนี้: Subject: Logwatch for $HOSTNAME ปัญหาคือโดยค่าเริ่มต้นอีเมลรายวันเหล่านี้มีเสียงดังมากและมีข้อมูลที่ฟุ่มเฟือยจำนวนมาก (ข้อผิดพลาด HTTP, การใช้ดิสก์รายวัน ฯลฯ ) ซึ่งได้รับการตรวจสอบโดยบริการอื่น ๆ แล้ว (Nagios, Cacti, syslog ส่วนกลางเป็นต้น) สำหรับระบบ 100 รายการโหลดอีเมลไม่สามารถทนทานได้ ผู้คนเพิกเฉยต่ออีเมลซึ่งหมายความว่าเราอาจพลาดปัญหาที่เกิดขึ้นจากการรับชม ฉันจะลดปริมาณเสียงที่เกิดจาก logwatch แต่ยังคงใช้ logwatch เพื่อแจ้งปัญหาที่สำคัญให้เราทราบได้อย่างไร ฉันจะโพสต์คำตอบของฉันเองด้านล่าง แต่ฉันอยากจะเห็นสิ่งที่คนอื่นทำ หมายเหตุ : ฉันมีคำถามที่คล้ายกันเกี่ยวกับ FreeBSD ที่FreeBSD: คาบ (8) ดังเกินไป …

11
วิธีการตรวจสอบและบันทึกการใช้หน่วยความจำ / cpu ของกระบวนการเมื่อเวลาผ่านไป? [ปิด]
ฉันกำลังมองหาวิธีในการวินิจฉัยปัญหาเช่นการตายของ swap ซึ่งกระบวนการหน่วยความจำแบบ balooning เติม swap และฆ่าเครื่องทั้งหมด (เช่น apache) ฉันใช้ cacti อยู่แล้วและฉันสามารถตั้งค่า nagios (แม้ว่าจะไม่ใช่) หรือ munin แต่เท่าที่ฉันสามารถบอกได้ว่าพวกเขาไม่สามารถบันทึกการใช้งานโปรแกรมแต่ละรายการ - เพียงสถานะโดยรวม ฉันรู้ว่าฉันสามารถม้วนสคริปต์ที่ >> ไปยังไฟล์บางไฟล์ได้ทุก ๆ 30s แต่ฉันต้องการดูว่ามีโซลูชันที่มีอยู่แล้วหรือไม่ มันจะเป็นการดีที่: บันทึกการใช้หน่วยความจำของกระบวนการทุก N วินาที การใช้ CPU ของกระบวนการบันทึกทุก ๆ N วินาที สนับสนุนแผนภูมิและประวัติ สนับสนุนค่าเฉลี่ย - เช่น mysqld ใช้ CPU 43% ในวันสุดท้ายและหน่วยความจำเฉลี่ย 400MB เป็นอิสระและโอเพนซอร์ส ชื่อกระบวนการไม่ได้และไม่ควรทราบล่วงหน้า - ความคิดคือการปล่อยให้มันตรวจสอบแล้วดูที่ผู้กระทำผิดด้านบน ระบบของฉันคือ …

5
SSD รองรับ SMART หรือไม่
SMART (สำหรับการวิเคราะห์การตรวจสอบตนเองและเทคโนโลยีการรายงาน) เป็นเทคโนโลยีที่ยอดเยี่ยมในการตรวจสอบความล้มเหลวของฮาร์ดไดรฟ์ก่อนที่มันจะเกิดขึ้นจริง แต่ SMART นั้นเกี่ยวข้องกับ SSD หรือไม่
30 monitoring  ssd  smart 

10
การทดสอบเว็บไซต์จากบรรทัดคำสั่ง Linux [ปิด]
ฉันกำลังมองหาเครื่องมือในการทดสอบเว็บไซต์จากบรรทัดคำสั่ง Linux จากผลลัพธ์ฉันต้องทราบการตอบสนอง http (รหัสสถานะ) แต่ยังใช้เปรียบเทียบเวลาที่ใช้ในการดาวน์โหลดองค์ประกอบต่าง ๆ ของไซต์ ขอบคุณล่วงหน้า.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.