คำถามติดแท็ก monitoring

แอพพลิเคชั่นหรืออุปกรณ์ที่สังเกตเครื่องจักรระบบและเครือข่ายเพื่อค้นหาปัญหาและแจ้งผู้ดูแลระบบ

2
วิธีค้นหาไฟล์. pid สำหรับกระบวนการที่กำหนด
ฉันกำลังตั้งค่า monit และต้องการตรวจสอบแอพพลิเคชั่นของไพ ธ อน Monit ทำสิ่งนี้โดยดูที่ไฟล์. pid สำหรับกระบวนการ แต่ฉันไม่รู้ว่าจะเป็นเช่นไร ฉันยังพยายามสร้างไฟล์ปฏิบัติการแบบง่าย ๆ ของตัวเองและรันที่นี่ด้วยฉันไม่สามารถหาได้ว่าไฟล์. pid ถูกสร้างขึ้นที่ใด และกระบวนการทั้งหมดมีไฟล์. pid หรือไม่
15 linux  monitoring  monit  pid 

2
ปิดใช้งานการแจ้งเตือน Monit เมื่อ PID เปลี่ยนไป
เมื่อคุณตรวจสอบกระบวนการด้วย Monit ด้วย pid ของมันเช่น: check process blop with pidfile /.../blop.pid start program = "..." stop program = "..." คุณได้รับการแจ้งเตือนเมื่อมีการเปลี่ยนแปลง pidfile คุณจะปิดการใช้งานการแจ้งเตือนนี้ได้อย่างไร ตัวอย่างเช่นหากคุณต้องการทราบว่ากระบวนการรีสตาร์ทไม่สำเร็จเมื่อใด

6
ฉันจะตรวจสอบบันทึกเหตุการณ์ของ Windows อย่างอดทนได้อย่างไร
ฉันจะตรวจสอบบันทึกเหตุการณ์ของ Windows จากระยะไกลเช่นที่ฉันจะได้รับแจ้งโดยอัตโนมัติเมื่อมีเหตุการณ์บางอย่างเกิดขึ้นได้อย่างไร มีโซลูชันการตรวจสอบที่ใช้งานอยู่มากมาย แต่พวกเขาต้องการความสนใจของมนุษย์หรือการสำรวจอย่างต่อเนื่อง ฉันต้องการโซลูชันแบบพาสซีฟที่จะสร้างการแจ้งเตือนเมื่อมีเหตุการณ์เกิดขึ้น

4
วิธีการตรวจสอบการใช้งานแบนด์วิดธ์ในแง่จริง
ฉันมีเครือข่ายขนาดเล็ก (windows) ที่มีผู้ใช้ไม่กี่คน เรามีอินเทอร์เน็ตผ่านเราเตอร์ BT โดยทั่วไปทุกอย่างเรียบร้อย แต่บางครั้งเราดูเหมือนจะสูญเสียแบนด์วิดท์อย่างมาก ฉันอาจได้รับความทรมานจากพีซี zombie หรือผู้ใช้ที่ใช้ซอฟต์แวร์ฝนตกหนัก ... หรือฉันอาจมีข้อ จำกัด บางอย่างที่ ISP ของฉันวางไว้? ฉันต้องการค้นหาว่าเกิดอะไรขึ้น มีเครื่องมือง่ายๆที่ฉันสามารถใช้เพื่อให้โลกแห่งความจริง (แอพใดบนพีซีเครื่องใด) ที่ใช้แบนด์วิดท์ทั้งหมด ณ จุดใดจุดหนึ่ง?

2
การค้นหากระบวนการเชื่อมต่อ TCP ที่มีอายุสั้น
ทำงานtcpdumpบนการเชื่อมต่อท้องถิ่นไปยังเซิร์ฟเวอร์ apache ฉันพบว่ามีการสร้างการเชื่อมต่อ TCP และปิดทันทีทุก 2 วินาที ฉันจะค้นหากระบวนการที่รับผิดชอบได้อย่างไร netstat -ctpไม่ได้ช่วยการเชื่อมต่อเร็วเกินไปและตัวระบุกระบวนการไม่ปรากฏขึ้นสำหรับ TIME_WAIT พวกเขากลายเป็นโพรบ haproxy ซึ่งฉันสามารถตรวจสอบได้straceแต่ฉันก็ยังไม่รู้วิธีที่จะระบุ haproxy ตั้งแต่แรก

8
รับประวัติการใช้งาน CPU / หน่วยความจำ
มีวิธีบันทึกข้อมูล Task Manager เกี่ยวกับการใช้งาน CPU และหน่วยความจำเพื่อตรวจสอบในภายหลังหรือไม่? หรือเครื่องมือที่เทียบเท่ากัน?

2
กลยุทธ์ในการตรวจจับการเลื่อนเวลาในดาต้าเซ็นเตอร์ที่ใช้ลินุกซ์คืออะไร?
กลยุทธ์ในการตรวจจับการเลื่อนเวลาในศูนย์ข้อมูลที่ใช้ลินุกซ์ทั้งหมดคืออะไร? นี่เป็นปัญหาที่ยากกว่าที่เคยเป็นมาในตอนแรก การเลื่อนเวลาไปมาอาจทำให้เกิดปัญหาร้ายแรงสำหรับแอปพลิเคชั่นบางตัวและบ่อยครั้งแม้ว่าจะติดตั้ง NTP ไปแล้ว แต่ก็เป็นไปได้ที่จะล้มเหลวด้วยเหตุผลดังต่อไปนี้ (และอีกมากมาย): NTP ไม่ได้ตั้งค่าอย่างถูกต้องให้รีสตาร์ทโดยอัตโนมัติเมื่อรีบูต การตั้งค่าบนเซิร์ฟเวอร์ไม่ถูกต้องดังนั้นเซิร์ฟเวอร์เวลาที่ชี้ไปที่ไม่สามารถเข้าถึงหรือไม่ถูกต้อง เซิร์ฟเวอร์เวลาหลักไม่สามารถเข้าถึงได้และเซิร์ฟเวอร์ทั้งหมดกำลังซิงค์กับมันในขณะนี้กำลังซิงค์กับแหล่งที่ไม่น่าเชื่อถือ ฉันต้องการวิธีตรวจสอบว่าเซิร์ฟเวอร์แต่ละเครื่องนั้นถูกต้องหรือไม่ โปรดทราบว่าเซิร์ฟเวอร์ที่มีสคริปต์ / แอปพลิเคชันทดสอบอาจไม่ถูกต้อง
14 linux  monitoring  ntp  time 

4
การวางแผนความจุของดิสก์สำหรับกระซิบ / กราไฟท์
ไม่มีใครมีสูตรใด ๆ หรืออาจมีข้อมูลตัวอย่างบางส่วนจากสภาพแวดล้อมของพวกเขาที่สามารถช่วยฉันประเมินว่าจะใช้เนื้อที่ดิสก์โดยแกรไฟต์ต่อดาต้าพอยน์เท่าใด

6
คุณมอนิเตอร์เซิร์ฟเวอร์การมอนิเตอร์ได้อย่างไร?
ดังนั้นเราจึงเรียกใช้ Groundworks (กับ Nagios) บน CentOS เพื่อตรวจสอบเซิร์ฟเวอร์และกระบวนการต่างๆของเรา ฉันได้ตั้งค่าให้ส่งอีเมลและข้อความ SMS โดยอัตโนมัติเมื่อสิ่งต่างๆเข้าสู่สถานะคำเตือนหรือวิกฤต โดยปกติจะใช้งานได้อย่างสมบูรณ์แบบ อย่างไรก็ตามสองครั้งเรามีปัญหากับ Postfix บนเซิร์ฟเวอร์นั้นที่ Postfix ตัดสินใจหยุดส่งอีเมล เวลาล่าสุดใช้เวลา 4 วันเพราะไม่มีใครสังเกตเห็น นั่นทำให้ฉันมีคำถามสำคัญ: ฉันจะตรวจสอบเซิร์ฟเวอร์การมอนิเตอร์ของฉันได้อย่างไร

5
วิธีที่ดีที่สุดในการตรวจสอบเซิร์ฟเวอร์ที่ใช้งานจริงคืออะไร
เรากำลังเรียกใช้เซิร์ฟเวอร์การผลิตสองเครื่องพร้อม Apache 2 และ MySQL ฉันกำลังมองหาวิธีที่เชื่อถือได้ในการตรวจสอบภาระความเสถียรและเวลาใช้งานของเรา ฉันได้เจอกับmonitแต่มีทางเลือกที่ดีกว่า?

16
ตรวจสอบเวลาจริงของเซิร์ฟเวอร์ MS Windows และบริการของพวกเขา
เรามี HDTV ขนาดใหญ่จำนวนมากในสำนักงานตรวจสอบของเราคอยดูอุปกรณ์การผลิตทั้งหมดของเรา เรากำลังตรวจสอบ: เราเตอร์ของซิสโก้ สวิตช์ HP เซิร์ฟเวอร์ที่ใช้ HP Windows 2003 IIS เซิร์ฟเวอร์ SQL ในขณะที่เราใช้ Nagios สำหรับสถานะการออนไลน์ / สถานะว่างและการส่งการแจ้งเตือน Cacti สำหรับการใช้แบนด์วิดธ์ Perfmon ทำงานบน Vista เพื่อประสิทธิภาพเซิร์ฟเวอร์ การรวมกันของเครื่องมืออื่น ๆ และรหัสที่กำหนดเองของเราเพื่อตรวจสอบประสิทธิภาพการใช้งานจริงของเรา ทั้งหมดนี้เป็นสิ่งที่ดีนอกเหนือจากส่วน Perfmon - ให้สิ่งที่เราต้องการ - เช่นแผนภูมิแบบเรียลไทม์บนหน้าจอการบันทึกเคาน์เตอร์วัดประสิทธิภาพ ฯลฯ - ปัญหาเดียวคือการตั้งค่ามันเป็นงานที่น่าเบื่อจริง หาก Vista PC ที่ใช้งาน Perfmon ถูกรีบูท (ปกติแล้วเป็นเพราะ Windows Update) ดังนั้นการตั้งค่าตัวนับทั้งหมดจะใช้เวลานานขึ้น - ซึ่งหมายถึงการทำงานหนึ่งชั่วโมงหรือสองชั่วโมงสำหรับใครบางคนในสำนักงาน ... …

4
การขนส่งเข้าสู่ระบบและการรวมในระดับ
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ คุณวิเคราะห์ไฟล์บันทึกจากเครื่อง UNIX / Linux อย่างไร เราเรียกใช้เซิร์ฟเวอร์หลายร้อยเซิร์ฟเวอร์ซึ่งทั้งหมดสร้างไฟล์บันทึกของตนเองไม่ว่าโดยตรงหรือผ่าน syslog ฉันกำลังมองหาทางออกที่ดีในการรวบรวมและเลือกเหตุการณ์สำคัญ ปัญหานี้แบ่งออกเป็น 3 องค์ประกอบ: 1) การขนส่งข้อความ วิธีคลาสสิคคือการใช้ syslog เพื่อบันทึกข้อความไปยังโฮสต์ระยะไกล ใช้งานได้ดีสำหรับแอปพลิเคชันที่ลงชื่อเข้าใช้ syslog แต่มีประโยชน์น้อยกว่าสำหรับแอปที่เขียนไปยังไฟล์ในเครื่อง วิธีแก้ไขปัญหานี้อาจรวมถึงการมีล็อกแอปพลิเคชันลงใน FIFO ที่เชื่อมต่อกับโปรแกรมเพื่อส่งข้อความโดยใช้ syslog หรือโดยการเขียนสิ่งที่จะ grep ไฟล์โลคัลและส่งเอาต์พุตไปยังโฮสต์ syslog กลาง อย่างไรก็ตามหากเราพบปัญหาในการเขียนเครื่องมือเพื่อส่งข้อความไปยัง syslog เราควรจะแทนที่ล็อตทั้งหมดด้วยดีกว่าเช่นScribeของ Facebook ที่ให้ความยืดหยุ่นและความน่าเชื่อถือมากกว่า syslog หรือไม่? 2) การรวมข้อความ รายการบันทึกดูเหมือนจะเป็นหนึ่งในสองประเภท: ต่อโฮสต์และต่อบริการ ข้อความต่อโฮสต์คือข้อความที่เกิดขึ้นในเครื่องเดียว คิดว่าดิสก์ล้มเหลวหรือเข้าสู่ระบบที่น่าสงสัย ข้อความต่อบริการเกิดขึ้นในโฮสต์ส่วนใหญ่หรือทั้งหมดที่ใช้บริการ ตัวอย่างเช่นเราต้องการทราบว่าเมื่อ Apache พบข้อผิดพลาด SSI …

1
วิธีการตั้งค่า monit เพื่อตรวจสอบพื้นที่ดิสก์
ฉันใช้ monit บนเซิร์ฟเวอร์ของฉันเพื่อตรวจสอบ apache และ mysql ที่ทำงานอยู่ ตอนนี้ฉันต้องการเพิ่มการแจ้งเตือนหากดิสก์เต็มเกินไป ฉันเพิ่มสิ่งนี้สำหรับการทดสอบใน/etc/monit/monitrc: check device rootfs with path /dev/md0 if space usage > 10% then alert ฉันมีสองพาร์ทิชันที่ฉันต้องการตรวจสอบ: /และ/var: mount /dev/md0 on / type ext3 (rw) /dev/md2 on /var type ext3 (rw) การตรวจสอบที่มีประโยชน์ในการกำหนดค่านี้นอกเหนือจากพื้นที่ว่างคืออะไร

3
ทางเลือกเพื่อ etsy / statsd
มีทางเลือกอื่น ๆ สำหรับetsy statsdหรือไม่? อาจเป็นโซลูชันที่คล้ายแดชบอร์ดหรือไม่ การวิจัยของฉันพบเฉพาะโซลูชัน SaaS ที่เป็นกรรมสิทธิ์ สำหรับผู้ที่ไม่ทราบ: statsd เป็น deamon ซึ่งรวบรวมแอพและระบบเมตริกผ่าน UDP และส่งไปยัง Graphite เพื่อสร้างพล็อตที่สวยงามมากขึ้นหรือน้อยลง มี API สำหรับภาษาที่สำคัญทั้งหมดที่มีอยู่ ฉันต้องการ: ต้องทำงานบนเซิร์ฟเวอร์ของฉันโดยไม่มีบุคคลที่สามรวบรวมข้อมูล ควรจะสามารถรวบรวมข้อมูลได้ทั้งจากระบบ, Java และ Perl ควรมีน้ำหนักเบาและยืดหยุ่น ฟอสส์ อาจต้องมีการเขียนโปรแกรมเพิ่มเติมอาจเป็นเพียงกรอบ


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.