คำถามติดแท็ก system-monitoring

4
ค้นหากระบวนการที่กำลังเปลี่ยนแปลงไฟล์
ฉันกำลังพยายามหาวิธีที่เชื่อถือได้ในการค้นหากระบวนการบนเครื่องของฉันที่กำลังเปลี่ยนไฟล์กำหนดค่า ( /etc/hostsเป็นเฉพาะ) ฉันรู้ว่าฉันสามารถใช้lsof /etc/hostsเพื่อค้นหาว่ากระบวนการใดที่เปิดไฟล์อยู่ในขณะนี้ แต่ก็ไม่ได้ช่วยอะไรเพราะกระบวนการเปิดไฟล์อย่างเห็นได้ชัดเขียนไปแล้วปิดอีกครั้ง ฉันยังดูที่lsofตัวเลือกการทำซ้ำ (-r) แต่ดูเหมือนว่าจะเร็วเพียงหนึ่งวินาทีซึ่งอาจไม่เคยบันทึกการเขียนที่กำลังดำเนินอยู่ ฉันรู้ว่ามีเครื่องมือสองสามตัวสำหรับการตรวจสอบการเปลี่ยนแปลงของระบบไฟล์ แต่ในกรณีนี้ฉันต้องการทราบว่ากระบวนการใดรับผิดชอบซึ่งหมายถึงการจับมันในการกระทำ

9
สคริปต์เพื่อทดสอบโดยอัตโนมัติหากมีเว็บไซต์
ฉันเป็นผู้พัฒนาเว็บไซต์โดดเดี่ยวที่มี Centos VPS ของตัวเองที่โฮสต์เว็บไซต์เล็ก ๆ น้อย ๆ สำหรับลูกค้าของฉัน วันนี้ฉันค้นพบบริการ httpd ของฉันหยุดทำงาน (โดยไม่มีเหตุผลที่ชัดเจน - แต่นั่นเป็นอีกเธรดหนึ่ง) ฉันรีสตาร์ท แต่ตอนนี้ฉันต้องหาวิธีที่ฉันจะได้รับแจ้งทางอีเมลและ / หรือ SMS หากมันเกิดขึ้นอีกครั้ง - ฉันไม่ชอบเมื่อลูกค้าของฉันโทรหาฉันเพื่อบอกเว็บไซต์ของพวกเขาไม่ทำงาน! ฉันรู้ว่าอาจมีความเป็นไปได้ที่แตกต่างกันมากมายรวมถึงซอฟต์แวร์ตรวจสอบสถานะเซิร์ฟเวอร์ ฉันคิดว่าสิ่งที่ฉันต้องการจริงๆคือสคริปต์ที่ฉันสามารถเรียกใช้เป็นงาน cron จากโฮสต์ dev ของฉัน (ซึ่งทำงานในสำนักงานของฉันอย่างถาวร) ที่พยายามโหลดหน้าจากเซิร์ฟเวอร์ที่ใช้งานจริงของฉันและถ้ามันไม่โหลดภายใน 30 วัน วินาทีจากนั้นจะส่งอีเมลหรือ SMS ฉันค่อนข้างขยะที่เชลล์สคริปต์ดังนั้นคำถามนี้ ข้อเสนอแนะใด ๆ ที่จะได้รับการชื่นชมอย่างสุดซึ้ง

3
ทางเลือกเพื่อ etsy / statsd
มีทางเลือกอื่น ๆ สำหรับetsy statsdหรือไม่? อาจเป็นโซลูชันที่คล้ายแดชบอร์ดหรือไม่ การวิจัยของฉันพบเฉพาะโซลูชัน SaaS ที่เป็นกรรมสิทธิ์ สำหรับผู้ที่ไม่ทราบ: statsd เป็น deamon ซึ่งรวบรวมแอพและระบบเมตริกผ่าน UDP และส่งไปยัง Graphite เพื่อสร้างพล็อตที่สวยงามมากขึ้นหรือน้อยลง มี API สำหรับภาษาที่สำคัญทั้งหมดที่มีอยู่ ฉันต้องการ: ต้องทำงานบนเซิร์ฟเวอร์ของฉันโดยไม่มีบุคคลที่สามรวบรวมข้อมูล ควรจะสามารถรวบรวมข้อมูลได้ทั้งจากระบบ, Java และ Perl ควรมีน้ำหนักเบาและยืดหยุ่น ฟอสส์ อาจต้องมีการเขียนโปรแกรมเพิ่มเติมอาจเป็นเพียงกรอบ

2
ไดรฟ์ข้อมูล 16TB และ SNMP บน Windows
เมื่อไดรฟ์ข้อมูลที่มีขนาดใหญ่กว่า 16TB กลายเป็นเรื่องธรรมดาเป็นที่ทราบกันดีว่าค่า 32 บิตที่ใช้ในการรายงานขนาดดิสก์และการใช้งานภายใน MIB "HOST-RESOURCES" มาตรฐานใน MIB ใน SNMP ไม่ใหญ่พอที่จะรายงานขนาดของดิสก์ที่เหมาะสม Net-SNMP ดูเหมือนว่าจะได้รับการแก้ไขปัญหานี้โดยเพียงแค่จัดการค่าของ "AllocationUnits" เพื่อรักษาค่า 32 บิตสำหรับการใช้งานดิสก์ (เนื่องจากขนาดดิสก์ / การใช้งานทั้งหมดเท่ากับค่าพื้นที่ 32 บิตคูณหน่วยการจัดสรร) เพื่ออนุญาต สำหรับการคำนวณปริมาณที่มากกว่า 8 / 16TB สมมติว่าคุณไม่มีความสนใจการรายงานในหน่วยการจัดสรรและไม่เป็นที่น่าพอใจในระดับเล็กน้อย ดูเหมือนว่าจะเป็นทางออกที่สง่างาม https://bugzilla.redhat.com/show_bug.cgi?id=654384 หน้าต่างที่สร้างขึ้นในบริการ SNMP ดูเหมือนว่าจะยังคงประสบกับข้อผิดพลาดนี้เพียงรายงาน modulo ของพื้นที่ดิสก์ที่ใช้ / กำหนดแล้วส่งผลให้การรายงานขนาดของดิสก์ไม่ถูกต้อง มีวิธีการเปิดใช้งาน Windows เพื่อรายงานการใช้งานดิสก์อย่างถูกต้องสำหรับโวลุ่มที่เกิน 16TB หรือไม่? เราพยายามติดตั้ง Net-SNMP 5.5 x64 และปิดใช้งานบริการ Windows SNMP …

1
วิธีที่ดีที่สุดในการตรวจสอบเซิร์ฟเวอร์ Windows [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับข้อบกพร่องของเซิร์ฟเวอร์ ปิดให้บริการใน3 ปีที่ผ่านมา ฉันทำงานที่ บริษัท ที่ให้การสนับสนุนด้านไอทีแก่ลูกค้าธุรกิจขนาดเล็ก หนึ่งในภารกิจของฉันคือทำการตรวจสอบบริการซึ่งรวมถึงการตรวจสอบตัวแสดงเหตุการณ์เพื่อดูข้อผิดพลาด / คำเตือนที่สำคัญรวมถึงคอนโซลการจัดการ DHCP และ DNS ตัวแสดงเหตุการณ์สำหรับเวิร์กสเตชันของลูกค้าจะได้รับการตรวจสอบด้วย แต่ก็ไม่ได้เป็นประจำ มีวิธีแก้ไขปัญหาที่มีอยู่ซึ่งสามารถรวมศูนย์การดูบันทึกเหล่านี้ทั้งหมดเพื่อไม่ให้ฉันต้องเข้าถึงเซิร์ฟเวอร์แต่ละเครื่องจากระยะไกลและทำสิ่งเดียวกันซ้ำไปซ้ำมาสำหรับลูกค้าแต่ละคนหรือไม่ ลูกค้าแต่ละรายมีเซิร์ฟเวอร์ Windows บางรุ่น - ตั้งแต่ 2003 ถึง 2012 R2

4
ตรวจสอบเซิร์ฟเวอร์ Dell / HP ที่รัน ESXi (ฟรี)
คุณกำลังทำอะไรเพื่อตรวจสอบเซิร์ฟเวอร์ ESXi ที่ใช้งานรุ่นฟรี ด้วยการขาดการสนับสนุน SNMP ดูเหมือนว่ามีข้อ จำกัด สำหรับฉัน สิ่งที่ฉันต้องการจะทำคือได้รับการแจ้งเตือนบางประเภทเมื่อไดรฟ์หรือฮาร์ดแวร์อื่นล้มเหลว ฉันเคยเห็นบางบทความเกี่ยวกับการติดตั้ง OpenManage บนกล่อง ESXi (เพื่อสร้างอาร์เรย์ใหม่) แต่ดูเหมือนว่าจะค่อนข้างเจ็บปวดเช่นกัน แม้ว่าฉันจะทำให้ OpenManage ทำงานได้ฉันจะไม่มีการแจ้งเตือนหากไม่มี SNMP ความคิดเห็นอินพุตหรือคำแนะนำใด ๆ จะได้รับการชื่นชมอย่างมาก

4
คุณจะแยกแยะความแตกต่างระหว่างการหยุดทำงานและการรีบูตบน RHEL7 ได้อย่างไร
มีวิธีการตรวจสอบว่าเซิร์ฟเวอร์ RHEL7 ถูกรีบูทผ่าน systemctl (หรือรีบูต / ปิดนามแฝง) หรือไม่หรือว่าเซิร์ฟเวอร์ล้มเหลวหรือไม่ Pre-systemd นี้ค่อนข้างง่ายต่อการตรวจสอบlast -x runlevelแต่ RHEL7 ไม่ชัดเจนนัก
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.