เรามีเซิร์ฟเวอร์เฉพาะ 3 เครื่องโดยแยกเป็นหลาย VPS โดยใช้ openVZ เรากำลังใช้ munin เพื่อตรวจสอบ VPS กับไซต์การผลิตและติดตามใน VPS อย่างใดอย่างหนึ่งเพื่อให้แน่ใจว่าจะเริ่มบริการใหม่เมื่อล้มเหลว
สิ่งที่เราต้องการวิธีที่ดีกว่ามากในการตรวจสอบเซิร์ฟเวอร์ทั้งหมดของเราเนื่องจากเรามี VPS ถึง 14 VPS เราต้องการมีศูนย์กลางที่เราสามารถเห็นได้ไม่เพียง แต่ข้อมูลที่เก็บรวบรวมโดย munin เท่านั้น แต่ยังมีสถิติเพิ่มเติมอีกด้วย บนเครือข่ายและการแสดงของบริการของเรา
ข้อกำหนดบางประการของเรา:
- การแจ้งเตือนทาง SMS เกี่ยวกับความล้มเหลว (ความสามารถในการตั้งค่าการตรวจสอบที่กำหนดเองบางอย่าง)
- ตัววิเคราะห์บันทึกสำหรับ apache error_log และอื่น ๆ
- ต้องเป็นส่วนกลาง (หมายถึงเซิร์ฟเวอร์เดียวและหลายโหนดรวบรวมข้อมูล)
- ไม่จำเป็นต้องติดตั้งง่าย แต่บำรุงรักษาง่าย
- ต้องเป็นอิสระ
ฉันถูกชี้ไปที่ nagios และ splunk คุณคิดอย่างไร? ขอบคุณ