เซิร์ฟเวอร์ Zabbix ส่งการแจ้งเตือนมากเกินไป


9

ฉันเพิ่งติดตั้งเซิร์ฟเวอร์ Zabbix บน VPS และมีความสุขมากกับมัน ฉันได้ติดตั้งไคลเอนต์ใน appr 6-7 VPS อื่น ๆ และทุกอย่างทำงานได้ดี อินเทอร์เฟซนั้นราบรื่นและสร้างกราฟที่ดีมาก
ปัญหาเดียวของฉันกับซอฟต์แวร์คือฉันได้ตั้งค่าให้ส่งการแจ้งเตือนเกี่ยวกับปัญหา แต่ฉันได้รับอีเมลระหว่าง 30 ถึง 60 ทุกวัน มีบางสิ่งใน "เซิร์ฟเวอร์ XXX ไม่สามารถเข้าถึงได้: ปัญหา" และอีกหนึ่งนาทีต่อมา: "เซิร์ฟเวอร์ XXX ไม่สามารถเข้าถึงได้: ตกลง" นอกหลักสูตร Zabbix ยังรับรู้เมื่อมีปัญหาจริงและเช่นเมื่อเซิร์ฟเวอร์รีสตาร์ท สำหรับฉันแล้วดูเหมือนว่า Zabbix จะ "ยอมแพ้" เร็วมากหรืออาจเร็วกว่าสิ่งที่ฉันต้องการ ฉันพยายาม google ปัญหานี้มาแล้วหลายครั้ง แต่ก็ล้มเลิกดังนั้นตอนนี้ฉันจึงลองใช้วิธีนี้

ไม่มีใครรู้วิธีปรับความน่าเชื่อถือของการแจ้งเตือน / ทริกเกอร์เหล่านี้หรือไม่?


คุณใช้แม่แบบตัวอย่างเริ่มต้นอยู่หรือไม่ ถ้าเป็นเช่นนั้นน่าจะเป็นรายการ "สถานะ" ซึ่งไม่แนะนำจริง ๆ :) - คุณควรเปลี่ยนแทนเป็นเอเจนต์กำลังตรวจสอบความพร้อมของโฮสต์
Richlv

คำตอบ:


9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications ฉันใช้ฟังก์ชันการเลื่อนระดับของ Zabbix เพื่อระงับข้อความเปิด / ปิดบ่อยครั้ง โดยทั่วไป:

  • ข้อความแรกทำให้เกิดห่วงโซ่การยกระดับโดยไม่ส่งอีเมลถึงคุณ
  • จากนั้น Zabbix จะรอ 5 นาที (หรืออะไรก็ตามที่คุณตั้งไว้) ก่อนที่จะส่งการแจ้งเตือน
  • หากในช่วงเวลา 5 นาทีที่ทริกเกอร์การเปลี่ยนแปลงสถานะเป็นปิดคุณจะไม่ได้รับการแจ้งเตือนและทุกอย่างกลับสู่ปกติ
  • เป็นส่วนหนึ่งที่ดีที่ deshboard ยังคงแสดงให้เห็น

Oleg


ขอบคุณ! ดูเหมือนว่าสิ่งที่ฉันกำลังมองหา ฉันปรับการตั้งค่าและตอนนี้ฉันกำลังให้ระบบบางเวลาเพื่อดูว่าการส่งการแจ้งเตือนได้รับผลกระทบอย่างไร
anselmdk

หลังจากรออย่างอดทน (และผ่อนคลายทริกเกอร์เว็บ) Zabbix การส่งอีเมลก็ทำงานได้อย่างถูกต้องในที่สุด ขอบคุณสำหรับทิป!
anselmdk

5

คุณสามารถปรับทริกเกอร์ได้เช่นกัน ฉันพบวิธีการนับ () มีประโยชน์แล้ว
แทนการทริกเกอร์เมื่อครั้งล่าสุด (0) ลองนับ (300,0, "eq")}> 5 แทน สิ่งนี้จะทำให้เกิดข้อยกเว้นหากการตรวจสอบ 5 ครั้งล่าสุด (สมมติว่า 60 วินาทีระหว่างการตรวจสอบ) ล้มเหลว

http://www.zabbix.com/documentation/1.8/manual/config/triggers

คุณสามารถปิดการใช้งานข้อความตกลงได้โดยเพิ่มเงื่อนไข 'Trigger value = "PROBLEM"' ควรทำการเปลี่ยนแปลงนี้ในการกำหนดค่าการกระทำ

http://www.zabbix.com/documentation/1.8/manual/config/actions


2
ที่จริงแล้วตัวอย่างการนับของคุณจะส่งคืนจำนวนค่าใน 300 วินาทีล่าสุดเท่ากับ 0 จากนั้นเปรียบเทียบกับ 5 ผลกระทบโดยรวมคือการเรียกใช้เหตุการณ์หากเกิดค่า 5 ค่าขึ้นไปในช่วง 300 วินาทีที่ผ่านมา
G-Wiz
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.