การตรวจสอบเซิร์ฟเวอร์การผลิต [ปิด]


18

เรามีเซิร์ฟเวอร์เฉพาะ 3 เครื่องโดยแยกเป็นหลาย VPS โดยใช้ openVZ เรากำลังใช้ munin เพื่อตรวจสอบ VPS กับไซต์การผลิตและติดตามใน VPS อย่างใดอย่างหนึ่งเพื่อให้แน่ใจว่าจะเริ่มบริการใหม่เมื่อล้มเหลว

สิ่งที่เราต้องการวิธีที่ดีกว่ามากในการตรวจสอบเซิร์ฟเวอร์ทั้งหมดของเราเนื่องจากเรามี VPS ถึง 14 VPS เราต้องการมีศูนย์กลางที่เราสามารถเห็นได้ไม่เพียง แต่ข้อมูลที่เก็บรวบรวมโดย munin เท่านั้น แต่ยังมีสถิติเพิ่มเติมอีกด้วย บนเครือข่ายและการแสดงของบริการของเรา

ข้อกำหนดบางประการของเรา:
- การแจ้งเตือนทาง SMS เกี่ยวกับความล้มเหลว (ความสามารถในการตั้งค่าการตรวจสอบที่กำหนดเองบางอย่าง)
- ตัววิเคราะห์บันทึกสำหรับ apache error_log และอื่น ๆ
- ต้องเป็นส่วนกลาง (หมายถึงเซิร์ฟเวอร์เดียวและหลายโหนดรวบรวมข้อมูล)
- ไม่จำเป็นต้องติดตั้งง่าย แต่บำรุงรักษาง่าย
- ต้องเป็นอิสระ

ฉันถูกชี้ไปที่ nagios และ splunk คุณคิดอย่างไร? ขอบคุณ

คำตอบ:


17

ฉันมีการตั้งค่าที่คล้ายกันยกเว้นกับ Xen ในสถานที่ ฉันมีความสุขมากกับการรวมกันของ:

  • Nagiosสำหรับการแจ้งเตือน (ใช้ PNP สำหรับการสร้างกราฟ lite บางส่วนและ Nagviz สำหรับแดชบอร์ดสถานะบริการ)
  • Gangliaสำหรับการสร้างกราฟประวัติศาสตร์ของระบบ
  • OSSECในฐานะ HIDS และที่สำคัญเท่าเทียมกันในฐานะนักสะสมสำหรับการบันทึกจากส่วนกลาง
    • sidenote: มีปลั๊กอิน Splunk สำหรับ OSSEC ที่รวมเครื่องมือทั้งสองนี้เข้าด้วยกันได้ดีมากฉันกำลังรอให้พอร์ตเหล่านั้นโอนไปยัง Splunk v4
  • Splunkสุดท้ายเมื่อปลั๊กอิน Splunk สองสามตัวถูกย้ายไปเราวางแผนที่จะใช้ Splunk ด้วยการกรองล่วงหน้าบางส่วนของไฟล์บันทึก (เพื่อป้องกันไม่ให้ข้ามไปที่แคปรุ่นฟรี)

ฉันหวังว่าการแชร์การตั้งค่าการตรวจสอบของเราจะช่วยคุณได้ :-)

นี่คือลิงค์ที่มีประโยชน์:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

อัปเดต:

ฉันลืมที่จะพูดถึงว่าเราใช้โครงร่างการกำหนดค่าของ Matt Simmons Nagios เช่นกันพบได้ที่นี่http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

เลย์เอาต์นี้ทำให้การตั้งค่า Nagios ของเรามีสติและบำรุงรักษาได้ง่ายขึ้น (ขอบคุณ Matt!)


2
+1 สำหรับ OSSEC + splunk พวกเขาทำงานร่วมกันเป็นอย่างดี
sucuri

5

ฉันประสบความสำเร็จอย่างมากกับZabbixมันเป็นไปตามคะแนนทั้งหมดของคุณในแพ็คเกจเดียว

ข้อความแสดงแทน
(ที่มา: zabbix.com )

ส่วนที่ยากที่สุดจะได้รับการตรวจสอบบันทึก apache แต่ Zabbix สามารถขยายได้ดังนั้นคุณสามารถใช้ LogWatch หรือสคริปต์ Perl อื่น ๆ เพื่อดึงข้อมูลให้คุณ


2

ฉันชอบ OpManager และเพิ่มจำนวนโหนดให้ฟรี ทำตามที่กล่าวมาทั้งหมดและติดตั้งและบำรุงรักษาได้ง่าย


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.