โหลดสูงบนเซิร์ฟเวอร์ nagios - บริการตรวจสอบว่าเซิร์ฟเวอร์ nagios มีจำนวนเท่าใดเกินไป


9

ฉันมีเซิร์ฟเวอร์ nagios ที่ใช้งาน Ubuntu พร้อมโปรเซสเซอร์ Intel 2.0 GHz, อาร์เรย์ RAID10 และ RAM 400 MB จะตรวจสอบทั้งหมด 42 บริการใน 8 โฮสต์ซึ่งส่วนใหญ่จะถูกตรวจสอบโดยใช้ปลั๊กอิน check_http แม้ 5 นาทีบางทุกนาที เมื่อเร็ว ๆ นี้โหลดบนเซิร์ฟเวอร์ nagios สูงกว่า 4 บ่อยครั้งที่สูงถึง 6 เซิร์ฟเวอร์ยังทำงาน cacti โดยรวบรวมสถิติทุกนาทีสำหรับโฮสต์ 6 แห่ง

ฉันสงสัยว่าฮาร์ดแวร์ควรมีบริการแบบนี้จำนวนเท่าใดที่สามารถรองรับได้ โหลดสูงเกินไปหรือไม่เนื่องจากฉันกดขีด จำกัด ของฮาร์ดแวร์หรือฮาร์ดแวร์นี้สามารถจัดการกับการตรวจสอบบริการ 42 รายการและ cacti ได้หรือไม่ หากฮาร์ดแวร์ไม่เพียงพอฉันควรเพิ่ม RAM เพิ่มเติมแกนเพิ่มเติมหรือแกนประมวลผลเร็วขึ้นหรือไม่ การตรวจสอบฮาร์ดแวร์ / บริการใดที่ผู้อื่นใช้งานอยู่


ตอนนี้การใช้งาน ram มีลักษณะอย่างไรบนเซิร์ฟเวอร์ การใช้ cpu มีลักษณะอย่างไร หากสูงกระบวนการใดที่ตรึงไว้
3dinfluence

คุณแก้ปัญหาได้หรือไม่ เรากำลังประสบปัญหาเดียวกัน โหลดเฉลี่ยคือ 12 ..
John

คำตอบ:


7

คุณต้องทราบว่าคอขวดของคุณอยู่ที่ไหน ...

ฉันเรียกใช้มอนิเตอร์ nagios ที่ตรวจสอบโฮสต์มากกว่า 400+ ที่มี http, ping และ ssh checks (พร้อมกับเช็คและพาสซีฟอื่น ๆ จำนวนมาก)

นี่เป็นเซิร์ฟเวอร์ 2xQuadCore ที่มีดิสก์ SAS 4 ตัวใน RAID10

ฉันสงสัยว่าคุณมีความขัดแย้งของ IO เนื่องจากการเขียนไปยัง rrds จำนวนมากนั้นไม่มีประสิทธิภาพมาก

คุณต้องทราบว่ากระบวนการใดใช้ทรัพยากรของคุณ (cacti, nagios หรืออย่างอื่น)

สำหรับการตรวจสอบ IO ฉันชอบไอโซโทป ติดตั้ง iotop (แพ็คเกจ 9.04 ใช้งานได้กับ 8.04)

แต่ไม่เช่นนั้นด้านบนจะช่วยให้คุณพบกับหมูที่โหลด

Cacti ต่อนาทีค่อนข้างก้าวร้าว (ฉันใช้ระเบิดเป็นระยะ 5 เมตร)

วิธีหนึ่งที่ฉันเคยได้ยินเกี่ยวกับการแข่งขันการเขียน rrd คือการวางร้านค้า rrd ของคุณใน ramdisk / tmpfs (ให้แน่ใจว่าได้ rsync ที่ทุกขณะนี้แล้วเพื่อเก็บข้อมูลถาวร)

โชคดี.


ขอบคุณ ฉันจะดูมัน อาจเป็น cacti สร้างภาระและฉันจะดูว่ามีวิธีการย้าย rrds ไปยัง tmpfs หรือเพิ่ม RAM เพิ่มเพื่อให้เซิร์ฟเวอร์สามารถบัฟเฟอร์ rrds ฉันกลัวว่าถ้าผมทำงาน cacti ทุกๆ 5 นาทีอาจจะมี spikes โหลดที่ผ่านมาเพียง 1 หรือ 2 นาทีซึ่งผมสมบูรณ์จะพลาด ...
Josh

6

นอกจากว่า cacti จะสร้างภาระส่วนใหญ่แล้วคุณควรจะสามารถเรียกใช้การตรวจสอบได้มากกว่าฮาร์ดแวร์ของคุณ

ฉันใช้ nagios บนเครื่องเสมือน FreeBSD ที่ทำงานบน Microsoft Virtual Server บนพีซีแบบเก่าที่ช้าลง (Pentium 3 1GHz พร้อมดิสก์ PATA ที่ช้า) เครื่องเสมือนมี RAM เพียง 128MB เท่านั้นและประสิทธิภาพก็น่ากลัว

อย่างไรก็ตามค่าเฉลี่ยการโหลดอยู่ที่ประมาณ 0.2 เรียกใช้ 158 การตรวจสอบใน 42 โฮสต์


ขอบคุณ ฉันหวังว่าฉันจะยอมรับทั้งสองคำตอบ! คุณเป็นประโยชน์มากมันบ่งบอกว่า cacti น่าจะเป็นผู้ร้าย
Josh

2

ใน PIII เก่าที่มี RAM 256MB ฉันกำลังตรวจสอบบริการต่าง ๆ ประมาณ 230 บริการอย่างกระตือรือร้น เครื่องเดียวกันยังใช้ MRTG และ HylaFAX สำหรับแฟกซ์ขาเข้าทั้งหมดของเราและทำได้ค่อนข้างสบาย


ข้อมูลที่เป็นประโยชน์มาก สิ่งนี้บ่งบอกว่า cacti น่าจะเป็นผู้ร้ายไม่ใช่นากิโอ ขอบคุณ!
Josh

1

คุณควรจะสามารถเรียกใช้งานการตรวจสอบเรือบรรทุกด้วยอุปกรณ์ดังกล่าวได้ เราเรียกใช้การตั้งค่าที่คล้ายกันโดยมีการตรวจสอบประมาณ 70 รายการและ Nagiosgraph - ความแตกต่างที่สำคัญคือการเพิ่ม RAM (มันราคาถูกดังนั้นฉันจะกระแทกกล่องเป็น 2Gb)

ลองรัน top หรือ ps -aux เพื่อดูว่า CPU มีการโหลดมากเกินไปหรือไม่ แต่ฉันสงสัยว่ามัน คุณอาจต้องการตรวจสอบเอกสารการทำให้เป็นคู่ขนานของ nagios เพื่อดูว่าการติดตั้งของคุณกำลังพยายามเรียกใช้การตรวจสอบมากเกินไปในคราวเดียวแทนที่จะเป็นอนุกรมหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.