Nagios graphing solutions vs Munin / Cacti / Ganglia


9

ฉันมีการตั้งค่าเซิร์ฟเวอร์ nagios สำหรับการตรวจสอบเซิร์ฟเวอร์ ~ 30 Windows ฉันต้องการเพิ่มแผนภูมิที่ได้รับความนิยม ฉันได้อ่านแล้วว่าปลั๊กอินสร้างกราฟของ nagios นั้นเรียบง่ายและหลายคนใช้เครื่องมือสร้าง / แยกแผนภูมิแยกต่างหากแบบสแตนด์อโลน

ข้อ จำกัด ของปลั๊กอินการทำกราฟของนากิโอะกับผลิตภัณฑ์แบบสแตนด์อโลนเช่น ganglia / munin / cacti คืออะไร

ฉันสนใจคุณสมบัติเฉพาะและข้อดีที่แพ็กเกจแบบสแตนด์อโลนนำเสนอและปลั๊กอินการสร้างกราฟของ nagios ไม่


คุณควรพิจารณา Zabbix ... serverfault.com/q/109595/2039
sebthebert

ลองใช้ opsview community edition อิงจาก nagios คุณสามารถติดตั้งใน linux รสชาติที่แตกต่างกันหรือดาวน์โหลด VM opsview.com/downloads/download-opsview-community
Matias Dominoni

สำหรับบันทึก: ฉันได้ลอง nagiosgraph แล้วติดกับมัน ฉันค่อนข้างมีความสุขกับสิ่งที่เสนอ
sumek

คำตอบ:


7

เนื่องจากคุณมีการติดตั้ง nagios อยู่แล้วให้พิจารณา nagiosgraph หรือ pnp4nagios

nagiosgraph และ pnp4nagios ทำงานได้ค่อนข้างดีในการวางแผนข้อมูลประสิทธิภาพของ nagios nagiosgraph มีวิธีการตั้งค่าพารามิเตอร์ตาม, pnp4nagios มีวิธีการตามแม่แบบ

  • ทั้งคู่จะตรวจหาโฮสต์ / บริการใหม่โดยอัตโนมัติทุกครั้งที่มีการเปลี่ยนแปลงการกำหนดค่าของ nagios
  • ทั้งสองทำการซูมกราฟ
  • ทั้งสองให้กราฟเมื่อคุณวางเมาส์บนโฮสต์ / บริการเฉพาะ
  • ทั้งสองวิธีมีหลายวิธีในการแบ่งข้อมูลของคุณ
  • ทั้งตรวจจับและสร้างกราฟระดับวิกฤติและการเตือนภัยที่คุณได้กำหนดไว้แล้วใน nagios
  • ทั้งสองสามารถฝังลงในเฟรม nagios ได้โดยตรงเพื่อการนำทางที่ราบรื่นไม่มีสะดุดจากสถานะปัจจุบันไปจนถึงประวัติและย้อนกลับ

การแบ่งและทำให้ข้อมูลมีความสำคัญ ตัวอย่างเช่นคุณสามารถดูบริการทั้งหมดในโฮสต์เดียวหรือดูโฮสต์ทั้งหมดด้วยบริการเฉพาะหรือดูคอลเลกชันกราฟโดยพลการสำหรับโฮสต์และบริการโดยพลการ

การติดตั้งไม่สำคัญ แต่ก็ไม่ยาก มากขึ้นอยู่กับว่าคุณต้องการปรับแต่งสิ่งต่าง ๆ มากแค่ไหน ตัวอย่างเช่น nagiosgraph คือ 'install.pl' หรือ 'rpm -i nagiosgraph.rpm' หรือ 'dpkg -i nagiosgraph.deb' pnp4nagios คือ './configure; ทำให้; ทำการติดตั้ง '

n2rrd สามารถทำสิ่งเหล่านี้ได้เช่นกัน แต่มันไม่ขัดและต้องการการกำหนดค่ามากขึ้น

rrdtool มีการจัดเก็บข้อมูลที่ผิดปกติและระบบใด ๆ จะมีปัญหาการสุ่มตัวอย่าง rrdtool ทำการปรับข้อมูลให้เรียบโดยค่าเริ่มต้น แต่คุณสามารถจับ (และกราฟ) สูงสุดและ / หรือต่ำสุดนอกเหนือจากค่าเฉลี่ยหากจำเป็น

ทุกวิธีการตาม rrdtool ทนทุกข์ทรมานจากข้อมูล staleness / กราฟตั้งแต่ schema ในแต่ละไฟล์ rrd เป็นแบบคงที่และระบบส่วนใหญ่ใช้ชื่อไฟล์ rrd เพื่อระบุข้อมูล โดยทั่วไปข้อมูลจะไม่สูญหายเมื่อชื่อโฮสต์หรือชื่อบริการเปลี่ยน ไฟล์ rrd ยังคงมีอยู่บนดิสก์ แต่บางอินเทอร์เฟซผู้ใช้มีวิธีการดูไฟล์ 'เก่า' ส่วนอื่น ๆ ต้องการการดูแลทำความสะอาดด้วยตนเองผ่านทางบรรทัดคำสั่ง ในการติดตั้งจำนวนมากนี่เป็นเพียงปัญหาเมื่อเริ่มต้นกำหนดค่าระบบ แต่ในสภาพแวดล้อมแบบไดนามิก (เช่นการตรวจสอบเครื่องเสมือนที่อายุการใช้งานเพียงไม่กี่เดือน) มันอาจกลายเป็นน่าเบื่อ

โน้ตตัวสุดท้าย ที่จริงแล้วมีสองส่วนที่ได้รับความนิยม: การรวบรวมข้อมูลและการแสดงข้อมูล หากคุณไปกับระบบกราฟแบบสแตนด์อโลนแทนที่จะขยายการติดตั้ง nagios ที่มีอยู่คุณอาจต้องติดตั้งส่วนประกอบเพิ่มเติมบนเครื่อง windows ของคุณเพื่อรวบรวมข้อมูล


13

ฉันเห็นด้วยกับ lynxman NAGIOS ใช้สำหรับข้อมูลเชิงคุณภาพทันที (X คือตกลงหรือไม่?); มินนินใช้สำหรับข้อมูลเชิงปริมาณในอดีต (X เต็มรูปแบบตอนนี้และเท่าใดในปีนี้?) การติดตั้ง NAGIOS ของฉันทั้งหมดซึ่งบางส่วนตรวจสอบบริการหลายร้อยรายการเชื่อมโยงกับระบบ munin เพื่อทำการตรวจสอบเชิงปริมาณ

โปรดทราบด้วยว่า munin มี hooks เฉพาะสำหรับการป้อนข้อมูลลงใน NAGIOS มันเข้าใจแนวคิดของคำเตือนและเกณฑ์ที่สำคัญและที่ต้องมีการแจ้งเตือน (และมุมมองของ NAGIOS "กระดานใหญ่") มันง่ายมากที่จะมีตัวแปร munin เดียวแจ้งสถานะของบริการ NAGIOS เดียว

เวิร์กโฟลว์ตามปกติคือไม่มีใครดูกราฟ munin จนกระทั่ง NAGIOS แจ้งเตือนว่ามีการละเมิดธรณีประตู แต่กราฟ munin กลายเป็นสิ่งที่ประเมินค่าไม่ได้สำหรับการค้นหาว่ามีบางสิ่งที่ค่อยๆเร่ร่อนไปตามกาลเวลาหรือไม่ - สีน้ำเงินเพิ่มขึ้นหรือเรามีวงจรขึ้น - ลงทุกสัปดาห์ซึ่งจะเพิ่มแอมพลิจูดช้าหรืออะไร

ตามที่ lynxman กล่าวว่าวิธี UNIX คือ "หนึ่งภารกิจหนึ่งเครื่องมือ" การสร้าง toolchain ของ munin และ NAGIOS นั้นทำได้ดีมากสำหรับฉันในการตรวจสอบเชิงปริมาณและเชิงคุณภาพรวมถึงการแจ้งเตือน นอกจากนี้ยังมีข้อได้เปรียบที่แตกต่างกันของการรักษาอินเตอร์เฟสให้สะอาด: เมื่อคุณดูที่ NAGIOS คุณจะเห็นมุมมองที่เรียบง่ายว่าสิ่งต่าง ๆ ทำงานได้ดีแค่ไหนในตอนนี้โดยไม่มีข้อมูลในอดีตรบกวนมุมมอง เมื่อคุณดูที่ munin คุณจะเห็นข้อมูลประวัติที่เกี่ยวข้องกับปัญหาที่พร้อมสำหรับการวิเคราะห์ของคุณโดยไม่มี "host is down" หรือ "sshd จะไม่พูดกับฉัน" เกิดข้อผิดพลาดในมุมมอง


3

Nagios graphing plugins อย่างที่คุณพูดมีข้อ จำกัด มากพวกมันมีอินเตอร์เฟส rrdtool ขั้นพื้นฐานและการออกแบบ UI นั้นค่อนข้างใช้งานง่ายมันเป็นแฮ็คมากกว่า nagios พยายามใช้มันเพื่อความสนุก แต่มันพังหลายครั้งโดยไม่มีการเตือนล่วงหน้า

สำหรับผลิตภัณฑ์แบบสแตนด์อโลน (โดยเฉพาะ munin หรือ ganglia) ให้บริการที่หลากหลายที่ nagios ไม่สามารถทำได้เนื่องจาก unix mantra จะดีกว่าการทำสิ่งเดียวมากกว่าพยายามทำดีในหลาย ๆ อย่าง nagios น่าทึ่งสำหรับ การตรวจสอบและ munin / ganglia / cacti นั้นยอดเยี่ยมในการทำกราฟ


ดังนั้นสิ่งที่อยู่ภายในนี้ช่วงใหญ่ของการบริการที่ nagios ไม่สามารถประสบความสำเร็จ ? นี่คือสิ่งที่ฉันสนใจ
sumek

ด้วย nagios มันง่ายมากที่จะสูญเสียข้อมูลกราฟของคุณนอกจากนี้ยังเป็นเรื่องง่ายมากที่ปลั๊กอินจะหยุดการสร้างกราฟข้อมูลในเวลาใดก็ตามมันไม่ทำให้คุณมีความเป็นไปได้ที่จะซูมเข้าสู่เวลาที่กำหนด (ซึ่งคนอื่น ๆ ทำ) ไม่ให้ความเป็นไปได้ที่จะทำซับซ้อนกราฟ aggregative และนั่นเป็นเพียงสำหรับการเริ่ม :)
lynxman

คุณหมายถึงอะไรง่าย ๆ ในการหลวมข้อมูลกราฟของคุณ ? Google อย่างรวดเร็วแสดงให้เห็นว่าทั้ง 5 โซลูชั่นที่กล่าวถึง (ganglia, munin, cacti, pnpgraph, nagiosgraph) ใช้ rrdtool เพื่อจัดเก็บข้อมูลกราฟ
sumek

ใช่ sumek สิ่งที่ฉันอ้างถึงคือเครื่องมือสร้างกราฟบน nagios อีกครั้งคือแฮ็คและเมื่อใดก็ตามที่มีความไม่ตรงกันระหว่างชื่อไฟล์ rrd และข้อมูลกราฟที่มันจะแตกถ้าคุณต้องการลองใช้มันก็จะเจ็บปวดเหมือนฉัน ไม่และจากนั้นย้ายไปยังทางออกที่แท้จริงเช่น munin :)
lynxman

2

ที่ Stack Overflow เราใช้n2rrdซึ่งเป็นปลั๊กอินของ Nagios สำหรับสร้างกราฟข้อมูลประสิทธิภาพ เท่าที่ฉันจะเห็นด้วยกับ lynxman ว่ามันมีความรู้สึกแฮ็คใหญ่

อย่างไรก็ตาม:

  • ด้วย n2rrd คุณสามารถให้ Cacti ทำกราฟตามข้อมูลแทน rrd2graph.cgi ที่มาพร้อมกับ n2rrd
  • n2rrd กับ rrd2graph.cgi รองรับการซูม
  • เท่าที่กราฟรวมที่ซับซ้อน - โดยทั่วไปคุณใช้กราฟ rrd ด้วยมือและสามารถทำสิ่งที่คุณต้องการได้

กราฟ rrd จะถูกจัดเก็บตามชื่อเซิร์ฟเวอร์ดังนั้นหากคุณเปลี่ยนชื่อของสิ่งที่คุณเรียงลำดับของข้อมูลที่หลวม ... คุณสามารถเปลี่ยนชื่อไฟล์ได้เสมอ symlink พวกเขาแม้ว่าคุณจะไม่สูญเสียข้อมูล

ฉันมีตัวอย่างของกราฟเหล่านี้ที่เคล็ดลับล่าสุดของฉันสำหรับการโพสต์บล็อกเซิร์ฟเวอร์RRD กราฟที่ผิด นอกจากนี้หน้า n2rrd ยังมีทั้งการสาธิต cacti และ rrd2graph

ฉันคิดว่าบรรทัดล่างคือการไปตามเส้นทางนากิโอสอาจจะขาดคุณสมบัติหรือสองอย่าง แต่ก็ค่อนข้างสมบูรณ์ถ้าคุณไม่สนใจที่จะทำให้มือสกปรกด้วยรายละเอียดของการเขียนเทมเพลต rrd ด้วยตนเอง * มันอาจจะต้องใช้เวลามากขึ้น แต่มันจะส่งเสริมให้พัฒนาความเชี่ยวชาญใน rrd


1
* [ข้อผิดพลาดเชิงอรรถที่ไม่ได้อ้างถึง]: คุณกำลังจะเพิ่มอะไร kyle; สอบถามจิตใจต้องรู้!
MadHatter

0

ฉันต้องการข้อมูลที่แม่นยำและการแสดงข้อมูลของ rrd นั้นไม่ถูกต้อง - มันเป็นมาตรฐาน! สำหรับผู้ใช้ส่วนใหญ่สิ่งนี้ดีเพราะพวกเขาไม่ได้ใช้ข้อมูลที่แม่นยำมากในการเริ่มต้น พวกเขากำลังใช้ข้อมูลที่อัตราตัวอย่างมักจะเป็นนาทีหรือนานกว่านั้นและนั่นจะไม่ให้คำอธิบายที่ถูกต้องแม่นยำกับสิ่งที่เกิดขึ้น นี่ก็หมายความว่าหากคุณมีข้อมูลที่ขัดขวางในบางที่คุณอาจไม่เคยเห็น

ลองพิจารณาดู - บอกว่าเครือข่าย Gb ของคุณกำลังฮัมเพลงอยู่ที่ประมาณ 10MB / วินาทีและจู่ ๆ ก็มีความเร็วถึง 100MB / วินาทีเป็นเวลาสองสามนาที โปรดทราบด้วยว่าถ้าเป็นเพียง 30 วินาทีที่ขัดขวางคุณอาจไม่เห็นมันด้วยอัตราการสุ่มตัวอย่างเพียงไม่กี่นาที หากคุณดูข้อมูลสำหรับวันนั้น 'สไปค์' อาจแสดงเป็น 15MB / วินาทีเท่านั้นแม้ว่าค่าจริงจะขึ้นอยู่กับปัจจัยอื่น ๆ ด้วยเช่นกัน มีความเป็นไปได้สูงมากที่คุณจะถือว่าเครือข่ายของคุณมีความสุขเมื่อไม่มี!

สิ่งที่น่าผิดหวังยิ่งสำหรับฉันคือข้อมูลที่ถูกทำให้เป็นมาตรฐานกับความกว้างทางกายภาพของกราฟและช่วงของแกน x นี่แปลว่าเข็มที่คุณพูดถึงคุณไม่เห็นหมายความว่าอะไร? หากคุณซูมเข้าจะปรากฏขึ้นอย่างน่าอัศจรรย์! ฉันจะยึด gnuplot - กราฟอาจไม่สวยเหมือนกัน แต่มันแข็งเหมือนหินและ gnuplot ไม่เคยแก้ไขข้อมูลก่อนที่จะแสดงมัน

-เครื่องหมาย


0

ฉันพบว่าการใช้ pnp4nagios ใช้งานได้ดีสำหรับการทำกราฟ รองรับการซูมเช่นกัน มันไม่ใช่วิธีที่ง่ายที่สุดในการติดตั้ง แต่ไม่มีอะไรกับ nagios เลย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.