อะไรคือปลั๊กอิน Nagios ที่มีประโยชน์ที่สุดของคุณ [ปิด]


33

เรากำลังขยายการติดตั้ง Nagios 3 ของเราและมักจะเจอปลั๊กอิน NRPE หรือปลั๊กอิน Nagios ทั่วไปเพื่อทดสอบโครงสร้างพื้นฐานที่มีอยู่ของเรา นี่เป็นเรื่องเล่าและเรื่องน่าเบื่อ - มันจะมีประโยชน์ที่จะได้รับบทสรุปของปลั๊กอินที่ผู้ใช้ Nagios ให้ความสำคัญมากที่สุด

โปรดแสดงรายการปลั๊กอินหนึ่งรายการต่อการโพสต์ควรมีคำอธิบายสั้น ๆ ว่าทำไมคุณถึงชอบและลิงค์ไปยังเว็บไซต์ MonitoringExchange หรือปลั๊กอินสำหรับนักพัฒนา วิธีนี้คนทั่วไปสามารถลงคะแนนสำหรับปลั๊กอินที่ระบุไว้แล้วและเราสามารถดูได้ในลำดับพิเศษ

มันจะเป็นการดีกว่าถ้าจะไม่แสดงรายการปลั๊กอินที่คนอื่นพูดถึงไปแล้วด้วยเหตุผลเดียวกัน หากคุณมีสิ่งที่ต้องเพิ่มเติมเกี่ยวกับปลั๊กอินที่มีคนอื่นอยู่ในรายการโปรดแสดงความคิดเห็นไว้ในคำตอบ

ขอบคุณ!

คำตอบ:


8

ในแง่ของความยืดหยุ่นคุณไม่สามารถเอาชนะปลั๊กอิน snmp ได้ มันอยู่เบื้องหลังการตรวจสอบเกือบทุกครั้งที่ฉันเรียกใช้และหากไม่เป็นเช่นนั้นการเชื่อมต่อ TCP คือ


ตรวจสอบ snmp ดูดีมากสำหรับคนโปรดในขั้นตอนนี้ Matt (และคนอื่น ๆ :) - คุณมีเทคนิคพิเศษที่คุณใช้กับมันหรือไม่? เนื้อหลักของฉันที่มี net-snmpd ในขณะนี้คือความซับซ้อนของฟังก์ชั่นการขยายที่ค่อนข้างใหม่มากกว่าการตรวจสอบ check_snmpd จัดการเรื่องนี้ได้ดีหรือไม่?
Mike Pountney

7

ปลั๊กอินที่มีประโยชน์ที่สุดของเราคือปลั๊กอินที่ทดสอบการทำงานของแอปพลิเคชันที่สูงขึ้น ตัวอย่างเช่นเรามีการทดสอบที่พยายามเข้าสู่เว็บไซต์และการทดสอบที่พยายามส่งอีเมลและตรวจสอบกล่องจดหมาย pop3 เพื่อให้แน่ใจว่ามาถึงแล้ว หากสิ่งเหล่านี้แตกหักเราสามารถใช้การตรวจสอบระดับล่างเพื่อดูว่ามีอะไรผิดปกติหรือไม่ pop3 นั้นตายไปแล้วหรือยัง? MTA, MDA หรือไม่ เซิร์ฟเวอร์ฐานข้อมูล ดาต้าสโตร์?


Wotcha Dave;) คุณมีเคล็ดลับเกี่ยวกับวิธีการเชื่อมต่อการตรวจสอบระดับที่สูงขึ้นและต่ำลงหรือไม่? ตัวอย่างเช่นคุณจะสร้างการอ้างอิงระหว่างการส่งอีเมลและทำเครื่องหมายที่กล่อง pop3 เพื่อดูว่ามีได้อย่างไร เป็นไปได้ไหมที่จะทำสิ่งนี้ผ่าน Nagios หรือคุณใช้ตรรกะของคุณเอง?
Mike Pountney

คุณอยู่ที่ตีสี่จริงเหรอ? :) Nagios มีการขึ้นต่อกันของการบริการดังนั้นคุณสามารถทำให้การตรวจสอบอีเมลของคุณขึ้นอยู่กับการตรวจสอบ smtp, MDA และ POP3 แต่นี่ก็หมายความว่าการตรวจสอบอีเมลจะไม่แจ้งเตือนหากมีการตรวจสอบระดับล่าง ถ้าคุณมีกลุ่มเซิร์ฟเวอร์ที่ให้บริการเนื่องจากคุณไม่มีทางที่จะพูดว่า "อย่าเตือนเราสำหรับบริการนี้หากบริการเหล่านี้เสียชีวิต" โดยปกติแล้วเราแค่พึ่งรู้ว่าระบบเข้าด้วยกันเพื่อให้รู้ว่าปัญหาอยู่ตรงไหน
David Pashley

7

check_diskสุจริตหนึ่งที่ไม่มากที่สุดสำหรับผมคือธรรมดาเก่า ไม่มีอะไรทำให้ฉันรู้สึกพิเศษมากในแบบ "หยุดกินแปะ" เหมือนมีเซิร์ฟเวอร์ที่ทำงานได้ดีเมื่อวานนี้ระเบิดขึ้นวิ่งไปมาอย่างบ้าคลั่งแล้วก็ค้นพบว่าเพราะฉันปล่อยให้ดิสก์เติมเต็ม การไม่ต้องทำสิ่งนั้นอีกในชีวิตของฉันมีค่ามากสำหรับฉัน

(และอย่าลืมตรวจสอบไอโหนดเช่นกันเด็ก ๆ ดูที่บ้าน)


7

WebInjectมีประโยชน์มากสำหรับการตรวจสอบเว็บไซต์หากคุณต้องการทำงานนอกเหนือจากฟังก์ชัน check_http มันสามารถจัดการหน้าเข้าสู่ระบบและดำเนินการหลายขั้นตอนในการตรวจสอบ Nagios เดียว


4

ฉันพบว่าcheck_nfsmountมีประโยชน์ในเซิร์ฟเวอร์ของฉันหลายแห่ง

แก้ไข: ฉันจะลงคะแนน check_snmp ถ้าฉันมีตัวแทนที่จะทำเช่นนั้น มีการใช้งานบนเซิร์ฟเวอร์ทั้งหมดของฉันรวมถึงตรรกะที่อยู่เบื้องหลัง check_hpjd ซึ่งฉันใช้กับเครื่องพิมพ์ HP ทั้งหมดของฉัน


4

สิ่งที่มีประโยชน์ที่สุดของฉันคือสิ่งที่ฉันเขียนด้วยตัวเองที่ตรวจสอบใบรับรอง SSL บนเว็บเซิร์ฟเวอร์ของเราเพื่อให้ฉันสามารถตรวจสอบการหมดอายุได้


มันโพสต์ทุกที่หรือไม่
RainyRat

4
check_http -H www.verisign.com -C 14
wittwerch

4

PNP (pnp4nagios.org) - สร้างกราฟสไตล์ RRD สำหรับ Nagios ใด ๆ ที่ตรวจสอบว่าเอาต์พุตสมบูรณ์แบบ ข้อมูล. มีประโยชน์โดยเฉพาะอย่างยิ่งเมื่อพยายามโน้มน้าว devs ว่าบริการที่ติดตั้งใหม่จริงๆเป็นสาเหตุของ CPU spikes เหล่านั้นทั้งหมด ...


3

check_nt (พูดคุยกับ NSClient หรือบางอย่างที่คล้ายกันในเรื่อง) ช่วยให้คุณซักถาม WMI ในกล่อง Windows - ถ้ามีตัวนับประสิทธิภาพสำหรับตอนนี้คุณสามารถตรวจสอบได้ด้วย Nagios


และคุณสามารถตรวจสอบการบริการของคุณทั้งหมดที่กำลังทำงานเช่นตรวจสอบว่าการแลกเปลี่ยนหรือเซิร์ฟเวอร์ SQL กำลังทำงาน
ไซมอนฟอสเตอร์

2

นี่เป็นปลั๊กที่ไร้ยางอาย แต่ถ้าคุณตรวจสอบเครื่อง Windows ที่ใช้ NRPE ดูเหมือนว่าNagiosPluginsNTจะทำงานได้ดี ;-)


2

ฉันจะยอมรับว่า check_snmp เป็นปลั๊กอินที่มีค่าอย่างยิ่ง สามารถใช้งานได้เกือบทุกจุดและทุกอย่างแสดงใน SNMP ที่พูดกันโดยทั่วไป SNMP มีให้บริการในระบบที่หลากหลายเช่น HP-UX, Tru64 และ OpenVMS โดยไม่มีการติดตั้งเพิ่มเติม

ปลั๊กอินอื่น (ไม่มาก) ที่มีประโยชน์มากคือ NagiosGrapher ฉันมีประสบการณ์ของฉันในบทความที่อธิบายเพิ่มเติม แต่ก็เพื่อให้ผู้อื่นสามารถใช้งานได้โดยไม่มีปัญหาใด ๆ

หนึ่งล่าสุด: NSCA คุณสามารถเขียนสคริปต์ Perl หรือ Ruby หรือ ksh และป้อนข้อมูลผลลัพธ์ลงใน NSCA

ระหว่างความยืดหยุ่นของ NSCA และ SNMP เมื่อรวมกับการรายงานของ NagiosGrapher สิ่งนี้ควรขยายการตรวจสอบของคุณให้ดีขึ้น


2

ฉันชอบ check_http เพื่อตรวจสอบเว็บไซต์ของฉันยังทำงานอยู่ฉันได้ขยายมันเพื่อตรวจสอบว่าสามารถพบข้อความบางข้อความได้หลังจากครั้งหนึ่งที่ บริษัท โฮสติ้งของฉันตัดสินใจที่จะให้บริการหน้าเปล่าและ nagios ของฉันผ่านการตรวจสอบทั้งหมด


2

สิ่งที่มีประโยชน์ที่สุดสำหรับฉันคือสิ่งที่ฉันเขียนสำหรับความต้องการของฉัน: nagios-check-webpage

มันดาวน์โหลดทั้งหน้าด้วย js / css / images พร้อมมัลติเธรดและ gzip (ประหยัดแบนด์วิดท์จำนวนมาก) เช่นตัวนำทางจริง


+1 แน่นอนว่าปลั๊กอินนั้นยอดเยี่ยม ใช้สำหรับแอพ 4 เดือนแล้ว
Henk

1

จำนวนหนึ่งเป็นNagiosWSCมันช่วยให้คุณทำagentlessการตรวจสอบของโฮสต์ของ Windows มากกว่า WMI


ไม่มีเอเจนต์ แต่มีจุดเดียวขนาดใหญ่ที่ล้มเหลวฮึ
โตโต้

1

หนึ่งที่ตรวจสอบเวลาแฝงที่เกิดขึ้นจริงเพื่อดึงขึ้นเว็บไซต์และสแกนหาแท็กที่ซ่อนสถานะ ': ok' มันจับปัญหากับแคชปลาหมึกของเราและปัญหาชุดภาษาที่เกิดขึ้นเพียงครั้งเดียวทุกสองสามคืนเวลาตี 3 เมื่อมีคนเข้าชมเว็บไซต์ด้วยเบราว์เซอร์ที่ขอหน้าภาษาตุรกีรุ่นสากล

อย่างจริงจังตั้งค่าการตรวจสอบทุกประเภทที่คุณสามารถทำได้ ข้อผิดพลาดและข้อผิดพลาดแปลก ๆ ที่คุณสามารถจับได้ในสภาพแวดล้อมที่ซับซ้อนพร้อมการตรวจสอบที่ดีนั้นยอดเยี่ยมมาก นอกจากนี้ให้บันทึกข้อมูลประสิทธิภาพของคุณไปยังฐานข้อมูล rrd และแสดงใน Cacti


1

หนึ่งในปลั๊กอินที่สำคัญที่สุดคือปลั๊กอินที่ฉันเขียนด้วยตัวเอง: check_rdiff_backup ฉันทำการสำรองข้อมูลในต่างประเทศและ Nagios บอกฉันว่ามีอะไรเกิดขึ้นกับพวกเขาหรือไม่และเมื่อใด

หากคุณกำลังมองหาปลั๊กอินสำรองข้อมูล rdiff มีอยู่หนึ่งรายการที่คุณสามารถหาได้บน Google


1
คุณรู้จักหนึ่งสำหรับ rsnapshot หรือไม่
Rory

1

check_curl สำหรับฉันมาจากสวรรค์ สร้างความแตกต่างอย่างแท้จริงสำหรับความยืดหยุ่นในการตรวจสอบเว็บไซต์และพบว่าง่ายกว่า webinject มากด้วยฟังก์ชันการทำงานเกือบทั้งหมดที่ฉันต้องการ


1

ไม่ใช่ปลั๊กอินอย่างเคร่งครัด แต่การใช้ twurl ( https://github.com/marcel/twurl ) เพื่อทำงานเป็นวิธีในการตั้งค่าการแจ้งเตือนเป็นสิ่งที่มาจากสวรรค์อย่างแท้จริง ไม่จำเป็นต้องมีการแจ้งเตือนทาง SMS และเพียงแค่ตอบสนองทุกรอบ

รายละเอียดเกี่ยวกับวิธีการทำ: Nagios แจ้งเตือนโดยใช้ twitter (พร้อม twurl) ไม่ทำการยิง - ขอโทษสำหรับการโปรโมตตนเองที่ไร้ยางอาย;)

สิ่งอื่น ๆ...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) มีประโยชน์อย่างไม่น่าเชื่อเมื่อใช้ร่วมกับโหลด CPU มาตรฐานและการตรวจสอบหมายเลขกระบวนการในการพิจารณาว่าเมื่อใดที่ IO ถูกผูกไว้และวิธีการใด . การใช้ nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) ทำให้ง่ายยิ่งขึ้น


1

ดีง่ายธรรมดาและเริ่มต้น - check_disk, check_load, check_http สมบูรณ์แบบพอสำหรับกรณีส่วนใหญ่ (ส่วนใหญ่เราต้องการทราบว่าเซิร์ฟเวอร์เว็บไซต์ทำงานและทำงานใช่ไหม)

และนอกเหนือจาก check_disk และ check_swap จะมี check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details ที่ให้หน่วยความจำใช้ ...




0

นี้เป็นชนิดของการโกงเพราะผมได้ทำมากของการพัฒนาในนั้นและมันจริงตรวจสอบจำนวนมากสิ่งที่แตกต่างกันในครั้งเดียว แต่ nagios ประโยชน์มากที่สุด 'ปลั๊กอิน' สำหรับฉันคือResmon เป็นเอเจนต์ที่คุณรันบนเซิร์ฟเวอร์เองและ nagios เชื่อมต่อผ่าน http เพื่อทำการตรวจสอบ ฉันเดาว่ามันคล้ายกับสิ่งที่ nrpe ทำ แต่ด้วยการตัดสินใจออกแบบต่าง ๆ จำนวนมาก


0

ฉันใช้สองปลั๊กอิน .. หนึ่งคือการให้ฟีด XML ของการแจ้งเตือนและอื่น ๆ เพื่อส่งการแจ้งเตือนผ่านทาง Twitter ทั้งสองมีประโยชน์ (นอกเหนือจากปลั๊กอินปกติ) หากคุณนับ NRPE เป็นปลั๊กอินให้เพิ่มเข้าไปด้วย


0

check_apt เจ๋งจริงและเตือนฉันเกี่ยวกับการปรับปรุงเซิร์ฟเวอร์ Debian ของฉัน


0

เมื่อเร็ว ๆ นี้ฉันเริ่มใช้ปลั๊กอินcheck_multiโดยใช้NRPEแบบแพตช์ / ปรับปรุงสำหรับเอาต์พุตขนาดใหญ่ (เนื่องจาก HTML และข้อมูลประสิทธิภาพ)
มันเกือบจะเป็น "หนึ่งปลั๊กอินที่จะปกครองพวกเขาทั้งหมด"! ;-)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.