คำถามติดแท็ก nagios

Nagios เป็นระบบตรวจสอบที่ช่วยให้องค์กรสามารถระบุและแก้ไขปัญหาโครงสร้างพื้นฐานด้านไอทีก่อนที่จะส่งผลกระทบต่อกระบวนการทางธุรกิจที่สำคัญ

2
ทำให้เอสเอสเงียบอย่างแท้จริง
ฉันครึ่งทางผ่านการเขียนสคริปต์ nagios และฉันได้รับความรำคาญกับ SSH ตามหน้าคน: -q Quiet mode. Causes all warning and diagnostic messages to be suppressed. แต่ถ้าฉันเปิดใช้งานสถานะเงียบแล้วผ่านพอร์ตที่ไม่ถูกต้องฉันยังคงได้รับข้อผิดพลาด: $ ssh user@localhost -q -p test Bad port 'test' นี่เป็นปัญหาเพราะนั่นจะทำให้ข้อความนั้นเป็นบรรทัดแรกและนั่นคือสิ่งที่ Nagios คว้า ฉันต้องการส่งออกบางอย่างเช่น "คำเตือน | ข้อผิดพลาด SSH" หลังจากรับ!= 0รหัสออกจาก ssh แต่บรรทัดแรกที่ฉันสามารถส่งออกได้จะเป็น 2 บรรทัด ฉันจะทำให้ SSH TRULY เงียบได้อย่างไร หมายเหตุ: ฉันไม่แน่ใจว่าจะโพสต์คำถามนี้บน serverfault, superuser หรือ …
15 ssh  bash  nagios 

5
ฉันจะรู้ได้อย่างไรว่า Windows กำลังทำงานในเซฟโหมดหรือไม่
ฉันมีเซิร์ฟเวอร์ Windows ที่บางครั้งจะรีบูทเข้าสู่เซฟโหมดหลังจากอัพเดต ฉันทำงานเกี่ยวกับปัญหานั้น แต่สิ่งที่ฉันอยากรู้จริงๆคือฉันจะตรวจสอบได้อย่างไรว่า Windows ทำงานในเซฟโหมดหรือไม่ เป็นการดีที่ฉันต้องการรวมไว้ในสคริปต์ที่จะส่งการตรวจสอบแฝงไปยังกล่อง Nagios ของเราที่มีสถานะ มีตัวแปรสภาพแวดล้อมที่ฉันสามารถใช้หรือวิธีการบางอย่างเพื่อรับข้อมูลนี้ผ่านบรรทัดคำสั่งหรือไม่

6
คุณมอนิเตอร์เซิร์ฟเวอร์การมอนิเตอร์ได้อย่างไร?
ดังนั้นเราจึงเรียกใช้ Groundworks (กับ Nagios) บน CentOS เพื่อตรวจสอบเซิร์ฟเวอร์และกระบวนการต่างๆของเรา ฉันได้ตั้งค่าให้ส่งอีเมลและข้อความ SMS โดยอัตโนมัติเมื่อสิ่งต่างๆเข้าสู่สถานะคำเตือนหรือวิกฤต โดยปกติจะใช้งานได้อย่างสมบูรณ์แบบ อย่างไรก็ตามสองครั้งเรามีปัญหากับ Postfix บนเซิร์ฟเวอร์นั้นที่ Postfix ตัดสินใจหยุดส่งอีเมล เวลาล่าสุดใช้เวลา 4 วันเพราะไม่มีใครสังเกตเห็น นั่นทำให้ฉันมีคำถามสำคัญ: ฉันจะตรวจสอบเซิร์ฟเวอร์การมอนิเตอร์ของฉันได้อย่างไร

6
คำเตือนและค่าที่สำคัญใดที่จะใช้สำหรับ check_load
ตอนนี้ฉันกำลังใช้ค่าเหล่านี้: # y = c * p / 100 # y: nagios value # c: number of cores # p: wanted load procent # 4 cores # time 5 minutes 10 minutes 15 minutes # warning: 90% 70% 50% # critical: 100% 80% 60% command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4 แต่ค่าเหล่านี้เป็นเพียงการสุ่มเลือกเกือบ …

3
ฉันจะยกเลิกการหยุดทำงานที่กำหนดไว้ใน Nagios ได้อย่างไร
ฉันมี Nagios 3.5.1 ตรวจสอบเซิร์ฟเวอร์จำนวนมาก ในการทำสิ่งต่าง ๆ เช่นการอัพเกรดแกนหลักของ Drupal หรือ Wordpress ฉันลงไปที่ไซต์และตั้ง Nagios ให้หยุดทำงานตามกำหนด บางครั้งฉันก็เสร็จสิ้นภายในเวลาไม่เกิน 2 ชั่วโมงและไม่ต้องการเพิกเฉย ฉันจะบอก Nagios ได้อย่างไรว่าฉันเสร็จแล้วและยกเลิกการหยุดทำงานตามกำหนดเวลา
12 nagios 

3
ส่งเมลขาออกทั้งหมดไปที่ / dev / null
ด้วย sendmail คุณจะส่งจดหมายขาออกทั้งหมดไปยัง / dev / null ได้อย่างไรหรือป้องกันไม่ให้อีเมลถูกจัดคิวหรือส่งเลย ในกล่องพัฒนา nagios ฉันต้องการป้องกันการส่งเมลเพื่อไม่ให้การแจ้งเตือนออกไป การหยุดเมลขาออกจะทำให้ฉันทดสอบการตั้งค่า nagios ตามที่เป็นอยู่และป้องกันการแจ้งเตือนปลอม
12 sendmail  nagios 

2
การกระจายทางภูมิศาสตร์ทนต่อความผิดพลาดและระบบตรวจสอบแอปพลิเคชัน / โฮสต์ที่“ ชาญฉลาด”
ทักทาย, ฉันต้องการถามความคิดเห็นของกลุ่มและมุมมองเกี่ยวกับระบบการตรวจสอบแบบกระจายคุณใช้อะไรและคุณตระหนักถึงสิ่งใดที่อาจทำเครื่องหมายในช่องของฉัน ความต้องการค่อนข้างซับซ้อน ไม่มีจุดล้มเหลวเดียว จริงๆ. ฉันตายไปแล้ว! ต้องสามารถทนต่อความล้มเหลวของโหนดเดี่ยว / หลายโหนดได้ทั้ง 'ต้นแบบ' และ 'ผู้ปฏิบัติงาน' และคุณอาจคิดว่าไม่มีตำแหน่งการตรวจสอบ ("ไซต์") ที่มีหลายโหนดอยู่ในนั้นหรืออยู่ในเครือข่ายเดียวกัน ดังนั้นสิ่งนี้อาจเป็นกฎของเทคนิค HA ดั้งเดิมเช่น DRBD หรือ Keepalive ตรรกะการกระจายฉันต้องการที่จะปรับใช้ 5+ โหนดในหลายเครือข่ายภายในหลายศูนย์ข้อมูลและในหลายทวีป ฉันต้องการมุมมอง "Birds Eye" ของเครือข่ายและแอปพลิเคชันของฉันจากมุมมองของลูกค้าของฉันคะแนนโบนัสสำหรับตรรกะการตรวจสอบจะไม่จมเมื่อคุณมี 50+ โหนดหรือแม้กระทั่ง 500+ โหนด ต้องมีความสามารถในการจัดการเช็คโฮสต์ / บริการจำนวนพอสมควรพอสมควรลากานิโอสำหรับตัวเลขของ ballpark ถือว่ามีโฮสต์ 1,500-2500 โฮสต์และบริการ 30 รายการต่อโฮสต์ มันจะดีมากถ้าเพิ่มโหนดการตรวจสอบมากขึ้นช่วยให้คุณสามารถขยายขนาดเชิงเส้นบางทีในเวลา 5 ปีฉันอาจมองตรวจสอบโฮสต์ 5000 และ 40 บริการต่อโฮสต์! เพิ่มในจากบันทึกของฉันข้างต้นเกี่ยวกับ 'ตรรกะกระจาย' …
12 monitoring  nagios  sla 

6
ปลั๊กอิน Nagios ทั่วไปเพื่อตรวจสอบว่ากระบวนการ / บริการเฉพาะกำลังทำงานอยู่หรือไม่
ฉันเห็นในhttp://exchange.nagios.orgว่าไม่มีปลั๊กอินเพื่อตรวจสอบว่า sendmail, xinetd, automount, ypserv, ypbind, mailscanner, mcafee, clamav, เซิร์ฟเวอร์ samba และ openvpn กำลังทำงานอยู่ แน่นอนว่าสิ่งเหล่านี้ควรเป็นโปรแกรมที่เสถียร แต่มีความสำคัญดังนั้นฉันจึงต้องการตรวจสอบว่าพวกเขากำลังทำงานอยู่หรือไม่ คำถาม มีปลั๊กอินทั่วไปเพื่อตรวจสอบกระบวนการเฉพาะหรือไม่
12 linux  ubuntu  centos  nagios 

2
ไม่มีใครใช้ check_mk สำหรับ Nagios หรือไม่ อะไรที่ฉันควรทราบก่อนที่จะพิจารณามัน?
http://mathias-kettner.de/check_mk.html ฉันได้ทำการทดสอบกับเครื่องพัฒนาสองสามเครื่องแล้วและมันก็ดูดี อย่างไรก็ตามฉันไม่สามารถหาข้อมูลมากมายเกี่ยวกับการปรับใช้ของมัน ไม่มีใครทำงานนี้อย่างแข็งขัน? มีใครออกกฎนี้เป็นตัวเลือกด้วยเหตุผลบางอย่าง?
12 nagios  check-mk 

8
ความแตกต่างที่สำคัญระหว่าง Nagios และ Open NMS คืออะไร?
ฉันกำลังมองหาระบบตรวจสอบที่ครอบคลุมกับผู้จัดการของฉันและกำลังพิจารณา OpenNMS อยู่ อย่างไรก็ตามฉันได้เห็นการสรรเสริญของ Nagios ที่นี่และฉันหวังว่าคนที่มีประสบการณ์จะช่วยให้เห็นความแตกต่างที่สำคัญสำหรับฉัน ความสนใจของพวกเขาแตกต่างกันหรือว่าพวกเขาเป็นแค่คู่แข่ง? หากพื้นหลังบางอย่างช่วยเราเรียกใช้เซิร์ฟเวอร์ในสถานที่ 6 แห่ง (ไฟล์เซิร์ฟเวอร์ PBX พร็อกซีแอปพลิเคชั่น ฯลฯ ) และเซิร์ฟเวอร์นอกสถานที่สองแห่ง (เว็บไซต์ / การพัฒนา) พร้อมสวิตช์และเราเตอร์สองตัว บริการตรวจสอบสถานะที่เราติดตั้งจะทำงานบนเดสก์ท็อปที่ได้รับการแปลงแยกต่างหากที่รัน FreeBSD ทุกสิ่งของเราทำงานได้ทั้ง Linux หรืออนุพันธ์ BSD เรากำลังมองหาที่จะใช้จ่ายเงินเพื่อดำเนินการนี้ (ถอนหายใจ) ขอบคุณสำหรับความช่วยเหลือ แก้ไข ดูเหมือนว่า openNMS นำเสนอโซลูชั่นที่ครอบคลุมมากขึ้นใกล้กับสิ่งที่ฉันต้องการ อย่างไรก็ตามเนื่องจากเขียนเป็นภาษาจาวาและพอร์ตไม่ได้อยู่ในทรีของพอร์ตอย่างเป็นทางการจึงถูกคัดค้าน ตอนนี้เริ่ม Nagios ของฉันจะดีกว่าเพียงแค่แคมเปญ MRTG ขอบคุณสำหรับคำตอบที่รวดเร็ว -โอกาส

4
วิธีตรวจสอบว่าการอัปเดตยำครั้งสุดท้ายถูกเรียกใช้
มีวิธีบัญญัติมาตรฐานเพื่อค้นหาครั้งล่าสุดที่yum updateทำงานบนระบบหรือไม่? การตั้งค่าของเราคือเรามีเซิร์ฟเวอร์การแสดงละครที่เรียกใช้การอัปเดตอัตโนมัติและหากไม่ล้มเหลวเราจะอัปเดตเซิร์ฟเวอร์การผลิตของเราด้วยตนเองประมาณเดือนละครั้ง (ยกเว้นการอัปเดตที่สำคัญ) (ฉันพูดด้วยตนเองนึกคิดฉันต้องการทริกเกอร์การอัปเดตด้วยตนเองทั้งหมด แต่นั่นเป็นปัญหาอื่น) แต่คุณยุ่งงานลื่น ฯลฯ ดังนั้นฉันต้องการตั้งค่าการตรวจสอบ nagios ที่จะเริ่มรบกวนเราถ้าเราปล่อยมันนานเกินไป การค้นหาเว็บไม่ได้ทำให้ฉันไปไกลมาก สิ่งที่ดีที่สุดที่ฉันพบในตอนนี้คือ: grep Updated /var/log/yum.log | tail -1 | cut -d' ' -f 1-2 ซึ่งให้บางอย่างกับMar 12ฉันซึ่งฉันสามารถแปลงเป็นวันที่ได้ มีปัญหาเล็กน้อยบางอย่างเกี่ยวกับว่าวันนี้เป็นปีนี้หรือปีที่แล้วและฉันจำเป็นต้องตรวจสอบ/var/log/yum.log.1ในกรณีที่ตรวจสอบทันทีหลังจาก logrotate แต่นั่นเป็นเพียงรายละเอียดสคริปต์ แน่นอนว่านี่อาจ 'หลง' โดยการอัปเดตเป็นแพ็คเกจเดียวมากกว่าการอัพเดททั่วไป ดังนั้นจึงมีวิธีที่ยอมรับมากขึ้นเพื่อดูเมื่อyum updateถูกเรียกใช้? แก้ไข:ตอนนี้ฉันเขียนปลั๊กอิน Nagios NRPE ที่ใช้ความคิดที่ฉันหยิบยกไว้ในคำถาม คุณสามารถคว้าได้จากhttps://github.com/aptivate/check_yum_last_update

5
คุณติดตาม Nagios / Capistrano ได้อย่างไรเมื่อใช้ EC2
ฉันใช้ Amazon EC2 สำหรับแอพมือถือของฉัน ขึ้นอยู่กับโหลดของแอปพลิเคชันในเวลาที่กำหนดฉันอาจวางไข่อินสแตนซ์ใหม่แล้วนำลงเมื่อโหลดต่ำเพื่อประหยัดค่าใช้จ่าย หนึ่งจะติดตามการกำหนดค่า Nagios สำหรับสภาพแวดล้อมแบบไดนามิกได้อย่างไร เมื่อมีข้อตกลงกับฮาร์ดแวร์ที่มีการจัดการไฟล์กำหนดค่าสามารถคาดเดาได้ ในกรณีนี้ Nagios, Capistrano และไฟล์การกำหนดค่าอื่น ๆ จะต้องถูกเพิ่มเข้าไป Capistrano จำเป็นต้องทราบว่าจะติดตั้งบิวด์ใหม่สำหรับเซิร์ฟเวอร์แอพ Nagios จำเป็นต้องรู้เพื่อลบอินสแตนซ์ที่มีอยู่หรือเพิ่มอินสแตนซ์ใหม่สำหรับการตรวจสอบ Nagios จำเป็นต้องทราบด้วยว่าโหนดนั้นถูกลบโดยเจตนาหรือถ้าโฮสต์นั้นล้มเหลวเนื่องจากข้อผิดพลาด สิ่งนี้ทำกับโลกมหัศจรรย์ของ VPS / อินสแตนซ์ไดนามิกได้อย่างไร

9
GUI การกำหนดค่า Nagios [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ปิดให้บริการใน5 ปีที่ผ่านมา ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ เราได้ใช้ Nagios สำหรับบริการบนเครือข่ายของเราและมันใช้งานได้ดี การแจ้งเตือนนั้นดีและตัวเลือกการกำหนดค่าที่หลากหลายนั้นมีประโยชน์มาก ถึงจุดนี้เราได้ทำการตั้งค่าทั้งหมดด้วยมือโดยการแก้ไขไฟล์โดยตรง ในขณะที่เราเริ่มเปิดสิ่งนี้ขึ้นเล็กน้อยสำหรับผู้ดูแลระบบรายอื่นฉันต้องการใช้ GUI ที่จะลดโอกาสของข้อผิดพลาด ฉันได้ตรวจสอบโครงการ GUI ที่แตกต่างกันสองสามโครงการและจนถึงตอนนี้ดูเหมือนว่าNagiosQLและNConfเป็นคู่แข่งอันดับต้น ๆ มีคำแนะนำใด ๆ ระหว่างสองสิ่งนี้หรืออาจจะเป็นคำแนะนำอื่น ๆ ที่ควรพิจารณา? เรื่องราวเกี่ยวกับการติดตั้งและใช้งาน "gotchas" และเคล็ดลับที่อาจเป็นประโยชน์ในการตัดสินใจ

5
แนวทางปฏิบัติที่ดีที่สุดของเซิร์ฟเวอร์ Nagios
ฉันใช้เซิร์ฟเวอร์ Nagios ขนาดกลาง มันตรวจสอบประมาณ 40 เซิร์ฟเวอร์ที่มี 180 บริการในปัจจุบันและมีการเติบโตเพียงวัน ฉันย้ายจากการตั้งค่า Nagios เก่าที่กำหนดค่าในแบบลึกลับมากบังคับให้ฉันตั้งค่าใหม่ทุกอย่างตั้งแต่เริ่มต้น ตอนนี้เซิร์ฟเวอร์กำลังทำงานและทำงานได้ในสิ่งที่เราต้องการมากที่สุดฉันกำลังมองหาวิธีทำให้มันปรับขนาดได้อีกเล็กน้อย ปัจจุบันโฮสต์แต่ละแห่งเป็นไฟล์ของตัวเอง/etc/nagios/hosts/และโฮสต์แต่ละแห่งมีบริการทั้งหมดในไฟล์เดียวกัน เห็นได้ชัดว่าไม่ได้ดีที่สุด แต่ก็ไม่ทำให้การกำหนดค่าของฉันทั้งหมดเป็นไฟล์ที่แตกต่างกันนับร้อย ดังนั้นคำถามของฉันคือ: สำหรับผู้ที่มีประสบการณ์ของ Nagios จะมีวิธีใดดีที่สุดในการใช้ประโยชน์จากกลุ่มโฮสต์ / กลุ่มบริการโดยไม่ทำให้การกำหนดค่ายุ่งยากเกินไป?

1
เหตุใด getfattr จึงไม่แสดงข้อมูลใด ๆ สำหรับไฟล์ที่มีการตั้งค่าบิตคุณสมบัติเพิ่มเติม?
ฉันได้ติดตั้ง Nagios XI บน CentOS 6.2 แล้วและต้องการแก้ไขสคริปต์สำรอง ฉันสังเกตเห็นว่าบิตคุณสมบัติเพิ่มเติมนั้นถูกตั้งค่าไว้สำหรับเชลล์สคริปต์นี้ดังนั้นฉันต้องการแน่ใจว่าจะไม่ทำอะไรผิดพลาดเมื่อฉันทำการเปลี่ยนแปลง ฉันทดลองและพบว่า "cp -p" ไม่รักษาการตั้งค่านี้ไว้ (ดูความคิดเห็นสำหรับการอัปเดตเกี่ยวกับเรื่องนี้) ฉันใหม่กับคุณลักษณะเพิ่มเติมบน Linux และพบว่ามีคำสั่ง 'getfattr' ที่ควรแสดงแอตทริบิวต์เพิ่มเติม แต่ไม่แสดงอะไรสำหรับไฟล์นี้ cd /usr/local/nagiosxi/scripts ll backup_xi.sh -rwxr-x---. 1 nagios nagios 2757 Jul 3 10:03 backup_xi.sh* # nothing is displayed by 'getfattr': getfattr -d backup_xi.sh # and nothing special seems to be present according …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.