คำถามติดแท็ก monitoring

แอพพลิเคชั่นหรืออุปกรณ์ที่สังเกตเครื่องจักรระบบและเครือข่ายเพื่อค้นหาปัญหาและแจ้งผู้ดูแลระบบ

6
Nagios ตรวจสอบข้อความบนเว็บไซต์
ฉันสงสัยว่าฉันสามารถรับความช่วยเหลือเกี่ยวกับการตรวจสอบข้อความบนเว็บไซต์ได้ไหม IE หากฉันต้องการตรวจสอบ google.com สำหรับข้อความ "ความเป็นส่วนตัว" ฉันคิดว่าฉันจะใช้คำสั่งต่อไปนี้: check_http -H google.com -u http://www.google.com -s "Privacy" แต่มันไม่ทำงาน ฉันได้รับ "ตกลง" ไม่ว่าฉันจะใส่เครื่องหมายคำพูดอะไร เห็นได้ชัดว่าฉันใช้ทั้งคำสั่งที่ไม่ถูกต้องหรือตัวเลือกที่ผิด กรุณาช่วย.

3
ตรวจสอบแบนด์วิดธ์อินเทอร์เน็ต
เรามีไฟร์วอลล์ / พร็อกซี IPCop ติดตั้งในเครือข่ายของเราและถึงแม้ว่าฉันสามารถใช้ iftop เพื่อดูว่าลูกค้าใช้อินเทอร์เน็ตเป็นอย่างไรบ้างเป็นไปได้ไหมที่จะตรวจสอบจากนอกพร็อกซีด้วย ntop โปรดทราบว่าฉันไม่สนใจการรับส่งข้อมูล LAN เฉพาะทราฟฟิกที่ไปยัง / จากอินเทอร์เน็ต

6
ทำให้เชื่องเครือข่ายที่มีอยู่ [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ปิดให้บริการใน5 ปีที่ผ่านมา ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ เมื่อเร็ว ๆ นี้ฉันได้เข้าร่วม บริษัท ในฐานะที่เป็นคนไอที แต่เพียงผู้เดียวและฉันพยายามดิ้นรนเพื่อจัดการกับซอฟต์แวร์และฮาร์ดแวร์ที่เราเป็นเจ้าของและวิธีการปรับใช้ คำนึงถึงเวลาและงบประมาณที่ จำกัด ของฉันเครื่องมือหรือกระบวนการใดที่จะมีประสิทธิภาพในการค้นหาและจัดการข้อมูลนี้ สิ่งที่ฉันกำลังดูแลรวมถึง: เดสก์ท็อปประมาณ 35 เครื่องรวมถึงพีซีและ Mac เซิร์ฟเวอร์ของ Microsoft รวมถึงเซิร์ฟเวอร์ AD, Exchange, SQL และ IIS เครือข่ายแบบใช้สายไร้สายและ VPN เป้าหมายของฉันคือ: ระบุและปรับปรุงปัญหาใด ๆ ตรวจสอบให้แน่ใจว่าเราได้รับอนุญาตอย่างถูกต้อง เอกสารเพียงพอที่จะทำให้งานต่อไปง่ายขึ้น
10 monitoring 

19
ในฐานะผู้ดูแลระบบปลั๊กอินเสริมของ Firefox ช่วยให้คุณทำงานของคุณได้อย่างไร? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ปิดให้บริการใน7 ปีที่ผ่านมา ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันรู้ว่ามีปลั๊กอิน Firefox หลายอย่างที่ประเมินค่าไม่ได้สำหรับการพัฒนา มีปลั๊กอินอะไรบ้างที่มีประโยชน์สำหรับการดูแลระบบการตรวจสอบและสิ่งที่คล้ายกัน ปลั๊กอินใดที่ทำให้งานประจำวันของคุณในฐานะผู้ดูแลระบบหรือเครือข่ายง่ายขึ้น?

2
ฉันจะรับอีเมลแจ้งเตือนได้อย่างไรเมื่ออาร์เรย์ RAID ถูกลดระดับลง VMware ESXi 5.0, MegaRAID SAS 9260-4i
เราเพิ่งซื้อเซิร์ฟเวอร์ "กล่องสีขาว" เพื่อเรียกใช้ VMware ESXi 5.0 (เราวางแผนที่จะใช้ชุด vSphere 5 Essentials) คู่มือความเข้ากันได้ของ VMware ตัวควบคุม LSI Logic MegaRAID SAS 9260-4i RAIDของเซิร์ฟเวอร์สามารถทำงานร่วมกันได้ (ประเภทการสนับสนุนที่แสดงรายการเป็น "กล่องจดหมาย") ฉันได้ติดตั้ง ESXi 5.0 บนโฮสต์แล้วและฉันยังติดตั้ง vCenter Server Appliance ด้วย ฉันเชื่อมต่อกับ vCenter Server โดยใช้ไคลเอนต์ vSphere และฉันสามารถดูรายการการเตือนที่กำหนดไว้ล่วงหน้าซึ่งรวมถึงการเตือนที่กำหนดไว้เมื่อใดก็ตามที่ "สถานะการจัดเก็บโฮสต์" การเปลี่ยนแปลงซึ่งฟังดูเหมือนสิ่งที่ฉันต้องการ ฉันเพิ่งลองดึงหนึ่งในไดรฟ์จากอาเรย์ RAID (ส่งผลให้เกิดเสียงบี๊บจากคอนโทรลเลอร์ RAID) แต่ไม่มีอะไรเกิดขึ้นใน vCenter การแจ้งเตือน "สถานะการจัดเก็บโฮสต์" ดูเหมือนว่าจะไม่ถูกเรียก สิ่งที่ฉันต้องทำคือการกำหนดค่า vCenter เพื่อส่งอีเมลหากอาร์เรย์ RAID …

4
ตรวจสอบไฟล์กระบวนการเปิดบน linux (เรียลไทม์)
ไฟล์ที่เปิดโดยกระบวนการ XYZ สามารถพบได้ด้วยคำสั่ง ls -l /proc/PID/fd มีอยู่แล้วที่สามารถทำได้ในวิธีการโต้ตอบมากขึ้นเช่นtailการรีเฟรชอัตโนมัติทุก ๆ x วินาที?

2
มีเหตุผลที่จะใช้ Nagios เพื่อตรวจสอบว่าบริการไม่พร้อมใช้งานหรือไม่?
สมมติว่าฉันมีเซิร์ฟเวอร์ที่มีส่วนต่อประสานส่วนตัวและส่วนต่อประสานสาธารณะ สาธารณะอาจมีสิ่งต่าง ๆ เช่นเซิร์ฟเวอร์ HTTP (S) ส่วนตัวอาจมี MySQL และ SSH เห็นได้ชัดว่า Nagios มีประโยชน์ในการตรวจสอบว่าบริการกำลังทำงานอยู่บนอินเตอร์เฟสที่เกี่ยวข้อง แต่เป็นความคิดที่ดีหรือไม่ที่จะสร้างการตรวจสอบที่ทดสอบอย่างชัดเจนว่าพอร์ต MySQL และ SSH ไม่ได้เปิดอยู่ในส่วนต่อประสานสาธารณะ แนวคิดคือการตรวจจับการกำหนดค่าผิดพลาดโดยไม่ได้ตั้งใจซึ่งเปิดบริการที่ควรเป็นแบบส่วนตัวและแจ้งเตือนอย่างเหมาะสม ส่วนหนึ่งของฉันมีความคิดที่ว่าสิ่งนี้จะไม่ขยายขนาดอย่างมาก - ลองจินตนาการว่ามีกฎ DROP iptables ตัวอย่างเช่นการตรวจสอบจะต้องรอจนกว่าการตรวจสอบการหมดเวลาเกินกว่าจะเสร็จสมบูรณ์และดำเนินต่อไป แต่การหมดเวลานั้นจะต้องสูงพอที่จะสามารถแยกความแตกต่างของบริการที่ถูกบล็อกจากบริการเปิดที่จมลง นี่เป็นแนวคิดที่ใช้ได้จริงหรือไม่? Nagios เป็นเครื่องมือที่ใช่หรือไม่? ฉันยังไม่ได้ดูถึงความเป็นไปได้ของการคัดค้านผลจากปลั๊กอินตรวจสอบ TCP แต่ฉันแน่ใจว่ามันเป็นไปได้ ...

2
การคำนวณวันจนกว่าดิสก์จะเต็ม
เราใช้กราไฟท์เพื่อติดตามประวัติการใช้งานดิสก์เมื่อเวลาผ่านไป ระบบการแจ้งเตือนของเราพิจารณาข้อมูลจากกราไฟท์เพื่อแจ้งเตือนเราเมื่อพื้นที่ว่างต่ำกว่าจำนวนบล็อกที่กำหนด ฉันต้องการได้รับการแจ้งเตือนที่ชาญฉลาด - สิ่งที่ฉันสนใจจริงๆคือ "ฉันต้องใช้เวลานานแค่ไหนก่อนที่ฉันจะต้องทำอะไรบางอย่างเกี่ยวกับพื้นที่ว่าง" เช่นถ้าแนวโน้มแสดงว่าใน 7 วันฉันจะหมดดิสก์ เว้นวรรคแล้วยกคำเตือนหากน้อยกว่า 2 วันให้เพิ่มข้อผิดพลาด อินเทอร์เฟซแดชบอร์ดมาตรฐานของกราไฟต์นั้นค่อนข้างฉลาดด้วยอนุพันธ์และ Holt Winters Confidence bands แต่จนถึงตอนนี้ฉันยังไม่พบวิธีแปลงสิ่งนี้เป็นตัวชี้วัดที่สามารถดำเนินการได้ ฉันยังพอใจกับการบดตัวเลขด้วยวิธีอื่น ๆ (เพียงดึงตัวเลขดิบจากแกรไฟต์และเรียกใช้สคริปต์เพื่อทำเช่นนั้น) ปัญหาหนึ่งคือกราฟไม่ราบรื่น - ไฟล์เพิ่มและลบ แต่แนวโน้มทั่วไปเมื่อเวลาผ่านไปคือการเพิ่มการใช้พื้นที่ว่างในดิสก์ดังนั้นอาจมีความจำเป็นต้องดูค่าต่ำสุดในตัวเครื่อง (หากดูที่เมตริก "ดิสก์ฟรี" ) และวาดแนวโน้มระหว่างราง มีใครทำเช่นนี้?

2
โซลูชั่นการจัดการ API [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับข้อบกพร่องของเซิร์ฟเวอร์ ปิดให้บริการใน6 ปีที่ผ่านมา ขณะนี้ฉันกำลังสร้าง API และกำลังมองหาเครื่องมือเพื่อให้ฉันสามารถตรวจสอบ (ใน GUI) และการใช้อัตรา จำกัด ฉันเจอโซลูชันระดับองค์กรสองสามอัน ได้แก่ : http://apigee.com/ http://mashery.com/ http://www.layer7tech.com/ http://www.3scale.net/ แผนองค์กร Apigee เป็นสิ่งที่ฉันกำลังมองหา แต่แผนเริ่มต้นที่ $ 3,000 / เดือนซึ่งอยู่นอกช่วงราคาของฉัน โซลูชันอื่นทั้งหมดมีราคาแพงเกินไปหรือไม่มีวิธีแก้ไขปัญหาที่ฉันกำลังมองหา สิ่งนี้ทำให้ฉันมองไปที่ตัวเลือกโอเพนซอร์ซรวมถึง: http://apiaxle.com/ https://code.google.com/p/varnish-apikey/wiki/UsageManual วานิชดูเหมือนจะเป็นวิธีการแก้ปัญหาที่ค่อนข้างสมบูรณ์ อย่างไรก็ตามฉันจะต้องสร้าง GUI เพื่อให้เห็นภาพข้อมูล ตัวเลือกสุดท้ายของฉันคือการสร้างโซลูชันตั้งแต่เริ่มต้นโดยใช้ EventMachine และ ruby คำแนะนำใด ๆ?

1
ใครสามารถอธิบาย“ ใช้กรณี” สำหรับกราฟ munin เริ่มต้น?
เมื่อติดตั้ง munin จะเปิดใช้งานชุดปลั๊กอินเริ่มต้น (อย่างน้อยใน Ubuntu) หรือคุณสามารถเรียกใช้munin-node-configureเพื่อดูว่าปลั๊กอินใดที่ระบบของคุณรองรับ ส่วนใหญ่ของปลั๊กอินเหล่านี้จะลงจุดข้อมูลส่งตรง คำถามของฉันไม่ได้อธิบายลักษณะของข้อมูล (อาจ ... สำหรับบางคน) แต่มันคือสิ่งที่คุณมองหาในกราฟเหล่านี้? มันง่ายในการติดตั้ง munin และดูกราฟแฟนซี แต่การมีกราฟและไม่สามารถ "อ่าน" ทำให้พวกมันไร้ประโยชน์โดยสิ้นเชิง ฉันจะไปที่รายการปลั๊กอินมาตรฐานที่เปิดใช้งานโดยค่าเริ่มต้นในระบบของฉัน มันจะเป็นรายการยาว เพื่อความสมบูรณ์ฉันจะลงรายการปลั๊กอินที่ฉันคิดว่าจะเข้าใจและให้คำอธิบายสั้น ๆ เกี่ยวกับสิ่งที่ฉันคิดว่ามันใช้สำหรับ อ้อนวอนถูกต้องถ้าฉันผิดกับพวกเขา ดังนั้นฉันจะแบ่งคำถามนี้ออกเป็นสามส่วน: ปลั๊กอินที่ฉันไม่เข้าใจข้อมูล ปลั๊กอินที่ฉันเข้าใจข้อมูล แต่ไม่รู้ว่าควรระวังอะไร ปลั๊กอินที่ฉันคิดว่าเข้าใจ ปลั๊กอินที่ฉันไม่เข้าใจข้อมูล เหล่านี้อาจมีคำถามที่ไม่จำเป็นต้องมุ่งเป้าไปที่คนเดียว การไม่เข้าใจข้อมูลมักหมายถึงช่องว่างในความรู้พื้นฐานเกี่ยวกับระบบปฏิบัติการ / ฮาร์ดแวร์ .... ;) อย่าลังเลที่จะตอบกลับด้วยคำตอบ "giyf" นี่คือปลั๊กอินที่ฉันสามารถเดาได้ว่าเกิดอะไรขึ้น ... ฉันแทบจะไม่อยากดู "คาดเดา" เหล่านี้ ... Disk IOs ต่ออุปกรณ์ (IOs / วินาที) …

4
ตรวจสอบปริมาณการใช้ SSH ต่อผู้ใช้
เรามีแอปพลิเคชั่นสำรองที่ทำงานทุกๆ 12 ชั่วโมง เซิร์ฟเวอร์เดสก์ท็อปและแล็ปท็อปหลายเครื่องเชื่อมต่อกับอินสแตนซ์ EC2 และส่งข้อมูลสำรองผ่าน SFTP โดยใช้ข้อมูลรับรองการเข้าสู่ระบบของตนเอง หากพวกเขาต้องการกู้คืนไฟล์พวกเขาสามารถเรียกดูไฟล์ผ่าน SFTP-Client อย่างง่ายและกู้คืนไฟล์ได้ สิ่งนี้ทำงานได้ดีมากในช่วง 8 เดือนที่ผ่านมา ฉันต้องการทราบว่ามีการถ่ายโอนข้อมูลเป็นจำนวนเท่าใดต่อเดือนต่อผู้ใช้ผ่าน SSH ฉันไม่ต้องการบันทึกในช่วง 8 เดือนที่ผ่านมา แต่สิ่งที่จะบันทึกมันเริ่มต้นตอนนี้จะดี มีอะไรที่ทำให้ฉันทำอย่างนั้นได้ไหม ระบบปฏิบัติการ: Ubuntu 10.10

6
Nagios graphing solutions vs Munin / Cacti / Ganglia
ฉันมีการตั้งค่าเซิร์ฟเวอร์ nagios สำหรับการตรวจสอบเซิร์ฟเวอร์ ~ 30 Windows ฉันต้องการเพิ่มแผนภูมิที่ได้รับความนิยม ฉันได้อ่านแล้วว่าปลั๊กอินสร้างกราฟของ nagios นั้นเรียบง่ายและหลายคนใช้เครื่องมือสร้าง / แยกแผนภูมิแยกต่างหากแบบสแตนด์อโลน ข้อ จำกัด ของปลั๊กอินการทำกราฟของนากิโอะกับผลิตภัณฑ์แบบสแตนด์อโลนเช่น ganglia / munin / cacti คืออะไร ฉันสนใจคุณสมบัติเฉพาะและข้อดีที่แพ็กเกจแบบสแตนด์อโลนนำเสนอและปลั๊กอินการสร้างกราฟของ nagios ไม่

7
สีหางของบันทึก Apache
การตรวจสอบบันทึกของ Apache ด้วยtail –fแนวโน้มที่จะสร้างความรำคาญให้กับดวงตาเป็นระยะเวลานาน มีเครื่องมือ / ตัวเลือกใด ๆ ในการกำหนดสีของบันทึกผลลัพธ์หรือไม่? อาจส่งสัญญาณ FATAL ด้วยสีแดง ฯลฯ ...

3
ตรวจสอบการเรียกระบบของ CPU / ระบบใน Linux
ฉันมีสองกระบวนการที่กินเวลา CPU ของระบบมาก (ตามที่พิจารณาโดยดูที่ vmstat) มีวิธีง่าย ๆ ในการค้นหาชนิดของการเรียกระบบหรือไม่? ฉันรู้ว่ามี strace แต่มีวิธีที่เร็วและง่ายขึ้นหรือไม่ มีบางอย่างเช่น "top" สำหรับการโทรของระบบหรือไม่?


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.