คำถามติดแท็ก monitoring

แอพพลิเคชั่นหรืออุปกรณ์ที่สังเกตเครื่องจักรระบบและเครือข่ายเพื่อค้นหาปัญหาและแจ้งผู้ดูแลระบบ


2
OpenTSDB และ Graphite ต่างกันอย่างไร
เท่าที่ฉันสามารถบอกได้นี่คือความแตกต่างที่สำคัญ: OpenTSDBไม่ทำให้ข้อมูลเสื่อมสภาพเมื่อเวลาผ่านไปซึ่งแตกต่างจากGraphiteที่ขนาดของฐานข้อมูลถูกกำหนดไว้ล่วงหน้า OpenTSDB สามารถจัดเก็บการวัดต่อวินาทีเมื่อเทียบกับ Graphite ซึ่งมีช่วงเวลาเป็นนาที (ฉันไม่แน่ใจในเรื่องนี้เอกสาร Graphite แสดงนโยบายการเก็บข้อมูลที่เก็บการวัดทุกนาที แต่ฉันไม่รู้ว่านี่เป็นหน่วยต่ำสุดของเวลาหรือไม่ สามารถเล่นด้วย) ฉันต้องการตัดสินใจอย่างชาญฉลาดเกี่ยวกับเครื่องมือที่จะใช้ในการจัดเก็บตัวชี้วัดฉันเคยพลาดความแตกต่างอื่น ๆ ในทั้งสองระบบหรือไม่ พวกเขาเป็นนักแสดง / ปรับขนาดได้อย่างไร? คำถามโบนัส: มีระบบอนุกรมเวลาอื่นใดที่ฉันควรดู?

6
คำสั่ง“ top” ที่ดีกว่าสำหรับ Mac OS X หรือไม่ [ปิด]
topคำสั่งบน OS X เป็นเส็งเคร็งสวย .. หนึ่งที่มาพร้อมกับลินุกซ์ distros ที่สุดช่วยให้คุณสามารถเปลี่ยนการจัดเรียงตามคอลัมน์ที่ใช้<และ>มีโหมดสี (โดยการกดzคีย์) และพวงของตัวเลือกที่มีประโยชน์อื่น ๆ มีเครื่องมือบรรทัดคำสั่งทดแทนหรือไม่ เป็นการดีที่ฉันต้องการhtopสำหรับ OS X แต่เนื่องจากมันอาศัย/proc/ระบบไฟล์ ( ดูเธรดนี้ ) มันยังไม่ได้รับการพอร์ต (และอาจจะไม่เคย) คำตอบที่ชัดเจนคือ "การตรวจสอบกิจกรรม" แต่ฉันกำลังมองหาเครื่องมือบรรทัดคำสั่ง!

3
Shinken - ใครก็ตามที่ใช้มัน? [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังคำตอบที่จะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้จะเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน6 ปีที่ผ่านมา ฉันเพิ่งค้นพบShinkenซึ่งเป็นการใช้ Nagios ใหม่โดยใช้ python Shinken "แบ่ง" Nagios ใน daemons 5 ประเภทที่แตกต่างกันแต่ละอันทำงานแยกกัน ฉันยังไม่ได้ลองเลย แต่สำหรับสิ่งที่ฉันเห็นความคิดด้านสถาปัตยกรรมทั้งหมดนั้นยอดเยี่ยมสำหรับฉัน (มันใช้งานได้กับ Unix: กระบวนการหนึ่ง, งานหนึ่ง) แต่โครงการดูเหมือนว่าจะเป็น "สีเขียว" เล็กน้อย มีใครลองชิมชินบ้างไหม? ความคิดเห็นของคุณคืออะไร

2
มี Windows เทียบเท่ากับ 'CPU steal time' ของ Unix หรือไม่
เพื่อประเมินผลการปฏิบัติงานการตรวจสอบความถูกต้องในการทำงานแบบเสมือนแพลตฟอร์มที่CPU ขโมยเวลาได้กลายเป็นที่เกี่ยวข้องมากขึ้นตัวชี้วัด - ดูEC2 การตรวจสอบ: กรณีของ CPU ที่ถูกขโมยสำหรับสรุปคำแนะนำในบริบทของAmazon EC2และ IBM ของกระดาษในเวลา CPU บัญชีสำหรับ คำอธิบายทางเทคนิคเชิงลึกเพิ่มเติม (รวมถึงภาพประกอบ) ของแนวคิด: Steal time คือเปอร์เซ็นต์ของเวลาที่ CPU เสมือนรอ CPU จริงขณะที่ hypervisor กำลังให้บริการตัวประมวลผลเสมือนอื่น ดังนั้นจึงมีการเปิดเผยในเครื่องมือตรวจสอบ Unix / Linux ที่เกี่ยวข้องมากที่สุดในปัจจุบัน - ดูเช่นคอลัมน์% stealหรือst in sarหรือtop: st - เวลาขโมย จำนวนของ CPU ที่ถูก 'ขโมย' จากเครื่องเสมือนนี้โดยไฮเปอร์ไวเซอร์สำหรับงานอื่น ๆ (เช่นการเรียกใช้เครื่องเสมือนอื่น) ฉันไม่สามารถหาวิธีการจับตัวชี้วัดเดียวกันบน Windows ได้ แต่สิ่งนี้เป็นไปได้หรือไม่ (เป็นการดีที่สุดสำหรับWindows …

5
ฉันจะเรียกใช้การตรวจสอบ nagios ด้วยตนเองจากบรรทัดคำสั่งได้อย่างไร
เมื่อกำหนดและทดสอบบริการใหม่ใน nagios ฉันได้เริ่มต้น nagios ใหม่จากนั้นคลิกบริการและกำหนดเวลาตรวจสอบใหม่โดยเร็วที่สุดจากนั้นรอจนกว่าการตรวจสอบจะเกิดขึ้น มีวิธีที่มีประสิทธิภาพมากกว่านี้ไหม ฉันต้องการใช้บรรทัดคำสั่งเพื่อเรียกใช้การตรวจสอบเฉพาะนั้นและรับผลลัพธ์

8
ฉันจะดูได้อย่างไรว่าแต่ละ Apache Virtual Host ใช้แบนด์วิดท์เท่าใด
ฉันได้ตั้งค่า Apache ให้บริการโฮสต์เสมือนหลายแห่งแล้วและฉันต้องการดูว่าแต่ละแบนด์วิดท์ใช้งานไซต์เท่าใด ฉันเห็นจำนวนเซิร์ฟเวอร์ที่ใช้ทั้งหมด แต่ฉันต้องการรายงานรายละเอียดเพิ่มเติม สิ่งที่ฉันค้นพบส่วนใหญ่มีการ จำกัด แบนด์วิดท์ให้กับโฮสต์เสมือน แต่ฉันไม่ต้องการทำเช่นนั้น ฉันแค่ต้องการดูว่าไซต์ใดใช้แบนด์วิดท์เท่าใด สิ่งนี้ไม่ได้มีไว้สำหรับวัตถุประสงค์ในการเรียกเก็บเงิน แต่เป็นเพียงข้อมูล มีโมดูล apache ที่ฉันควรใช้? หรือมีวิธีอื่นที่จะทำเช่นนี้?

7
การตรวจสอบกระบวนการล้มเหลวในการเริ่มบนคอมพิวเตอร์ 64 บิต
เมื่อฉันพยายามเริ่มการตรวจสอบกระบวนการจาก SysInternals บนเครื่อง 64 บิต windows 7 บางกระบวนการล้มเหลวในการเริ่มต้น ไม่มีข้อความแสดงข้อผิดพลาด ฉันคลิกสองครั้งและไม่มีอะไรเกิดขึ้น คอมพิวเตอร์ 64 บิต Windows 7 อื่น ๆ ทำงานได้ดี ความคิดใด ๆ

7
เปิดใช้งาน Ping ในไฟร์วอลล์ Windows Server หรือไม่
ฉันเพิ่งติดตั้ง Windows Server 2008 บนเซิร์ฟเวอร์และฉันสามารถเชื่อมต่อผ่าน Remote Desktop แต่ไม่สามารถ ping ได้ ฉันต้องเปิดพอร์ตพิเศษในไฟร์วอลล์เพื่อให้สามารถ ping เซิร์ฟเวอร์ได้หรือไม่

12
เทคนิคในการตรวจสอบงาน cron?
มีเทคนิคที่ดีสำหรับการตรวจสอบงาน cron บนคลัสเตอร์หรือไม่? เราเริ่มใช้ cron เพื่อเริ่มงานทุกวัน แนวคิดบางประการสำหรับการตรวจสอบข้อมูล: เพิ่มการจัดการแอปพลิเคชันพิเศษที่บันทึกข้อมูลลงในสถานที่ "เครือข่ายที่รับรู้" เช่น DB สร้างระบบ logfile ที่ถ่ายโอนบันทึก cron เป็นระยะ ๆ ไปยังจุดศูนย์กลางสำหรับการประมวลผล / การสืบค้น (พร้อมกับไฟล์บันทึกอื่น ๆ ที่เป็นไปได้) ฉันสงสัยว่าผู้คนประสบความสำเร็จในการทำสิ่งต่าง ๆ เพื่อ cron กับสิ่งอื่น ๆ หรือไม่หรือถ้างานนั้นถูกรวมเข้ากับแนวทางที่แตกต่างอย่างสิ้นเชิง ฉันเอนตัวไปทาง # 2 แต่ฉันอยากจะรู้ว่าชาวบ้านที่มีประสบการณ์มากกว่านี้อาจลอง
22 monitoring  cron 

5
วิธีดู IP ที่เข้ามาใน Linux
ฉันสงสัยว่าอะไรคือคำสั่ง / ยูทิลิตี้ที่มีมุมมองตามเวลาจริงของ IP ที่เข้ามาไปยังเซิร์ฟเวอร์ของฉันพร้อมด้วยพอร์ตและเชื่อมต่อ

5
ฉันกำลังมองหาอะไรในโซลูชันการตรวจสอบ
ต้องการปรับปรุงโพสต์นี้หรือไม่? ให้คำตอบโดยละเอียดสำหรับคำถามนี้รวมถึงการอ้างอิงและคำอธิบายว่าทำไมคำตอบของคุณถึงถูกต้อง คำตอบที่ไม่มีรายละเอียดเพียงพออาจแก้ไขหรือลบออกได้ นี่เป็นคำถามที่ยอมรับได้เกี่ยวกับซอฟต์แวร์การตรวจสอบ สิ่งที่เกี่ยวข้องด้วย: คุณใช้เครื่องมืออะไรในการตรวจสอบเซิร์ฟเวอร์ของคุณ ฉันต้องตรวจสอบเซิร์ฟเวอร์ของฉัน ฉันต้องพิจารณาอะไรเมื่อตัดสินใจเลือกโซลูชันการตรวจสอบ
21 monitoring 

7
ตรวจสอบบันทึกอย่างต่อเนื่องด้วยหางที่หมุนเป็นครั้งคราว
เราใช้ส่วนท้ายเพื่อตรวจสอบบันทึกหลาย ๆ ชุดอย่างต่อเนื่อง แต่เมื่อมีการหมุนบันทึกส่วนท้ายสำหรับไฟล์นั้นจะหยุด เท่าที่ฉันเข้าใจปัญหาคือเมื่อบันทึกการหมุนแล้วจะมีไฟล์ใหม่ที่สร้างขึ้นและกระบวนการ tail run ไม่ทราบอะไรเกี่ยวกับการจัดการไฟล์ใหม่

7
ตรวจสอบเซสชัน SSH ขาเข้าตามเวลาจริง
มีซอฟต์แวร์ linux ใด ๆ เพื่อตรวจสอบเซสชัน ssh ที่เข้ามาหรือไม่ ในงานก่อนหน้านี้มีคนบอกฉันว่าถ้าคุณต้องการการสนับสนุนจาก Red Hat เช่นคุณสามารถเอา SSH ไปไว้ในเครื่องของคุณและคุณสามารถดูสิ่งที่พวกเขากำลังทำอยู่ ฉันอยู่ในสถานการณ์ที่คล้ายกันซึ่งฉันต้องการที่จะเข้าไปในเครื่องเพื่อนของฉันเพื่อช่วยเขา แต่ฉันต้องการให้เขาสามารถดูสิ่งที่ฉันทำเพื่อการศึกษาและเพื่อให้แน่ใจว่าฉันจะไม่ทำสิ่งที่เป็นอันตราย ข้อเสนอแนะใด ๆ ขอบคุณ

9
แนวทางปฏิบัติที่ดีที่สุดสำหรับการตรวจสอบข้อมูลสำรอง?
มันเป็นสถานการณ์ทั่วไปเมื่อผู้ดูแลระบบสร้างระบบสำหรับการสำรองข้อมูลอัตโนมัติและลืมมันไป หลังจากที่ระบบแจ้งผู้ดูแลระบบล้มเหลวระบบสำรองข้อมูลนั้นเสียก่อนหรือการสำรองข้อมูลนั้นไม่สามารถทำได้เนื่องจากข้อผิดพลาดบางอย่างและเขาไม่มีการสำรองข้อมูลปัจจุบันที่จะกู้คืนจาก ... ดังนั้นวิธีปฏิบัติที่ดีที่สุดในการหลีกเลี่ยงสถานการณ์ดังกล่าวคืออะไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.