วิธีตรวจสอบและบันทึกอุณหภูมิและโหลดฮาร์ดแวร์ของเซิร์ฟเวอร์


15

ฉันกำลังมองหาวิธีในการบันทึกและตรวจสอบอุณหภูมิฮาร์ดแวร์ของเซิร์ฟเวอร์และโหลด (เช่น CPU หรือ RAM) ฉันจะทำอย่างนั้นได้อย่างไร

วัตถุประสงค์คือ:

  • ตรวจสอบให้แน่ใจว่าฮาร์ดแวร์ไม่ร้อนขึ้น
  • ระบุสิ่งที่ควรอัพเกรดและสิ่งที่เกิน (เช่นอาจจะเรียนรู้อาจจะไม่ได้รับซีพียูที่ดีเช่น)

ตกลงฉันสามารถใช้หนึ่งในแอปเพล็ตที่อาศัยอยู่ในแถบงาน แต่สิ่งที่เกี่ยวกับการบันทึก ?

คำตอบ:


18

หากคุณต้องการบางสิ่งที่ไม่ได้ขึ้นอยู่กับเดสก์ท็อป :

มีลักษณะที่LM-เซ็นเซอร์ ติดตั้งเซ็นเซอร์ lmจากคำอธิบาย:

Lm-sensors เป็นชุดตรวจสอบสถานะฮาร์ดแวร์สำหรับ Linux จะช่วยให้
คุณสามารถเข้าถึงข้อมูลจากอุณหภูมิแรงดันไฟฟ้าและความเร็วพัดลม 
เซ็นเซอร์ มันทำงานได้กับระบบที่ใหม่กว่าส่วนใหญ่

แพคเกจนี้ประกอบด้วยโปรแกรมที่จะช่วยคุณติดตั้งและอ่านข้อมูล
LM-เซ็นเซอร์

จากหน้าโครงการของพวกเขา(แก้ไข 2016: โครงการจะตายwiki ของเราเองมีข้อมูลบางอย่าง ):

  • เซิร์ฟเวอร์ระดับสูงแบบไม่ต้องใส่ข้อมูลเราเตอร์หรือการตรวจสอบอัตโนมัติของเครื่องจักรที่สำคัญต่อภารกิจ สร้างงาน cron ได้อย่างง่ายดายเพื่อสอบถามสถานะของฮาร์ดแวร์ของคุณและส่งอีเมลถึงคุณในกรณีที่เกิดปัญหาก่อนที่จะกลายเป็นสิ่งสำคัญ ด้วยวิธีนี้คุณสามารถได้รับการแจ้งเตือนภายในไม่กี่วินาทีขององค์ประกอบสำคัญที่ล้มเหลวเช่นแหล่งจ่ายไฟพัดลมกลไกระบายความร้อนอื่น ๆ หรือแม้กระทั่งตรวจพบว่ามีการเปิดเคส
  • ระบบสมองกลฝังตัวที่ใช้ Linux สิ่งเหล่านี้สามารถใช้แพคเกจนี้เพื่อตรวจสอบแรงดันไฟฟ้าอุณหภูมิความเร็วพัดลม ฯลฯ โดยใช้ส่วนประกอบนอกชั้นวางและใช้ช่วงของบัสอินเตอร์เฟส (เช่น ISA, SMBus, I2C หรือ SPI)
  • โดยทั่วไปการเก็บข้อมูล วัดข้อมูลประเภทต่าง ๆ ได้อย่างง่ายดาย (ความเร็วในการหมุน, แรงดัน, อุณหภูมิ, ฯลฯ ) โดยใช้ชิ้นส่วนราคาถูก มีประโยชน์มากสำหรับระบบอัตโนมัติ (ในบ้าน, การประชุมเชิงปฏิบัติการ, สถานีอากาศคุณชื่อมัน)

lm-sensors มี daemon เรียกว่า sensord ซึ่งใช้RRDtoolสำหรับ 'การบันทึกข้อมูลและระบบการสร้างกราฟสำหรับข้อมูลอนุกรมเวลา' ดังนั้นจึงมีกราฟิกเช่นนี้ที่สามารถแสดงผ่านเว็บเซิร์ฟเวอร์:

im1

(นำมาจากหน้าโครงการเซ็นเซอร์ lm)

หากต้องการติดตั้ง Sensord daemon คุณอาจต้องติดตั้งแพ็คเกจ Sensord

ตัวอย่างจากสมุดบันทึกของฉัน:

IM2

ไฟล์กำหนดค่าของสิ่งนี้อยู่ที่ /etc/sensors3.conf

lm-sensorsเป็นพื้นฐานของการวัดอุณหภูมิใด ๆ รายการบนเดสก์ท็อปมีแนวโน้มที่จะได้รับข้อมูลจากแพ็คเกจนี้มากกว่า ตัวอย่างถ้าคุณต้องการบางสิ่งที่ขึ้นอยู่กับเดสก์ท็อป

psensor

  • มาเธอร์บอร์ดและเซ็นเซอร์ CPU ( ต้องติดตั้งเซ็นเซอร์ lm )
  • NVidia GPUs
  • ฮาร์ดดิสก์ไดรฟ์ (ต้องติดตั้ง hddtemp)
  • ความเร็วพัดลม (ต้องติดตั้งเซ็นเซอร์ lm อีกครั้ง)

การติดตั้งโดยเพิ่ม PPA:
sudo add-apt-repository ppa:jfi/ppa
sudo apt-get update && sudo apt-get install psensor

(Oneiric จะมี psensor รวมอยู่ด้วย)

(เก่า) ตัวอย่างจากubuntugeek.com : im6


ดูเหมือนคำตอบที่ดี ดูเหมือนว่าภาพและลิงก์จะเสียหาย : - /
user121330

ภาพนั้นเป็นเพียงไอคอนตัวติดตั้ง ;-) ดูmeta.askubuntu.com/a/1853/15811เกี่ยวกับสิ่งที่ต้องทำ (ทุกคนสามารถเปลี่ยนเป็นhostmar.co/software-small หรือhostmar.co/software- large ) แต่ตัวโครงการเองก็ตายไปแล้ว .... สงสาร: * (
Rinzwind

5

หากโปรแกรมอย่าง Cacti มีมากเกินไปก็จะมีสคริปต์ที่เพิ่งบันทึกไปยังไฟล์ข้อความในแต่ละวัน - รันด้วย crontab แต่ต้องติดตั้งโปรแกรม lm-sensors

#!/bin/bash
_now=$(date +"%Y_%m_%d")
_file="temp_log_$_now.txt"
(date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file"

4

สำหรับการเข้าสู่ระบบของ CPU / RAM / อุณหภูมิ / การจราจรบนเซิร์ฟเวอร์ผมแนะนำCacti มันถูกโฆษณาว่าเป็น 'ส่วนหน้าสมบูรณ์สำหรับRRDtool ' และสามารถมีแหล่งข้อมูลหลายอย่างเช่นเซ็นเซอร์ lm, SNMP หรือแม้แต่สคริปต์ที่กำหนดเอง ข้อมูลถูกเก็บไว้ใน RRD และใช้เพื่อสร้างกราฟรายวันรายสัปดาห์รายเดือนและรายปี

ดูเว็บไซต์ Cactiสำหรับรายละเอียดเพิ่มเติมภาพหน้าจอและลิงก์ไปยังเว็บไซต์ตัวอย่างสด อาจเป็นเรื่องยุ่งยากในการตั้งค่าในครั้งแรก แต่คุ้มค่าในที่สุด


2
ข้อกำหนดในการติดตั้ง MySQL จำกัด กรณีการใช้งาน
Scott Stensland

3

ฉันใช้zenossเพื่อตรวจสอบเซิร์ฟเวอร์ 70 ยูนิกซ์และ windows ที่สำนักงานของฉัน นอกจากนี้เรายังตรวจสอบอุปกรณ์เครือข่ายทั้งหมดและแม้กระทั่งเทอร์โมสแตทในห้องเซิร์ฟเวอร์ ส่วนใหญ่ผ่าน SNMP (อย่างไรก็ตามเราใช้สคริปต์ที่เขียนขึ้นเองเพื่อตรวจสอบประสิทธิภาพของแอปพลิเคชั่น)

เซิร์ฟเวอร์ส่วนใหญ่ (เช่น dell และ hp) มีเซ็นเซอร์อุณหภูมิภายในซึ่งคุณสามารถสอบถามได้โดยใช้ SNMP คุณยังสามารถตรวจสอบกระบวนการใช้งาน CPU ปริมาณงานผ่านเครือข่ายและอื่น ๆ ฉันได้รับการแจ้งเตือนหากเซิร์ฟเวอร์ทำงานออฟไลน์หรือเริ่มใช้งาน CPU มากเกินไปหรือหากกระบวนการที่สำคัญหยุดทำงาน

อย่างจริงจังฉันไม่สามารถกระตุ้นให้พอที่จะดูสิ่งต่าง ๆ เช่นzenoss , hypericและnagios ! รุ่นฟรีสามารถตรวจสอบได้หลายระบบ แต่ก็สามารถตรวจสอบได้เพียงระบบเดียว พวกเขาช่วยแก้ไขปัญหาและค้นหาว่าเซิร์ฟเวอร์ทำอะไรเวลาตีสองเมื่อเกิดปัญหา


1

ตรวจสอบลิงค์นี้: https://launchpad.net/indicator-sysmonitor

im1

(จากOMG Ubuntu )

การติดตั้ง:

sudo add-apt-repository ppa:alexeftimie/ppa
sudo apt-get update && sudo apt-get install indicator-sysmonitor

หมายเหตุ: ใช้งานได้เฉพาะใน Natty / 11.04


นี่อาจเป็นคำถามที่โง่มาก แต่ฉันจะติดตั้งได้อย่างไร ฉันพยายามsudo add-apt-repository 'deb http://ppa.launchpad.net/alexeftimie/ppa/ubuntu natty main'และsudo apt-get install indicator-sysmonitorแล้วUnable to locate package indicator-sysmonitor
Jiew เม้ง

@jiewmeng ฉันแก้ไขภาพและวิธีการติดตั้ง
Rinzwind

1

ฉันใช้แพนโดร่า fms เพื่อตรวจสอบเซิร์ฟเวอร์ประมาณ 40 ระบบและ 100 ระบบคอมพิวเตอร์ที่ บริษัท ของฉันและหน้าเว็บของ บริษัท คุณอาจพบว่ามีประโยชน์ในการติดตั้งซอฟต์แวร์เอเจนต์ที่เซิร์ฟเวอร์ของคุณและตั้งค่าโมดูลในเครื่องเพื่อตรวจสอบสิ่งที่คุณต้องการ หากคุณต้องการลองที่นี่คุณสามารถเยี่ยมชมหน้าเว็บของแพนโดร่า : Panndora FMS Unified Monitoring Tool

ความนับถือ

Ivo Yordanov


1

ตรวจสอบแพ็คเกจmuninมันสามารถตรวจสอบเกือบทุกอย่าง

https://help.ubuntu.com/lts/serverguide/munin.html https://wiki.ubuntuusers.de/munin

sudo apt-get install apache2
sudo apt-get install munin-node`
sudo systemctl enable munin-node
sudo a2enconf munin

ตรวจสอบสิทธิ์การเข้าถึงใน /etc/apache2/conf-enabled/munin.conf ที่มีลักษณะเช่นนี้:

<Directory /var/cache/munin/www>
    Require all granted
    AllowOverride None
    Order Allow,Deny
    Allow from all
    Options None
</Directory>

<Location /munin-cgi/munin-cgi-graph>
    Require all granted
    <IfModule mod_fcgid.c>
        SetHandler fcgid-script
    </IfModule>
    <IfModule !mod_fcgid.c>
        SetHandler cgi-script
    </IfModule>
</Location>

รีสตาร์ท apache2:

sudo apache2ctl restart

ใช้เบราว์เซอร์ของคุณไปที่: http: // localhost / munin - เพลิดเพลิน

ค้นหา / etc / munin เพื่อดูตัวเลือกเพิ่มเติม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.