หลังจากการบู๊ตเย็นของเซิร์ฟเวอร์ Debian 6.0.8 (HP ProLiant) ntpd
เล่นความเสียหายด้วยเวลาของระบบ: ชดเชยและกระวนกระวายใจเกี่ยวกับเซิร์ฟเวอร์เวลาอ้างอิงปกติและเชื่อถือได้ซึ่งกำลังเติบโตโดยไม่มีขีด จำกัด (โปรดทราบว่าเซิร์ฟเวอร์ที่เหมือนกันคู่ไม่มีปัญหาเลย) หลังจากความพยายามแก้ไขปัญหาntpd
ด้านข้างไม่สำเร็จฉันตัดสินใจลองรีบูตและทุกอย่างก็โอเค
เพื่อตรวจสอบปัญหาฉันพบความคลาดเคลื่อนนี้ซึ่งสามารถอธิบายปัญหานาฬิกาของฉัน:
root@n1:~# zgrep Detected /var/log/dmesg*
/var/log/dmesg:[ 0.004000] Detected 2400.110 MHz processor.
/var/log/dmesg.0:[ 0.004000] Detected 2383.579 MHz processor.
/var/log/dmesg.1.gz:[ 0.004000] Detected 2400.036 MHz processor.
/var/log/dmesg.2.gz:[ 0.004000] Detected 2400.298 MHz processor.
/var/log/dmesg.3.gz:[ 0.004000] Detected 2400.165 MHz processor.
/var/log/dmesg.4.gz:[ 0.004000] Detected 2400.410 MHz processor.
โปรดทราบว่าในการบูตครั้งที่สอง (ครั้งที่มีปัญหา) CPU freq ที่ตรวจพบเป็นค่าผิดปกติ ข้อผิดพลาดและส่วนเบี่ยงเบนมาตรฐานของความถี่ที่ตรวจพบโดยไม่เกี่ยวข้องกับค่าที่ระบุคือ +0.15 MHz ± 0.25 MHz สำหรับการบู๊ตที่มีปัญหาฉันมีข้อผิดพลาด -16.4 Mhz ซึ่งสูงกว่าที่คาดไว้ประมาณ 100 เท่า
คำถามของฉัน:
ข้อผิดพลาดประเภทนี้ทำให้
ntp
เวลามีระเบียบวินัยไม่แน่นอน / ใช้ไม่ได้หรือไม่? นี่คือเหตุผลสำหรับปัญหานาฬิกาของฉันหรือไม่พฤติกรรมประเภทนี้เป็นอาการที่เกิดจากฮาร์ดแวร์ที่ไม่สมบูรณ์หรือไม่? เซิร์ฟเวอร์ควรเข้าสู่การบำรุงรักษา hw หรือไม่
ปรับปรุง
ข้อมูลที่เป็นประโยชน์บางอย่าง:
- เคอร์เนลคือ 2.6.32-5-amd64 (Debian 2.6.32-48squeeze4)
current_clocksource
คือtsc
- ข้อผิดพลาดสำหรับ
lpj
คือ (แน่นอน) สอดคล้องกับข้อผิดพลาดใน CPU freq
เส้นบริบทบางอย่างสำหรับข้างต้น grep
[ 0.000000] hpet clockevent registered
[ 0.000000] Fast TSC calibration using PIT
[ 0.004000] Detected 2400.110 MHz processor.
[ 0.000008] Calibrating delay loop (skipped), value calculated using timer frequency.. 4800.22 BogoMIPS (lpj=9600440)
ntpdc -c loopinfo
อย่าให้ค่าความถี่ดริฟท์แก่ฉัน ตอนนี้หลังจากรีบูตทุกอย่างดูเหมือนจะเป็นไปตามลำดับด้วยค่าดริฟท์ที่มีเสถียรภาพ ... BTW คำแนะนำของคุณถูกต้องฉันกำลังตรวจสอบlog/loopstats
พฤติกรรมที่ผิดปกติ