กลยุทธ์ในการตรวจจับการเลื่อนเวลาในดาต้าเซ็นเตอร์ที่ใช้ลินุกซ์คืออะไร?


14

กลยุทธ์ในการตรวจจับการเลื่อนเวลาในศูนย์ข้อมูลที่ใช้ลินุกซ์ทั้งหมดคืออะไร? นี่เป็นปัญหาที่ยากกว่าที่เคยเป็นมาในตอนแรก

การเลื่อนเวลาไปมาอาจทำให้เกิดปัญหาร้ายแรงสำหรับแอปพลิเคชั่นบางตัวและบ่อยครั้งแม้ว่าจะติดตั้ง NTP ไปแล้ว แต่ก็เป็นไปได้ที่จะล้มเหลวด้วยเหตุผลดังต่อไปนี้ (และอีกมากมาย):

  • NTP ไม่ได้ตั้งค่าอย่างถูกต้องให้รีสตาร์ทโดยอัตโนมัติเมื่อรีบูต
  • การตั้งค่าบนเซิร์ฟเวอร์ไม่ถูกต้องดังนั้นเซิร์ฟเวอร์เวลาที่ชี้ไปที่ไม่สามารถเข้าถึงหรือไม่ถูกต้อง
  • เซิร์ฟเวอร์เวลาหลักไม่สามารถเข้าถึงได้และเซิร์ฟเวอร์ทั้งหมดกำลังซิงค์กับมันในขณะนี้กำลังซิงค์กับแหล่งที่ไม่น่าเชื่อถือ

ฉันต้องการวิธีตรวจสอบว่าเซิร์ฟเวอร์แต่ละเครื่องนั้นถูกต้องหรือไม่ โปรดทราบว่าเซิร์ฟเวอร์ที่มีสคริปต์ / แอปพลิเคชันทดสอบอาจไม่ถูกต้อง


6
ฉันคิดว่าเหตุผลของคุณเป็นของปลอมการดำเนินงาน NTP เป็นสิ่งสำคัญสำหรับฟาร์ม ตรวจสอบว่า NTP ทำงานอย่างถูกต้อง ปรับใช้นาฬิกาต้นแบบท้องถิ่น
user539484

NTP ทำงานนอกกรอบบน Linux distro จำนวนมากในขณะนี้ด้วยค่าเริ่มต้นที่สมเหตุสมผล มันค่อนข้างจะไม่ใช่ปัญหาตอนนี้
Matt

คำตอบ:


20

ง่ายต่อการควบคุม การจัดการการกำหนดค่าเป็นกุญแจสำคัญ ...

ตรวจสอบให้แน่ใจว่าบริการ ntp กำลังทำงานและกำหนดค่า ...

ตัวอย่างเช่นการใช้Monitเพื่อให้แน่ใจว่าntpdกำลังทำงานและเริ่มต้นใหม่หากล้มเหลวเป็นวิธีที่ง่าย ... อาจเพิ่ม cron และ daemons สำคัญอื่น ๆ ลงในการตรวจสอบประเภทนั้น

อีกทางเลือกหนึ่งคือการใช้เครื่องมือจัดการการกำหนดค่าเช่นPuppetเพื่อบังคับให้ ntpd.conf เดียวกันกับเซิร์ฟเวอร์ของคุณและตรวจสอบให้แน่ใจว่าติดตั้งกำหนดค่าและเรียกใช้ ntpd แล้ว

มีความซ้ำซ้อนมากพอในโปรโตคอล NTP เพื่อจัดการกับอินสแตนซ์ของเซิร์ฟเวอร์เวลาที่ไม่สามารถเข้าถึงได้ ระบุหลายแหล่ง


3
ฉันต้องสะท้อนความรู้สึกนี้ การจัดการการกำหนดค่าและเซิร์ฟเวอร์ NTP หลาย ๆ ตัวเป็นโครงสร้างพื้นฐานขั้นพื้นฐานในทุกสิ่งที่เข้าใกล้ "ศูนย์ข้อมูล" ศูนย์ข้อมูลขนาดกลางหรือใหญ่กว่าควรมีนาฬิกาฮาร์ดแวร์ สามารถหาแหล่งเวลา GPS ได้สักสองสามร้อยและถ้าคุณมีหัวแร้ง <$ 100
Chris S

โซลูชันนี้ + nagios
นั่นจากตรงนั้น

4
โปรดทราบว่าวิธีการตรวจสอบntpdสถานะของคุณนั้นสำคัญมาก คุณไม่ต้องการเพียงแค่พูดว่า "ntpd กำลังทำงานทุกอย่างยอดเยี่ยม!" จริงๆคุณต้องตรวจสอบว่าระบบของคุณตรงกันและมีเพียร์การทำงานหรือว่าเวลาที่มีน้อยชดเชยระหว่างโฮสต์และตรวจสอบกล่อง Nagios มีcheck_ntp_peerและcheck_ntp_timeจัดการกับสิ่งนั้นถ้าคุณต้องการใช้ Nagios
voretaq7

ntpq เพื่อตรวจสอบสถานะ
kubanczyk

10

มีปลั๊กอิน check_ntp ที่หลากหลายสำหรับnagios ที่นั่น

นี่คือหนึ่ง:

http://nagiosplugins.org/man/check_ntp

เพิ่มการตรวจสอบนี้ไปยังโฮสต์ nagios ของคุณและรับการแจ้งเตือนหากมีอะไรผิดปกติ


ใช่เพียงแค่ติดตั้งระบบตรวจสอบของคุณเพื่อตรวจสอบว่าเวลานั้นถูกต้องหรืออย่างน้อยออฟเซ็ตที่สัมพันธ์กับระบบการตรวจสอบนั้นน้อยที่สุด
Zoredache
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.