สวิตช์ตัวใดตัวหนึ่งของฉันถูกปิดโดยใช้เวลาสองนาทีทั้งๆที่ ntp?


11

ฉันเพิ่งสังเกตเห็นโดยบังเอิญว่าสวิตช์ Cisco 4500 ตัวใดตัวหนึ่งของฉันมีนาฬิกาทำงานผิดปกติ: มันใช้เวลานานกว่า 2 นาทีแม้จะมีฟังก์ชั่น ntp ในความคิดของฉันแม้แต่วินาทีเดียวก็ไม่ควรได้รับการยอมรับสำหรับระบบที่เกี่ยวข้อง นอกจากนี้ฉันจะไม่ได้สังเกตเห็นความแตกต่างจากการวินิจฉัยหากฉันไม่ได้เปรียบเทียบกับนาฬิกาแขวนเรียบง่าย

รายละเอียดบางอย่าง

นี่คือข้อมูล ntp สำหรับโฮสต์บางคนของฉัน (10.0.99.1, 10.0.99.2, 10.0.1.119, 10.0.99.241) ที่อ้างถึงอีกส่วนหนึ่งสำหรับการย้อนกลับ แต่ในท้ายที่สุดแล้วทั้งหมดควรซิงค์กับ 10.0.0.1 ซึ่งดึงข้อมูลอีกครั้ง เวลาจากภายนอก ดังนั้นความคลาดเคลื่อนเวลาไม่สามารถเกิดขึ้นจากแหล่งเวลาดั้งเดิมที่แตกต่างกัน เมื่อการสังเกตทำให้ฉันหวาดระแวง "มีเวลาที่ถูกต้อง" ในวิธีการดังต่อไปนี้: show clock(หรือdate) สร้างเอาต์พุตที่ตรงกับนาฬิกาแขวนของฉันและนาฬิการะบบในท้องถิ่นของฉัน (ซึ่งใช้ได้ตามhttp://time.is ) ด้วย ข้อผิดพลาดอย่างแน่นอนต่ำกว่า 1 วินาที (ความแม่นยำของฉันกดปุ่ม ENTER ในขณะที่ดูนาฬิกาท้องถิ่นของฉัน)

10.0.1.119 (Ubuntu) มีเวลาที่ถูกต้อง

$ ntpq -np
     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
+10.0.99.1       10.0.0.1         3 u  855 1024  377    0.904   -2.658   0.113
*10.0.0.1        130.149.17.8     2 u  266 1024  377    0.253    0.909   0.127

10.0.99.241 (Cisco 2960) มีเวลาที่ถูกต้อง

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.99.1       10.0.0.1         3     28     64   377  1.462  85.288 19.758
+~10.0.99.2       10.0.1.119       4     29     64   377  1.297  83.515  5.369
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.2 (Cico 4500) มีเวลาที่ถูกต้อง

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
+~10.0.99.1       10.0.0.1         3      6   1024   111  1.148  -1.618 42.875
*~10.0.1.119      10.0.0.1         3     31   1024   377  0.043   1.687  1.064
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.1 (Cisco 4500) ล่าช้าประมาณ 2 นาที 6 วินาที

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.0.1        130.149.17.8     2    274   1024   377 15.625   3.681 30.403
+~10.0.99.2       10.0.1.119       4    415   1024   376 15.625   0.855 33.276
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

#sho ntp status 
Clock is synchronized, stratum 3, reference is 10.0.0.1      
nominal freq is 250.0000 Hz, actual freq is 249.9988 Hz, precision is 2**6
reference time is DAD8B428.54C6BAEA (20:36:24.331 MESZ Sat May 7 2016)
clock offset is 3.6818 msec, root delay is 32.80 msec
root dispersion is 71.74 msec, peer dispersion is 30.40 msec
loopfilter state is 'CTRL' (Normal Controlled Loop), drift is 0.000004720 s/s
system poll interval is 1024, last update was 683 sec ago.

คำถาม

  1. 10.0.99.1 เป็นยังไงบ้าง
  2. ระบบที่ซิงค์กับ 10.0.99.1 มาถูกต้องอย่างไร
  3. ฉันควรจะเรียนรู้จากการส่งออกของsho ntp statusบน 10.0.99.1 ว่านาฬิกาที่เป็นจริงทั้งหมดออกจากซิงค์ (เมื่อเทียบกับทุกโฮสต์และนาฬิกาอ้างอิงที่กล่าวถึงในsho ntp asso)? สำหรับฉันผลลัพธ์ที่ออกมาดูเหมือนว่า "ฉันมีความสุขมาก"

แก้ไข:ตามความต้องการที่เป็นที่นิยม, ผลลัพธ์ของsho clock detail

10.0.99.1

#sho clock detail 
13:06:38.605 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

10.0.99.2

#sho clock detail 
13:10:54.083 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

ฉันไม่สามารถมองเห็นระบบใด ๆ ที่ที่อยู่ IP ที่คุณกำหนดค่าเป็นเซิร์ฟเวอร์ ntp ที่ใช้โดยแต่ละอุปกรณ์ และฉันมองเห็นลูปและคู่รักที่ใช้กันเป็นเซิร์ฟเวอร์ ntp ฉันเชื่อว่าในกรณีเหล่านั้นคุณควรระบุเป็น ntp peer มากกว่าเซิร์ฟเวอร์ แม้ว่าฉันต้องยอมรับว่าฉันไม่ทราบว่ามันแตกต่างอะไรไม่ว่าคุณจะระบุว่าเป็นเพียร์หรือเซิร์ฟเวอร์ นอกจากนี้ฉันไม่เชื่อว่ามันเป็นความคิดที่ดีที่จะให้ทุกอย่างซิงโครไนซ์ผ่านโฮสต์เดียว ( 10.0.0.1) แต่ฉันไม่คิดว่าการสังเกตใด ๆ ของฉันสามารถอธิบายสาเหตุของปัญหาปัจจุบันของคุณได้โดยตรง
kasperd

2
ปัญหาหนึ่งที่เห็นได้ชัดกับการกำหนดค่า ntp ของคุณคือการที่แต่ละโฮสต์ได้รับการกำหนดค่าด้วยแหล่งเวลาที่เลวร้ายที่สุด "ผู้ชายที่มีนาฬิกาหนึ่งรู้ว่าเวลาคืออะไรผู้ชายที่มีนาฬิกาสองเรือนไม่แน่ใจ ... " หมายเลขอื่นใดที่ดีกว่าสองนาฬิกาสี่อาจเป็นตัวเลือกที่ดีที่สุดมันจะให้เบาะถ้าไม่มี สามแหล่ง
dfc

4
การกำหนดค่า NTP ทั้งหมดของคุณต้องได้รับการพิจารณาใหม่ คุณต้องทำงานกับระดับชั้น @kasperd ชี้ให้เห็นว่าคุณอาจมีปัญหากับการวนซ้ำ คุณควรซิงโครไนซ์กับเซิร์ฟเวอร์ที่มีระดับ stratum ที่ต่ำกว่าและที่อยู่ในระดับ stratum เดียวกันนั้นสามารถทำการ peered ได้ แต่ไม่ควรใช้ซึ่งกันและกันเป็นเซิร์ฟเวอร์ อุปกรณ์แบบเพียร์ยังคงต้องการเซิร์ฟเวอร์ตั้งแต่หนึ่งตัวขึ้นไปที่ระดับ stratum ที่ต่ำกว่าเป็นแหล่งข้อมูลที่เชื่อถือได้ แต่จะพยายามจัดเรียงตัวเองให้เข้ากับเพื่อนอื่น ๆ อย่าใช้อุปกรณ์ไม่ว่าง (เช่นสวิตช์หลัก) เป็นเซิร์ฟเวอร์ NTP
Ron Maupin

3
มีบางอย่างผิดปกติเกิดขึ้น เอาต์พุต ntp ทั้งหมดเป็นปกติอย่างสมเหตุสมผลและแสดงการซิงค์ที่ดี แต่คำสั่งของคุณเพื่อให้ได้เวลาจากอุปกรณ์ที่ให้เวลาที่เป็นวิธี นั่นแสดงให้เห็นว่าด้วยเหตุผลบางอย่างอุปกรณ์ที่มีเวลาปิดไม่ได้ตั้งค่านาฬิการะบบจากระบบย่อย ntp
David Schwartz

1
ดูเหมือนว่าคุณจะพบข้อบกพร่องและอาจเป็นหนทางเดียวในการรีบูตและหวังว่ามันจะหายไปหรือติดต่อกับซิสโก้
Derobert

คำตอบ:


2

ฉันลังเลที่จะโพสต์สิ่งนี้เป็นคำตอบเพราะสาเหตุดั้งเดิมยังไม่ชัดเจน อย่างไรก็ตามดูเหมือนว่าปัญหาจะได้รับการแก้ไข - อย่างน้อยก็สักครู่


ตามความคิดเห็นที่ทำโดยhtm11hฉันตัดสินใจอัปเดตเฟิร์มแวร์ และแน่นอนตอนนี้ฉันกำลังใช้งานเฟิร์มแวร์รุ่นใหม่นาฬิกาดูเหมือนจะตรงกับเวลาที่ถูกต้อง

แต่นั่นหมายความว่าเฟิร์มแวร์ใหม่เป็นทางออกหรือไม่ น่าเสียดายที่ไม่มี ในความพยายามครั้งแรกของฉันในการโหลดเฟิร์มแวร์ใหม่ฉันลืมเปลี่ยนการลงทะเบียนการกำหนดค่าซึ่งยังคงเป็นค่าเริ่มต้นจากโรงงาน ดังนั้นการรีบูตครั้งแรกของฉันจึงสิ้นสุดในรูป ROM ดั้งเดิมที่เราเตอร์ใช้งานมาเกือบสี่ปี (เช่นตั้งแต่เปิดเครื่องครั้งแรก) และนี่ก็เพียงพอแล้วสำหรับนาฬิกาที่จะทำการปรับครั้งใหญ่ครั้งหนึ่งจากนั้นจึงซิงค์กัน สิ่งนี้ชี้ให้เห็นว่าการรีบูตอาจช่วยได้ชั่วคราว ในทางกลับกันนี่หมายความว่าเวลาที่ถูกต้องในขณะนี้ซึ่งแสดงพร้อมกับเฟิร์มแวร์รุ่นใหม่อาจยังคงล่องลอยจากเวลา ntp ในช่วงหลายปีที่ผ่านมา จะใช้เวลาสองสามวันจนกระทั่งฉันสามารถบอกได้อย่างปลอดภัยว่านาฬิกาหายไปประมาณ 5 วินาทีต่อวันหรือไม่

สำหรับตอนนี้เคสถูกปิด


1

ฉันทำงานกับโปรเจค NTP Pool มาตั้งแต่กลางทศวรรษที่ 90 และใช้เซิร์ฟเวอร์ซิงก์ GPS NTP Stratum-1 หลายเครื่องที่นี่ ตามที่คนอื่น ๆ ระบุว่าคุณต้องการเซิร์ฟเวอร์มากกว่า 2 เครื่องเพื่อให้ได้เวลา ฉันมักจะใช้ 4 ที่นี่เพื่อเหตุผลที่ระบุไว้โดย Ron Maupin ข้างต้น นอกจากนี้ในรายการที่คุณต้องระวังลูปและการตั้งค่าเป็นเซิร์ฟเวอร์กับเพื่อน

การเลื่อนเวลาอาจเกิดจากข้อผิดพลาดที่รู้จักใน IOS ซึ่งได้รับการแก้ไขในการอัปเดต IOS นี้ซึ่งเกี่ยวข้องกับ ntp.drift ที่ไม่ถูกลบหรืออัปเดตอย่างถูกต้องและทำให้เกิดปัญหาการดริฟท์ นอกจากนี้ 4 ปีที่ไม่มีการรีบูตหรือการอัปเดตจะต้องทิ้งคุณไว้ในจุดรักษาความปลอดภัยที่ไม่ดีพอเนื่องจากการอัพเดท IOS Security ออกมาค่อนข้างบ่อย

นี่คือโพสต์ที่ยอดเยี่ยมในการตั้งค่า NTP บน Cisco IOS http://packetlife.net/blog/2011/mar/28/cisco-ios-clocks-and-ntp/

หวังว่านี่จะเป็นประโยชน์ กรุณาถามว่าคุณมีคำถามหรือปัญหาเพิ่มเติม


0

การเปิดเผยเต็มรูปแบบ: บางครั้งฉันเพิ่งเล่นซอกับการกำหนดค่าสวิตช์เลยและฉันไม่ได้เป็นผู้เชี่ยวชาญ NTP

ที่กล่าวว่าฉันเคยเห็น NTP daemon บนระบบ RHEL 5.x (ใช่ฉันจะกลับไป แต่คุณบอกว่าสวิตช์ของคุณมีภาพเก่า ~ 4 ปี ... ) ติดอยู่ในสถานะ "มีความสุข" ที่ซึ่งคิดว่ามันตรงกันอย่างสมบูรณ์แบบ แต่ไม่ชัดเจน เราจะใช้เซสชัน ClusterSSH เพื่อเรียกใช้ "วันที่" ในทุกระบบพร้อมกันและบางครั้งก็จะแสดงมากถึง 5 นาทีระหว่างระบบ หากฉันจำได้อย่างถูกต้องเราสามารถแก้ไขปัญหาได้โดยการรีสตาร์ท daemon เท่านั้นและในที่สุดก็ทำให้ cron เริ่มบริการใหม่ทุกคืน ...

ไม่ได้เป็นวิธีการแก้ปัญหาในอุดมคติ แต่คุณอาจใช้วิธีการที่คล้ายกันกับงาน cron เพื่อเชื่อมต่อกับสวิตช์และเริ่มต้นการรีบูตหรือ "เตะ" NTP daemon บนสวิตช์ได้หรือไม่

หวังว่านี่จะช่วยได้!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.