ควรตั้งค่าฮาร์ดแวร์เครือข่ายเป็นความเร็วอัตโนมัติหรือความเร็วคงที่หรือไม่


90

เมื่อเร็ว ๆ นี้เรามีปัญหาเล็กน้อยกับการเชื่อมต่อเครือข่ายที่เซิร์ฟเวอร์หลายเครื่องจะสูญเสียการเชื่อมต่อเครือข่ายเป็นระยะ ๆ ในลักษณะที่ค่อนข้างเจ็บปวดเพื่อแก้ไข (จำเป็นต้องรีบูตเครื่อง) สิ่งนี้เกิดขึ้นประมาณสองสัปดาห์โดยสุ่มบนเซิร์ฟเวอร์ที่แตกต่างกัน ไม่มีรูปแบบเฉพาะที่เราสามารถแยกแยะได้

หลังจากขุดลงไปแล้วเราเห็นว่าสวิตช์นั้นรายงาน 100 Mbps สำหรับพอร์ตที่มีปัญหา:

ฟังดูเหมือนเป็นเรื่องที่เกิดขึ้นในบทความ Joel Spolsky อย่างFive Whys

Michael ใช้เวลาทำ post-mortem และพบว่าปัญหานั้นเป็นปัญหาการกำหนดค่าอย่างง่ายบนสวิตช์ มีความเร็วที่เป็นไปได้หลายอย่างที่สวิตช์สามารถใช้เพื่อสื่อสาร (10, 100, หรือ 1,000 เมกะบิต / วินาที) คุณสามารถตั้งค่าความเร็วด้วยตนเองหรือให้สวิตช์เปลี่ยนความเร็วสูงสุดที่ทั้งสองฝ่ายสามารถทำงานได้ สวิตช์ที่ล้มเหลวถูกตั้งค่าเป็นจัดการโดยอัตโนมัติ สิ่งนี้มักใช้งานได้ แต่ไม่เสมอไปและในเช้าวันที่ 10 มกราคมมันไม่ได้

ขณะนี้เราได้ปิดใช้งานการเจรจาต่อรองอัตโนมัติกับฮาร์ดแวร์เครือข่ายของเราและตั้งค่าเป็นอัตราคงที่ 1000 Mbps (กิกะบิต)

คำถามของฉันสำหรับผู้ที่มีความเชี่ยวชาญด้านเครือข่ายฮาร์ดแวร์เซิร์ฟเวอร์มากขึ้น:

  1. ปัญหาการเจรจาต่อรองอัตโนมัติกับฮาร์ดแวร์เครือข่ายที่ทันสมัยเป็นอย่างไร
  2. ถือว่าเป็นวิธีปฏิบัติที่ดีในเครือข่ายมาตรฐานหรือไม่ที่จะปิดใช้งานการต่อรองอัตโนมัติและตั้งค่าความเร็วคงที่เมื่อตั้งค่าเครือข่าย

คุณได้ปิดการใช้งานการเจรจาอัตโนมัติบนเซิร์ฟเวอร์ของคุณเช่นกันและแก้ไขให้เป็น 1,000 / เต็มหรือไม่
James

22
นี่เป็นเพียงฉัน แต่ถ้าฉันพบปัญหาของคุณฉันจะสงสัยว่าทำไมสวิตช์และเซิร์ฟเวอร์ไม่ได้เจรจากับลำดับความสำคัญสูงสุดที่ความเร็ว (1,000 / เต็ม) นั่นบอกฉันว่ามีบางอย่างผิดปกติและด้วยการบังคับให้ลิงก์ไปยังความเร็วที่กำหนดคุณกำลังปิดบังปัญหา
Doug Luxem

มีบางแพลตฟอร์ม (สะดุดตา Solaris 9) ที่มีปัญหาเกี่ยวกับการต่อรองอัตโนมัติในสถานการณ์ที่รู้จักกัน - ฉันเพียงใช้ autoneg กับสิ่งที่เกิดขึ้นในทศวรรษที่ผ่านมาแม้ว่า
วอร์เรน

บางสิ่งที่ทำให้ฉันลื่นสีชมพู: serverfault.com/questions/328105/ethernet-interface-errors
nixnotwin

คำตอบ:


101
  1. ฉันยังไม่เห็นปัญหาเกี่ยวกับการเจรจาต่อรองอัตโนมัติของความเร็วเครือข่ายที่ไม่ได้เกิดจาก (a) คู่มือไม่ตรงกันที่ปลายด้านหนึ่งของลิงค์และอัตโนมัติที่อีกอันหรือ (b) องค์ประกอบที่ล้มเหลวของลิงค์ ( สายเคเบิลพอร์ต ฯลฯ )

  2. สิ่งนี้ขึ้นอยู่กับผู้ดูแลระบบ แต่ประสบการณ์ของฉันแสดงให้ฉันเห็นว่าหากคุณระบุความเร็วลิงค์และการตั้งค่าดูเพล็กซ์ด้วยตนเองกว่าที่คุณจะผูกพันกับความเร็วที่ไม่ตรงกัน ทำไม? เนื่องจากแทบเป็นไปไม่ได้เลยที่จะบันทึกการเชื่อมต่อต่าง ๆ ระหว่างสวิตช์และเซิร์ฟเวอร์จากนั้นทำตามเอกสารดังกล่าวเมื่อทำการเปลี่ยนแปลง ความล้มเหลวส่วนใหญ่ที่ฉันเห็นเป็นเพราะ 1 (a) และคุณจะเข้าสู่สถานการณ์นั้นเมื่อคุณเริ่มการตั้งค่าความเร็ว / ดูเพล็กซ์ด้วยตนเองเท่านั้น

ดังที่กล่าวไว้ในเอกสารของ Cisco :

หากคุณปิดใช้งานการจัดการโดยอัตโนมัติมันจะซ่อนลิงค์ดรอปและปัญหาเลเยอร์ทางกายภาพอื่น ๆ ปิดใช้งานการจัดการโดยอัตโนมัติไปยังอุปกรณ์ปลายทางเช่น Gigabit NIC ที่เก่ากว่าซึ่งไม่สนับสนุนการจัดระเบียบแบบอัตโนมัติของกิกะบิต อย่าปิดใช้งานการจัดการโดยอัตโนมัติระหว่างสวิตช์เว้นแต่จะจำเป็นอย่างยิ่งเนื่องจากปัญหาเลเยอร์ทางกายภาพอาจไม่สามารถตรวจจับได้และส่งผลให้เกิดการลูปต้นไม้

หากคุณไม่พร้อมที่จะติดตั้งระบบการจัดการการเปลี่ยนแปลงสำหรับการเปลี่ยนแปลงเครือข่ายที่ต้องมีการตรวจสอบความเร็ว / ดูเพล็กซ์ (และอย่าลืมการควบคุมการไหล) หรือเต็มใจที่จะจัดการกับความไม่ตรงกันเป็นครั้งคราว จากนั้นติดกับการกำหนดค่าเริ่มต้นของ auto / auto

ในอนาคตพิจารณาการตรวจสอบข้อผิดพลาดบนพอร์ตสวิตช์ด้วยMRTGเพื่อให้คุณสามารถสังเกตเห็นปัญหาเหล่านี้ก่อนที่คุณจะมีปัญหา

แก้ไข:ฉันเห็นผู้คนจำนวนมากที่อ้างถึงความล้มเหลวในการเจรจาต่อรองบนอุปกรณ์เก่า ใช่นี่เป็นปัญหาเมื่อนานมาแล้วเมื่อมาตรฐานถูกสร้างขึ้นและอุปกรณ์บางอย่างไม่ได้ติดตามพวกเขา นิคส์และสวิตช์ของคุณมีอายุน้อยกว่า 10 ปีหรือไม่ ถ้าเป็นเช่นนั้นนี่จะไม่เป็นปัญหา


6
Cacti นั้นเป็น MRTG โดยที่ไม่มีการกำหนดค่าดังนั้นมันก็ดี เพียงแค่เริ่มตรวจสอบ RX drop และข้อผิดพลาดการชน TX ฯลฯ หนึ่งในตัวนับเหล่านี้จะ "สูง" หากคุณมีปัญหาในการเจรจา มีความสัมพันธ์สูงกับปริมาณการรับส่งข้อมูลบนพอร์ต
Doug Luxem

2
@EK - การกำหนดค่าจะต้องทำบนสวิตช์และอุปกรณ์ การเปลี่ยนอุปกรณ์ (หรืออาจแค่อัพเกรดไดรเวอร์ / เฟิร์มแวร์) ย้ายพอร์ตหรือเปลี่ยนสวิตช์ทั้งหมดนั้นเป็นเรื่องของการตั้งค่าที่ไม่ตรงกัน ฉันไม่แน่ใจว่าทำไมคุณเห็นข้อผิดพลาดมากมาย - เรารัน HP, Cisco, Extreme และ Juniper ที่นี่และฉันไม่เคยเห็นปัญหาการเจรจาอัตโนมัติ ปัญหาเดียวที่ฉันเห็นคือเมื่อปลายด้านหนึ่งของลิงค์ถูกตั้งค่าด้วยตนเอง ในฐานะที่เป็นเอกสาร Doc กล่าวถึงคุณอาจมีปัญหา L1 บางอย่าง?
Doug Luxem

7
ประสบการณ์ของฉันที่ใช้ HP, Cisco และ Dell สวิตช์ตรงกับ w / DLux ฉันเดาโดย upvotes ที่คนอื่นจำนวนมากรู้สึกแบบเดียวกัน เครือข่ายที่ผู้ดูแลระบบตั้งค่าความเร็วพอร์ต / ดูเพล็กซ์อย่างยากลำบากมักมีปัญหาที่ไม่ตรงกันมากกว่าเครือข่ายที่ทุกอย่างถูกตั้งค่าให้จัดการโดยอัตโนมัติ
Evan Anderson

3
@ ลิงก์ WAN ซึ่งเป็นเรื่องราวที่แตกต่าง เมื่อคุณส่งลิงก์อีเทอร์เน็ตจากผู้ให้บริการบางรายพวกเขามักถูกบังคับให้ใช้งานด้วยตนเองหรือใช้ตัวรับส่งสัญญาณที่ไม่สนับสนุนการเจรจาอัตโนมัติ สิ่งเหล่านี้ต้องได้รับการดูแลเป็นกรณี ๆ ไป
Doug Luxem

3
ฉันคิดว่าการออกเสียงลงคะแนนเป็นเรื่องที่ทำให้เข้าใจผิดในบางคนจะมีความหรูหราของฮาร์ดแวร์จากผู้ขาย 1 หรือ 2 คน (หรือไม่ค่อยมีประสบการณ์มากนัก) และไม่เคยเจอปัญหาในขณะที่คนอื่น ๆ เช่นตัวฉันเองจะได้รับอุปกรณ์จากผู้จำหน่ายหลายราย ทำงานผิดปกติในชุดค่าผสมบางอย่าง
JamesRyan

23
  1. บ่อยครั้งที่ฉันพบปัญหามากมายเกี่ยวกับฮาร์ดแวร์ประเภทต่างๆ

  2. ในความคิดของฉันหากการตั้งค่าเป็นแบบคงที่ (เช่นแร็คเซิร์ฟเวอร์) และคุณไม่คิดว่าจะมีการเปลี่ยนแปลงมันเป็นความคิดที่ดีที่จะตั้งค่าความเร็วและดูเพล็กซ์ด้วยตนเอง ตราบใดที่มีการบันทึกไว้เป็นอย่างดีเพื่อให้ปัญหาในอนาคตสามารถหลีกเลี่ยงได้

แก้ไข:

เพียงชี้แจงฉันไม่สนับสนุนการใช้ความเร็วด้วยตนเองในเครือข่ายทั้งหมดของคุณฉันจะบอกว่า 95% ของเวลาอัตโนมัติ / อัตโนมัติเป็นวิธีที่จะไป ฉันแค่บอกว่าฉันมีปัญหากับการพิมพ์สองด้าน / ความเร็วและมีบางส่วนของเครือข่ายของฉัน (เช่นหนึ่งในแร็คเซิร์ฟเวอร์ของเรา) ที่มีการตั้งค่าด้วยตนเองเป็นส่วนใหญ่ เราใช้งาน LAN ที่ควบคุมอย่างแน่นหนาด้วยพอร์ตที่ไม่ได้ใช้งานถูกปิดและตัวกรอง MAC ในพอร์ตส่วนใหญ่ดังนั้นการติดตามความเร็วนั้นไม่ยากมาก


5
ฉันพบปัญหาเดียวกัน แต่อาจมีเซิร์ฟเวอร์เพียง 1/100 รายเท่านั้นที่มีปัญหาในการควบคุมอัตโนมัติ มันมักจะไม่สามารถสังเกตเห็นได้บนเครือข่ายขนาดเล็ก แต่ก็น่ารำคาญสำหรับเครือข่ายขนาดใหญ่
Dave Drager

+1 - ฉันเคยเห็นป๊อปอัปปัญหาการเจรจาอัตโนมัติมาหลายปีแล้ว การให้ทีมมีมาตรฐานในการปิดการใช้งานการเจรจาอัตโนมัติสำหรับสวิตช์ทั้งหมดกำจัดปัญหานั้นสำหรับเรา
Joe Doyle

ไม่มีอะไรจะเพิ่มเติมในเรื่องนี้นอกจากที่ฉันสามารถสะท้อนว่าฉันได้เห็นปัญหามากมาย หากใครมีข้อมูลเกี่ยวกับทำไม autonegotiate ล้มเหลวดังนั้น (ค่อนข้าง) เป็นประจำฉันชอบที่จะได้ยินมัน
Schof

@dave ดังนั้นโอกาสของปัญหาการจัดการอัตโนมัติที่เกิดขึ้นกับขนาดและความซับซ้อนของเครือข่าย - นั่นสมเหตุสมผล นอกจากนี้เรายังไม่ขยายเครือข่ายแร็คเซิร์ฟเวอร์ของเราน้อยกว่าปีที่ผ่านมาโดย 3x ...
Jeff Atwood

4
@Jeff Atwood: ตราบเท่าที่การโยกย้าย "ขนาด" เกี่ยวข้องกับการเพิ่มอัตราต่อรองที่ดีกว่าในการเพิ่มอุปกรณ์ที่มีพฤติกรรมการจัดการโดยอัตโนมัติที่ไม่สามารถใช้งานได้ นี่ไม่เหมือนกับการท่วมเฟรมหรือทราฟฟิกออกอากาศ Autonegotiation เคร่งครัดระหว่างอุปกรณ์ไคลเอ็นต์และสวิตช์แต่ละพอร์ต
Evan Anderson

15

ฉันเชื่อว่าถ้าการจัดการโดยอัตโนมัติทำงานเป็นเวลาหนึ่งชั่วโมงต่อวันหรือต่อเดือนและด้วยเหตุผลบางอย่าง "สิ่งที่เกิดขึ้น" ที่การตั้งค่าลิงก์ไปที่ความเร็วคงที่ "แก้ไขได้" มีปัญหาที่ไม่ได้รับการแก้ไข แต่หลีกเลี่ยงแทน ฉันเดาว่าฉันเห็นการตั้งค่าลิงก์ให้แก้ไขเป็นวิธีแก้ปัญหาชั่วคราวจนกว่าปัญหาจริงจะได้รับการแก้ไข


เป็นไปได้ทั้งหมด; เราได้ทำการแก้ไขปัญหาอื่น ๆ แล้วเพื่อแก้ไขปัญหา แต่ฉันกังวลว่าทีมของ Joel มีปัญหาเช่นเดียวกับที่บันทึกไว้ใน "Five Whys" ดูเหมือนว่าจะค่อนข้างแพร่หลาย ..
Jeff Atwood

7
ฉันเห็นด้วยกับปัญหาการจัดการโดยอัตโนมัติเกิดขึ้น "มักจะ" แต่ในกรณีส่วนใหญ่หลังจากที่มันได้ทำงานสำหรับ "ในขณะที่" นั่นคือสิ่งที่กระตุ้นให้ฉันต้องการตรวจสอบเพิ่มเติมแทนที่จะใช้ลิงก์ถาวรเป็น "วิธีแก้ปัญหา" ฉันหมายถึง ... ถ้ารถของคุณที่ "ทำงานได้ดี" เริ่มทำงานไม่ราบรื่นเว้นแต่ว่ามันจะอุ่นขึ้นเป็นเวลา 10 นาทีคุณจะไม่พูด ตัวคุณเอง "เฮ้มันแก่แล้วและตอนนี้มันต้องอุ่นเครื่องนาน 10 นาที" คุณจะเอาไปดูโอกาสแรกของคุณเพราะ "มีอะไรผิดปกติ" ที่ไม่เคยเกิดขึ้นมาก่อน :)
dimitri.p

15

ดังนั้นขั้นตอนการแก้ไขปัญหา (สมมติว่าคุณหยุดหลังจากแต่ละและรอให้ปัญหาปรากฏขึ้นอีกครั้ง):

  1. ตรวจสอบล็อกบนสวิตช์เพื่อดูว่ามันบอกคุณหรือไม่ว่าทำไมมันถึงใช้ 100M
  2. หากคุณยังคงใช้งานอยู่ให้ปิดสิ่งที่น่ากลัวอย่างยิ่ง "การโหลดบาลานซ์ของ Windows" ที่โจเอลผลักดันอยู่ตลอดเวลา - วิธีการทำงานคือการแบ่งแคชของสวิตช์เพื่อบังคับให้ซอฟต์แวร์ประมวลผลทุกแพ็กเก็ต สวิตช์ของคุณได้รับการออกแบบมาเพื่อส่งต่อแพ็คเก็ตในฮาร์ดแวร์และมีเพียง CPU ที่ต้องใช้ในการหาเส้นทางทางกายภาพที่ทราฟฟิกที่ไม่รู้จักจะต้องใช้ (ใน -> asic -> out) และโปรแกรมฮาร์ดแวร์ที่จะทำ เครื่องคิดเลขมี CPU ที่ดีกว่าสวิตช์ของคุณอย่าทำสิ่งที่โง่ที่ทำให้ CPU ของสวิตช์ทำงานหนักขึ้น) การโหลดบาลานซ์ของ Windows ทำงานโดยการสลับของคุณเพื่อทำการตัดสินใจและติดตั้งแคชฮาร์ดแวร์สำหรับทุก ๆ แพ็คเก็ต ที่อาจไม่สามารถแก้ไขปัญหานี้โดยเฉพาะ แต่มันทำให้ฉันพอดคาสต์จาก ... ขออภัย
  3. ตรวจสอบให้แน่ใจว่าการกำหนดค่าตรงกันทั้งสองด้าน - ฟังดูเหมือนว่าคุณทำเสร็จแล้ว
  4. Google สำหรับ autoneg บั๊กบนสวิตช์ของคุณ - หากคุณไม่ได้สร้างมันขึ้นมาเองคุณไม่ได้เป็นคนเดียวที่พยายามเรียกใช้ autoneg ในทุกสิ่งที่คุณใช้งานอยู่
  5. เปลี่ยนสายเคเบิลที่มี Cat5e ที่ดีกว่าหรือดีกว่า - สายที่คุณรู้จักใช้งานได้ดีเยี่ยมเช่นเดียวกับที่เวิร์กสเตชันของคุณเสียบอยู่ อย่าพยายามใช้ Cat5 หรือบางคนทำอึให้ใช้อันที่มีการขึ้นรูปจริงจากแพ็คเกจ
  6. ย้ายพอร์ต - วางเซิร์ฟเวอร์บนพอร์ตอื่นบนสวิตช์เดียวกัน
  7. เปลี่ยน NIC - ใช้แบทช์ที่แตกต่างกันสั่งในเวลาอื่น

ณ จุดนี้คุณได้ยกเลิกการกำหนดค่าพอร์ตทางกายภาพที่คุณเสียบเข้ากับสายเคเบิลระหว่างกัน หากยังเกิดขึ้นสาเหตุอื่น ๆ อาจเกิดขึ้น:

  1. การจัดเส้นทางสายเคเบิล - ระวังการรบกวน EM จากสายไฟ AC ของคุณกำหนดเส้นทางลงด้านต่างๆของชั้นวาง
  2. การระบายความร้อน - ตรวจสอบให้แน่ใจว่าคุณอยู่ในสภาพแวดล้อมที่อุณหภูมิไม่เหมือน 90 องศาและการ์ด NIC ของคุณไม่ได้ลดลงในโหมด "พระเจ้าที่รักให้ฉันส่งต่อโหมดนี้โปรดหนึ่งแพ็คเก็ต" ฉันได้ยินมาแล้ว แต่ไม่เห็นว่าเราเตอร์ของ Cisco หยุดทำการสลับอย่างรวดเร็วและส่งต่อแพ็คเก็ตผ่าน CPU เมื่อพวกเขามีความร้อนสูงเกินไป
  3. แทนที่สวิตช์ด้วยสิ่งที่ไม่ดูด - ตรวจสอบจำนวนแบนด์วิดท์ที่โฮสต์ของคุณกำลังพูดถึงต่อวินาทีโดยรวมแล้วดูที่ความจุแบ็คเพลนที่รับการจัดอันดับของสวิตช์ของคุณ 7 โฮสต์จากศักยภาพที่ 48 การส่งสัญญาณทั้งหมด 1.0G นั้นเพียงพอที่จะหยุดการทำงานของ Cisco 3750 ได้ นอกจากนี้จะต้องมากระมัดระวังเกี่ยวกับ cheapo ยัง-วิ่งให้บริการเครือข่าย: D-Link, Linksys, Dell, Intel, และ HP ไม่มีใครรักษาเครือข่ายอย่างจริงจังใช้คนเหล่านั้นและไม่ใช่เพราะ "ไม่มีใครเคยถูกไล่ออกเพราะใช้ Cisco" แต่เพราะ "คนจำได้ว่าสวิตช์ Intel ที่มีพอร์ต 20/48 ล้มเหลวในระยะเวลา 2 ปี" หรือ "ฉันเคยใช้ ProCurve เฉพาะและ ติดตามว่าซิสโก้เป็นคนชั่วจนกระทั่งฉันใช้ซิสโก้จริง ๆ จนถึงตอนนี้ฉันก็หยุดซื้ออะไรให้น้อยลง " ซิสโก้ถือว่าเป็นช่วงกลางผู้ขายเครือข่ายแล้วบอกอะไรคุณเกี่ยวกับคนที่อยู่ใต้ Cisco ... :-)

ความเป็นมา / เหตุใดคำตอบของฉันจึงยอดเยี่ยมที่สุด: ฉันทำงานเป็นวิศวกรเครือข่าย / ระบบในอุตสาหกรรมการเงินและนี่คือประสบการณ์ของฉันกับเครือข่ายทั่วโลกขนาดเล็กของเรา (สำนักงานสาขา 15 แห่ง, 8 ศูนย์ข้อมูล):

พอร์ต LAN ทั้งหมดของเราเป็นแบบ autoneg เพราะเราควบคุมอุปกรณ์ทั้งสองด้านและมีการเข้าถึงทั้งสองด้าน --- ซึ่งอาจจะง่ายพอ ๆ กับการโทรศัพท์กับใครซักคนและตรวจสอบการตั้งค่า ในสามปีที่ผ่านมาฉันเคยมีหนึ่งในพอร์ตภายในของเราล้มเหลวเนื่องจากการจัดการโดยอัตโนมัติล้มเหลวและนั่นเป็นเพราะสายเคเบิลไม่ดี --- มันหายไปหลังจากเปลี่ยนสายเคเบิล

เรามีปัญหาเพิ่มมากขึ้นเมื่อผู้ใช้รุ่นก่อนหน้าใช้ hardcoded 100 / เต็มบน NICs ของพวกเขาและไม่ได้บันทึกความจริงนั้น รีเซ็ตทุกอย่างเป็นอัตโนมัติ / อัตโนมัติที่หน้าต่างบำรุงรักษาถัดไปและไม่มีปัญหาใด ๆ กับพวกเขาตั้งแต่นั้นมา

ในสถานที่สองแห่งที่เราได้รับทองแดงจากผู้ให้บริการสำหรับ WAN ของเรา? คุณควรคาดหวังว่าการเชื่อมต่อทองแดง WAN / อินเทอร์เน็ตน่าจะดูดอยู่ตลอดเวลาส่วนหนึ่งเป็นเพราะคุณไม่ทราบว่ามีอะไรเกิดขึ้น สวิทช์ Extreme ที่เก่าแก่บางตัวที่มีเฟิร์มแวร์ buggy สำหรับ autoneg แต่ติดแท็ก MPLS หรือไม่ ตัวแปลงสื่อบางอย่าง $ 5 เนื่องจากอุปกรณ์ Ciena edge ของ ISP ของคุณมีค่าเกินกว่าที่จะให้อีเธอร์เน็ตมากกว่าคู่บิด ตัดสินใจล่วงหน้าว่าจะจัดการและติดกับมันอย่างไรจากนั้นคาดว่าจะมีการเปลี่ยนแปลงภายในเวลา 22.00 น. ในวันเสาร์เนื่องจากการกำหนดค่าที่ตกลงกันไว้นั้นไม่เคยบันทึกไว้และพวกเขามีนโยบายที่จะปฏิบัติตาม

อย่างจริงจังแม้ว่าจะได้รับใยแฮนด์ออฟจาก ISP ของคุณ


2
เพิ่งได้รับการอ่านนี้ - คำตอบที่ดี
Helvick

คำตอบที่ยอดเยี่ยม
Rushino

2
เพียงเพื่อให้คำตอบสุดท้ายอยู่ที่นี่ที่ไหนสักแห่งมันเป็นไดรเวอร์ที่ไม่ดีของ Broadcom เราไม่พบชุดใด ๆ ที่ใช้งานได้ การเปลี่ยนเป็น Intel NICs จะแก้ไขได้ 100% blog.serverfault.com/2011/03/04/broadcom-die-mutha
Jeff Atwood

@JeffAtwood นั่นเป็นปัญหาเดียวกันหรือเปล่า ผมคิดว่าคนนี้ในที่สุดก็ติดตามลงไปที่โหมดประหยัดพลังงานสวิทช์ ...
เจมส์เคป

14

เครือข่ายที่ฉันรับผิดชอบ (รวมถึงคนอื่นอีกสองสามคน) ประกอบด้วยเซิร์ฟเวอร์มากกว่า 40 แห่ง, เวิร์กสเตชันมากกว่า 1,000 แห่ง (กระจายไปทั่ววิทยาเขตที่มีขนาดใหญ่) และอีก 1,000 WAPs ก็กระจายไปทั่วพื้นที่ขนาดใหญ่ด้วยประเภทและอายุที่แตกต่างกัน ของอุปกรณ์เครือข่าย

ดังที่ dimitri.p กล่าวเมื่อมีบางสิ่งที่ล้มเหลวในการหยุดการจัดการโดยอัตโนมัติทันใดก็มักจะบ่งบอกถึงปัญหาอื่น การตั้งค่าพอร์ตด้วยตนเองนั้นคล้ายกับการใส่ bandaid ให้กับคนที่แทงเข้าไปในกระเพาะอาหาร - มันอาจหยุดเลือดได้ แต่ก็มีความเสียหายอยู่ใต้

รายการตรวจสอบปกติของฉัน:

  • มีอะไรเปลี่ยนแปลงในเครื่องบ้างไหม? ไดร์เวอร์? การตั้งค่าระดับ OS หรือ BIOS? บางที autoneg ถูกปิดใช้งานในระบบปฏิบัติการ?
  • คุณสลับสายแพตช์แล้วและตรวจสอบว่าสายเคเบิลทำงาน (ถ้าเป็นตัวบันทึกการทำงานที่ใช้แร็คมากกว่าหนึ่งชั้น)
  • คุณได้ทดสอบเพื่อดูว่าพอร์ตสวิทช์ไม่ดีหรือล้มเหลว?
  • NIC อาจจะไม่ดี?

ตามกฎแล้วเราไม่ควรปิดการใช้งาน autoneg บนเซิร์ฟเวอร์ (หรือสิ่งอื่นใดในศูนย์ข้อมูล) เว้นแต่ว่าเป็นสถานการณ์ที่สาเหตุที่เป็นไปได้ทั้งหมดถูกกำจัดไปแล้วเราย้ายพอร์ตสวิตช์สายเคเบิลที่เปลี่ยนไปทดสอบ NIC เป็นต้นและไม่มี ทางเลือกอื่น ๆ ในกรณีนี้มันจะถูกบันทึกเป็นความตาย สิ่งนี้เกิดขึ้นน้อยมากและมักจะมีอุปกรณ์ที่เราไม่สามารถเข้าถึงเพื่อตรวจสอบการตั้งค่า BIOS และระบบปฏิบัติการ

ในทางกลับกันเวิร์คสเตชั่นและ AP ต่างเป็นเรื่องราวที่แตกต่าง Failed autoneg เป็นสัญญาณคลาสสิกของการเดินสายเคเบิลที่ไม่ดีและหลาย ๆ ครั้งเราต้องตั้งค่าความเร็วและดูเพล็กซ์ด้วยตนเองจนกว่าฤดูร้อนจะเริ่มต้นฤดูกาลของสายเคเบิลในกำแพง


เราได้เปลี่ยนสายเคเบิลและพอร์ตซ้ำ ๆ บนเซิร์ฟเวอร์ "ปัญหา" และเรากลับไปใช้ไดรเวอร์เครือข่าย "ในกล่อง" (Server 2008 R2) นอกจากนี้ยังเกิดขึ้นในเซิร์ฟเวอร์หลายเครื่องที่มีการกำหนดค่าเหมือนกัน ฉันกำลังลำบากในการปรับยอด "ไม่เคยทำอย่างนี้!" และ "ทำสิ่งนี้เสมอ!" ในคำตอบของคำถามเดียวกัน
Jeff Atwood

@Jeff: ทำความคุ้นเคยกับคำถามที่คุณและทีมงานโพสต์ไว้ตั้งแต่แรก ( serverfault.com/questions/104791 ) ฉันสนใจที่จะทราบว่าปัญหาเกิดขึ้นจากพอร์ตสวิตช์หรือพอร์ต NIC ในคอมพิวเตอร์เซิร์ฟเวอร์ที่มีปัญหา . ยี่ห้อ / รุ่นของ NIC / ชิปเซ็ตคืออะไร?
Evan Anderson

1
@Jeff - คำตอบบางคำไม่ใช่ไบนารี :) มันทำเมื่อคุณต้องจนกว่าคุณจะมีโอกาสรู้ว่าปัญหาคืออะไร
dimitri.p

@evan เกิดขึ้นในทุก ๆ เซิร์ฟเวอร์ของเว็บเทียร์ หากยังคงมีปัญหาหลังจากการเปลี่ยนแปลงนี้แสดงว่าเป็นปัญหาซอฟต์แวร์ เซิร์ฟเวอร์คือ Lenovo RS110 x6 และ Lenovo RD120 x2
Jeff Atwood

1
เพียงเพื่อให้แน่ใจว่าคำตอบสุดท้ายอยู่ที่นี่ที่ไหนสักแห่ง: มันเป็นปัญหาไดรเวอร์กับ Broadcom เราไม่สามารถแก้ไขได้ด้วยชุดไดรเวอร์ที่ทราบ "แก้ไข" เพียงอย่างเดียวคือเปลี่ยนเป็น Intel NIC
Jeff Atwood

10

นี่คือตำนานเครือข่าย พวกเครือข่ายของเราสาบานด้วยเรื่องไร้สาระนี้เพราะในปี 1998 สวิตช์เบย์จะไม่เจรจากับซิสโก้หรืออะไรบางอย่าง ดังนั้นแทนที่จะใช้ค่าเริ่มต้นสำหรับอุปกรณ์ 99.999% ในโลกเรามีแบบฝึกหัดการจัดการการกำหนดค่าที่ไร้สาระและแพะรับบาปที่ยอดเยี่ยมสำหรับช่วงเวลาที่มีการอัปเดตไดรเวอร์ NIC รีเซ็ตการตั้งค่าเพื่อต่อรองอัตโนมัติและไม่มีอะไรเกิดขึ้น

มันทำให้มันน่าขบขันมากขึ้นเพราะเซิร์ฟเวอร์ของเราหลายแห่งใช้คุณสมบัติที่น่าสงสัยเช่นการทำงานเป็นทีม NIC ซึ่งจะป้องกันไม่ให้คุณสูญเสียการเข้าถึงเครือข่ายในกรณีที่เกิดความล้มเหลวของสวิตช์ในขณะที่ทำให้คุณเกิดความล้มเหลวของซอฟต์แวร์ (ไดรเวอร์ดูดเสมอ)

ในการป้องกันเครือข่ายพวกนั้น severs จำนวนมากกำลังทำงานกับไดรเวอร์ NIC ที่เป็นค่าเริ่มต้นของ Windows ซึ่งโดยทั่วไปแล้วจะดูด หากคุณมีปัญหาเกี่ยวกับการจัดการโดยอัตโนมัติและอุปกรณ์ของคุณไม่ตรงกับการบริหาร Clinton ให้อัพเดตไดร์เวอร์ NIC เหล่านั้น


1
ในที่สุดมันก็เป็นไดรเวอร์ที่ไม่ดี แต่สิ่งที่เราแก้ไขได้อย่างเดียวคือเปลี่ยนเป็น Intel NIC ตอนนี้เรามีความอาฆาตพยาบาทตลอดชีวิตกับ Broadcom NICs
Jeff Atwood

10

คุณควรเจรจาอัตโนมัติ หากคุณมีสวิตช์ที่ไม่สามารถต่อรองอัตโนมัติได้อย่างน่าเชื่อถือให้ซื้อสวิตช์ที่ดีกว่า

กิกะบิตควรจะเจรจาอัตโนมัติและรวมถึงการตรวจจับข้ามอัตโนมัติ (MDI-X)

100baseT รับประกันว่าจะล้มเหลวหากปลายด้านหนึ่งถูกตั้งค่าเป็นอัตโนมัติและอีกชุดหนึ่งเป็นแบบแมนนวลซึ่งเป็นไปตามข้อกำหนด หากคุณบังคับให้ปลายด้านหนึ่งไปที่ 100 / เต็มจากนั้นปลายอีกด้านจะเจรจาโดยอัตโนมัติถึง 100 / ครึ่งทำให้คุณไม่ตรงกันสองเท่า


9

โดยทั่วไปฉันตั้งค่าเซิร์ฟเวอร์ให้คงที่ตามที่ฉันเห็นอุปกรณ์เครือข่ายเจรจาต่อรอง 10 / ครึ่งแทน 1,000 / เต็ม

นอกจากนี้ CoLos บางตัวยังตั้งค่าสวิตช์ไม่ให้เจรจา แต่ทำเฉพาะลิงก์ที่ 1000 / เต็ม


7

การปิดใช้งานการเจรจาต่อรองอัตโนมัติในการกำหนดค่าเริ่มต้นที่ยังไม่ทดลองนั้นคล้ายกับการเขียนโปรแกรมวูดู - คุณกำลังเปลี่ยนบางอย่างโดยไม่มีเหตุผล หากหลังจากคุณทดสอบแล้วคุณจะเห็นว่ามีการพิมพ์สองด้านหรือความเร็วไม่ตรงกันหรือมีข้อผิดพลาดมากเกินไปบนพอร์ตจากนั้นทำการแก้ไขปัญหาอื่น ๆ และแก้ไขการกำหนดค่าในที่สุดหากจำเป็น

เมื่อคุณอัปเกรดไดรเวอร์หรือเปลี่ยนฮาร์ดแวร์ไม่มีการรับประกันว่าการตั้งค่าของคุณจะถูกเก็บไว้ในฝั่งเซิร์ฟเวอร์

ตั้งค่าลิงก์ทั้งสองด้านเพื่อต่อรองหรือแก้ไขทั้งสองด้าน เมื่อคุณแก้ไขการตั้งค่าความเร็วและดูเพล็กซ์ในอุปกรณ์บางอย่างพวกเขาจะไม่ประกาศความสามารถของอุปกรณ์เหล่านั้นกับเพื่อน ฉันไม่รู้ว่ามาตรฐาน Ethernet บอกว่าจะทำอย่างไรเมื่อฝ่ายหนึ่งประกาศความสามารถและอีกด้านหนึ่งไม่ได้และนั่นอาจหมายถึงผู้ใช้งานจำนวนมากไม่รู้เช่นกัน บางคนจะเลือกตัวหารร่วมที่ต่ำที่สุดซึ่งก็คือ 10 ครึ่งและคนอื่น ๆ จะถือว่าทุกอย่างโอเคและเลือกความเร็วที่เร็วที่สุดเท่าที่จะทำได้

มีฮาร์ดแวร์ร่วมสมัยบางชิ้นที่ไม่สนับสนุนการต่อรองอัตโนมัติบนอีเธอร์เน็ต gigabit copper เช่น (อย่างน้อยบางส่วน) สวิตช์ของ Cisco กับ copper SFP


โมดูล 6748-SFP รองรับการจัดการอัตโนมัติได้ดีพวกเขาไม่อนุญาตให้คุณต่อรองอะไรเลยยกเว้น 1,000 / เต็ม :-)
James Cape

6

หลายปีที่ผ่านมาฉันใช้เวลาทำงานกับ 3com เพื่อสนับสนุนเทคโนโลยีสำหรับอุปกรณ์เครือข่ายทั้งหมดของพวกเขา มันน่าทึ่งที่ปัญหานี้เกิดขึ้นบ่อยครั้งและเป็นขั้นตอนมาตรฐานที่ค่อนข้างมากในการตั้งค่าทุกอย่างด้วยตนเอง


4
คำสั่งการทำงานในคำตอบนี้คือ "หลายปีก่อน" 10/100 autonegotiation ไม่เหมือนกับ thiggotiation gigabit ของวันนี้
Evan Anderson

1
คุณพูดถูก! นี่คือ "หลายปีที่ผ่านมา" และในตอนนี้เมื่อมองย้อนกลับไปฉันไม่จำเหตุการณ์นี้ได้ทุกที่ใกล้กับอุปกรณ์กิกะบิตซึ่งเป็นสิ่งที่ค่อนข้างใหม่ในเวลานั้น

4

ฉันมีปัญหามากมายกับการเจรจาอัตโนมัติ แน่นอนหลายคนหมายถึงทุก ๆ สองสามเดือน แต่นั่นเป็นปัญหาหนึ่งที่มากเกินไปในหนังสือของฉัน

ปัญหาการเจรจาอัตโนมัติหายากโดยเฉพาะอย่างยิ่งเมื่อคนที่จัดการเครือข่ายเซิร์ฟเวอร์แอปพลิเคชันและฐานข้อมูลเป็นสี่ทีมที่แตกต่างกัน โดยปกติแล้วสองคนสุดท้ายจะใช้เวลามากมายในการกลับไปกลับมากล่าวหาซึ่งกันและกันเกี่ยวกับประสิทธิภาพที่ไม่ดีและโกหกเกี่ยวกับการวัดและบางครั้งก็ส่งไปยังผู้ใช้เซิร์ฟเวอร์ซึ่งจะดูผลลัพธ์ของ "อันดับสูงสุด" และพูดทุกอย่างว่า ดีกับเซิร์ฟเวอร์

สิ่งนี้จะดำเนินต่อไปจนกว่าเรื่องจะเพิ่มขึ้นจนถึงจุดที่ "ผู้เชี่ยวชาญ" (จริง ๆ แล้วคนที่เป็นคนทั่วไปและเข้าใจเครือข่ายฮาร์ดแวร์ระบบปฏิบัติการฐานข้อมูลเฟรมเวิร์กและแอปพลิเคชัน) ได้รับมอบหมายให้แก้ไขปัญหาและค้นหาปัญหา ภายในห้าหรือสิบนาที

ดังนั้นกฎของหัวแม่มือของฉันเองเมื่อใดก็ตามที่ฉันมีความสามารถในการทำบางสิ่งบางอย่างเกี่ยวกับเรื่องนี้คือการกำหนดความเร็วคงที่บนเซิร์ฟเวอร์ที่ใช้งานจริงสวิตช์และเราเตอร์เสมอ เซิร์ฟเวอร์ที่ไม่ได้ใช้งานจริงเช่นกันหากมีการแยกให้เพียงพอสำหรับผู้ที่ใช้งานนั้นจะไม่สามารถเข้าถึงรูทได้

สวิตช์ที่จัดการการเข้าถึงเดสก์ท็อป / โน้ตบุ๊กสามารถใช้เพื่อต่อรองอัตโนมัติและมีข้อยกเว้นสำหรับกฎ เพียงพูดถึงสิ่งหนึ่งหากมีการเปลี่ยนแปลงมากมายเกิดขึ้นในเครือข่ายมันเป็นการดีที่จะปล่อยให้มันเป็นไปโดยอัตโนมัติและคอยจับตาดูสิ่งต่าง ๆ

อีกประเด็นที่อาจเป็นประโยชน์ไม่ว่าคุณจะเลือกทางไหนในการเจรจาต่อรองอัตโนมัติคือการตรวจสอบสิ่งต่าง ๆ เพียงกำหนดค่าNagiosหรืออะไรก็ได้ที่คุณต้องคอยจับตาดูสถานะของพอร์ตสำคัญ ๆ คุณกำลังตรวจสอบอุปกรณ์เครือข่ายนั้นอยู่แล้วใช่ไหม


4

หยาบหนึ่ง ฉันเห็น 100Mb 3com NICs ที่ไม่เชื่อมต่อกับอะไรที่สูงกว่า 10Mb ถ้าคุณบังคับความเร็วหรือดูเพล็กซ์ คุณจะได้รับความเร็วเต็มที่โดยให้พวกเขาต่อรองอัตโนมัติแม้ว่าคนขับจะมีการตั้งค่าเต็ม 100Mb และ 100Mb ครึ่ง

ไดรเวอร์ NIC จำนวนมากไม่อนุญาตให้คุณระบุ 1000Mb ตัวเลือกเดียวคือ 10, 100, อัตโนมัติ บังคับให้คุณทำ Auto อีกครั้งหากคุณต้องการความเร็วเต็ม ตัวอย่างเช่นไดรเวอร์ Broadcom netXtreme 57xx Gigabit จะทำงานแบบนี้

คุณสามารถบังคับให้กิกะบิตบนสวิตช์ได้อย่างง่ายดาย แต่ฉันคิดว่าคุณจะถูกบังคับให้ปล่อย NIC ส่วนใหญ่โดยอัตโนมัติ


5
ข้อมูลจำเพาะกิกะบิตต้องการการจัดการโดยอัตโนมัติ
duffbeer703

3
  1. จากประสบการณ์ของฉัน (ส่วนใหญ่ 3Com และอุปกรณ์ HP ไม่มาก Cisco) การเจรจาอัตโนมัติไม่ทำให้เกิดปัญหามากนัก

  2. ในทำนองเดียวกันกับ mrdenny ฉันมักจะตั้งเซิร์ฟเวอร์ให้เป็นความเร็วที่เร็วที่สุด (เรายังคงมีบางอย่างที่ 100) เต็มเพล็กซ์แล้วปล่อยสวิตช์อัตโนมัติ เนื่องจากเรามีความเร็วที่ผสมผสานกันทั้งบนเซิร์ฟเวอร์และเวิร์คสเตชั่นฉันชอบที่จะปล่อยสวิตช์ไว้ที่อัตโนมัติและปล่อยให้มันปรับให้เข้ากับจุดสิ้นสุด


2
ด้วยอุปกรณ์ของ Cisco หากคุณตั้งค่าความเร็วของโฮสต์ด้วยตนเองและปล่อยสวิตช์อัตโนมัติคุณจะเพิ่มปัญหาที่อาจเกิดขึ้น Ciscos ชอบ Auto-Auto หรือ Manual-Manual
einstiien

ไม่ใช่แค่ Cisco เท่านั้น - ทุกอย่างทำงานได้ดีขึ้นเมื่อปลายทั้งสองของลิงก์ตรงกัน
James

3

ฉันมีปัญหาบางอย่างเกี่ยวกับการจัดการโดยอัตโนมัติในการตั้งค่าที่บ้านและปัญหาคือการเดินสายไฟโดยเฉพาะอย่างยิ่งสายเคเบิลเครือข่ายที่ม้วนขึ้นเป็นวงด้วยเส้นผ่านศูนย์กลางเล็กเกินไปหรือวางไว้ใกล้กับสายไฟ

แต่ฉันคิดว่าคำแนะนำเหล่านี้เล็กน้อยเกินไปสำหรับการตั้งค่าของคุณ ;)


2

ฉันเพิ่งอ่านเกี่ยวกับเรื่องนี้ใน Network Warrior โดย Gary Donahue จากหนังสือเล่มนี้เพื่อให้การเจรจาอัตโนมัติทำงานอย่างถูกต้องทั้งสวิตช์และ NIC ต้องถูกตั้งค่าเป็นการเจรจาอัตโนมัติ การตั้งค่า NIC เป็นความเร็วเฉพาะและโหมดดูเพล็กซ์และออกจากเซิร์ฟเวอร์ในการต่อรองอัตโนมัติจะทำงานไม่ถูกต้อง - การต่อรองอัตโนมัติเป็นโปรโตคอลและทั้งสองฝ่ายจำเป็นต้องพูดเพื่อให้การตั้งค่าทำงานได้อย่างถูกต้อง

หากคุณต้องการตั้งค่าความเร็วและโหมดดูเพล็กซ์อย่างชัดเจนคุณต้องทำทั้งสองด้านของการเชื่อมต่อ


ขึ้นอยู่กับว่าคุณกำลังพูดถึงเรื่องการสื่อสารอัตโนมัติแบบกิกะบิตแบบใหม่หรือไม่ - มันแตกต่างอย่างสิ้นเชิงจากแบบตัวต่อตัวแบบ 10/100 แบบเก่า
Jeff Atwood

2

Cisco หารือเกี่ยวกับบางกรณีที่คุณอาจต้องการกำหนดความเร็วพอร์ตและดูเพล็กซ์ด้วยตนเองแทนที่จะใช้การจัดการโดยอัตโนมัติเมื่อใช้อุปกรณ์รักษาความปลอดภัย PIX / ASA: http://www.cisco.com/en/US/products/hw/vpndevc/ps2030/ products_tech_note09186a008009491c.shtml # แก้ไขปัญหา


1

กฎง่ายๆของฉันคือการใช้การต่อรองอัตโนมัติสำหรับทุกสิ่งยกเว้นลิงก์เราเตอร์เว้นแต่คุณจะมีปัญหาเฉพาะ (เช่นการ์ด Broadcom ล่าสุด ... BAH!)

หากคุณมีเราเตอร์สองตัวเชื่อมโยงผ่านอีเธอร์เน็ตให้ตั้งค่าความเร็วด้วยตนเองที่ปลายทั้งสองด้วยตนเอง


2
ทำไมคุณต้องตั้งค่าความเร็วระหว่างเราเตอร์ด้วยตนเอง
Amok

ฉันคิดว่ามันเป็นนิสัย แต่เมื่อคุณเริ่มคิดถึงลิงก์ที่ไม่ใช่อีเธอร์เน็ตคุณจะต้องตั้งค่าความเร็ว
Aaron C. de Bruyn
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.