เนื่องจากสแปนนิ่งทรีล้มเหลว (หรือคุณไม่มีทรีสแปนนิ่ง) และรับอีเธอร์เน็ตวนซ้ำวิธีที่ดีที่สุดในการวินิจฉัยปัญหาคืออะไร
สวิทช์ใด? และอื่น ๆ
เนื่องจากสแปนนิ่งทรีล้มเหลว (หรือคุณไม่มีทรีสแปนนิ่ง) และรับอีเธอร์เน็ตวนซ้ำวิธีที่ดีที่สุดในการวินิจฉัยปัญหาคืออะไร
สวิทช์ใด? และอื่น ๆ
คำตอบ:
ตกลงดังนั้นสมมติว่าคุณมีโทโพโลยีเช่น:
SW1
/ \
/ \
/ \
PC A--SW2-----SW3--PC B
ด้วยเหตุผลบางอย่างที่มีการเชื่อมโยงวนรอบ STP ถูกปิดใช้งานหรือมีคนใช้ตัวกรองในสถานที่ที่ไม่ถูกต้องหรือเช่นนั้น
พีซี A ต้องการสื่อสารกับพีซีบีเป็น ARP แรกสำหรับ MAC ของพีซี B ปลายทางคือการออกอากาศด้วย MAC ffff.ffff.ffff ดังนั้นเฟรมจะไปที่ทั้ง SW1 และ SW3 SRC MAC คือ PC A. SW1 จากนั้นให้เฟรมไปทาง SW3 และ SW3 จะทำให้เฟรมนั้นมาจาก SW2 ถึง SW1
SW1 และ SW3 เรียนรู้ MAC ของพีซี A เมื่อเฟรมแรกเข้ามาเมื่อเฟรมที่สองเข้ามาจากทิศทางตรงกันข้ามมันจะต้องทำการศึกษาใหม่ เนื่องจากเหตุการณ์เหล่านี้เกิดขึ้นอย่างรวดเร็วและซ้ำ ๆ คุณจะเห็นข้อความบันทึกบ่นเกี่ยวกับ MAC flapping บางอย่างเช่น "MAC FLAP 0000.0000.0001 กำลังกระพือระหว่าง Gi0 / 24 และ Gi0 / 23" นี่เป็นสัญญาณที่ดีว่าคุณมีลูป
สิ่งที่คุณสามารถทำได้คือพยายามติดตาม MAC นี้ ลองค้นหาในแคช ARP ของอุปกรณ์ในซับเน็ตเดียวกันและดูว่าอุปกรณ์นี้มี IP ใด ดังนั้นด้วย MAC คุณสามารถลองติดตามด้วย sh mac-address-table หรือกับ IP บางทีคุณอาจมีรายการที่มี IP ทั้งหมดและที่ที่พวกเขาเชื่อมต่ออยู่
หากโฮสต์ได้รับที่อยู่ IP จากเซิร์ฟเวอร์ DHCP คุณสามารถลองค้นหาที่โฮสต์นั้นมาจากที่นั่นได้ หากคุณมีตัวเลือก 82 เปิดใช้งานซึ่งจะเป็นความช่วยเหลือที่ดี
สัญญาณอื่น ๆ คือ CLI จะซบเซามาก โหลดของ CPU จะสูงมาก สวิตช์ทำเกือบทุกอย่างใน ASIC ดังนั้นหากสวิตช์มีโหลด CPU มากกว่า 50% ก็อาจไม่ดี คุณควรใช้การตรวจสอบ SNMP และเฝ้าดูโหลด CPU สูง มองหาข้อความที่พนัง MAC หากสวิตช์มีลูปไฟ LED อาจจะกะพริบอย่างบ้าคลั่ง
สิ่งที่คุณสามารถทำได้เพื่อป้องกันลูป:
หนึ่งในผู้ใช้ของฉันเพิ่งยืมสวิตช์เดสก์ท็อปจากโต๊ะทำงานของใครบางคน เมื่อกลับสวิตช์พวกเขาเสียบสายอีเธอร์เน็ตที่หลวมทั้งหมดที่อยู่ใกล้เคียง หนึ่งในสายเคเบิลเหล่านั้นไปที่เครือข่ายและอีกสายหนึ่งเป็นปลายทั้งสองของสายเคเบิลเดียวกัน สวิตช์เดสก์ท็อปถูกเสียบเข้ากับเครือข่ายและเสียบเข้ากับตัวเอง สวิตช์ไม่มี STP ดังนั้นการออกอากาศที่มาจากเครือข่ายจะวนซ้ำกับสายเคเบิลอื่นในทั้งสองทิศทาง แน่นอนว่าทุกครั้งที่มีการออกอากาศบนพอร์ตที่วนลูปมันจะถูกจำลองแบบกลับสู่เครือข่าย มันทำให้ HSRP เป็นบ้าอย่างแน่นอนและ - เนื่องจากการออกแบบที่ไม่ดี - มันยังส่งผลให้ความล้มเหลวของการติดแท็กด้วย OSPF ทั่วทั้งมหาวิทยาลัย
ข้อบ่งชี้แรกของปัญหาคือ macflap ส่งต่อไปยังอีเมลของฉัน สิ่งนี้นำเราไปสู่ตู้สายไฟที่ถูกต้องทันที จากนั้นก็เป็นกระบวนการกำจัดตามไฟ LED พอร์ตอินเตอร์เฟส pps และบันทึก ไม่จำเป็นต้องพูดเลยว่าฉันมีตั้งแต่ปรับปรุงวิทยาเขตทั้งหมดไปแล้ว มาตรการป้องกันที่ดีที่สุดน่าจะเป็น bpduguard ฉันได้ปรับใช้คุณสมบัติตั้งแต่และมันค่อนข้างง่าย การได้รับ syslog ที่ผิดพลาดได้ในอีเมลของฉันนั้นไม่ใช่เรื่องที่น่ายินดีเลย
ด้วยอุปกรณ์ส่วนใหญ่ซีพียูจะถ่ายได้ถึง 100% และสิ่งเดียวที่คุณทำได้คือการเชื่อมต่อทางกายภาพที่ซ้ำซ้อน เมื่อ CPU สงบลงคุณสามารถเชื่อมโยงลิงค์กลับทีละอันและดูว่าอันใดทำให้ลูปเกิดขึ้นอีก
สำหรับแชสซีขนาดใหญ่ (เช่น 6500) ฉันต้องดึงใบมีดทั้งหมดออกแล้วเสียบเข้าทีละครั้ง เมื่อฉันคิดออกว่าใบมีดใดแล้วฉันต้องดึงลิงก์ทั้งหมด (16 GBICs) ทั้งหมดและใส่กลับเข้าไปทีละครั้งเช่นกัน ไม่เคยสนุก
อุปกรณ์ที่ทันสมัยกว่าบางรุ่นมีซีพียูที่ได้รับการป้องกันซึ่งจะช่วยให้จัดการได้ง่ายขึ้น - คุณยังสามารถโต้ตอบกับกล่องได้ เมื่อถึงจุดนั้นมองไปที่เคาน์เตอร์รับส่งข้อมูลและเพื่อพิจารณาว่าลิงก์ทำงานผิดปกติเป็นไปได้หรือไม่
ฉันเพิ่งเริ่มต้นที่ บริษัท ที่พวกเขาใช้ข้อ จำกัด การออกอากาศในแต่ละพอร์ต หากพอร์ตผ่าน> 5% ของความจุของมันในขณะที่ส่งสัญญาณสวิตช์จะใส่ลงใน ERRDISABLE
storm-control broadcast level 5.00
storm-control action shutdown
นี่เป็นเครื่องช่วยชีวิตเมื่อกลุ่มหนึ่งมีแนวโน้มที่จะเสียบอุปกรณ์ที่เชื่อมต่อเครือข่ายไร้สายเข้ากับ LAN
แม้ว่าสำหรับคำถามจริงของคุณฉันพบเสมอว่าเป็นคู่มือ
สำหรับ IOS:
คุณอาจจะมีที่อยู่ MAC กระพือระหว่างพอร์ต .. มองหาMAC_MOVE_NOTIFICATION
ข้อผิดพลาด (หรือคล้ายกัน) ใน:
sh logg
ตอนนี้หาพอร์ต:
sh int g0/1 controller
มองหาจากสามัญMulticast
และBroadcast
ตัวเลข การชนใด ๆ เป็นสัญญาณที่ไม่ดี
สุดท้าย แต่ไม่ท้ายสุดคุณไม่สามารถเข้าสู่ระบบได้เนื่องจาก CPU มี pwned :)
sh proc cpu
สวิตช์ทำงานที่นี่ได้อย่างไร ถ้าเป็นสวิตช์ L2 เท่านั้นคุณไม่ต้องการอะไรเลย ~ 10%
ในกรณีที่คุณไม่มีการจัดการหรือเทียบเท่าของไม่มีการจัดการ (ขาดรายละเอียดการเข้าสู่ระบบหรือความรู้ของระบบปฏิบัติการสวิทช์ ฯลฯ ) สวิตช์และสะพานวนฉันอธิบายว่าฉันจะไปหาห่วงด้วยตนเอง นอกจากนี้ยังเน้นที่พื้นฐานด้านล่างของคำถามเดิม "คุณไม่มี STP"
อัลกอริทึมพื้นฐานสำหรับการค้นหาความผิดของลูปนี้คล้ายกับ STP ยกเว้นว่าคุณไม่สามารถเข้าถึงเพื่อส่ง BPDU พร้อมกับหมายเลขพอร์ตในนั้น
นี่เป็นการค้นหาด้วยตนเองที่ครบถ้วนสมบูรณ์สำหรับพอร์ตแบบวนรอบ
โดยทั่วไปจะมีเพียงหนึ่งคู่ของพอร์ตที่วนลูปหมายถึงการค้นหาที่ละเอียดและปลอดภัยด้วยการลบพอร์ตที่เชื่อมต่อ (ลิงก์) ทั้งหมดก่อนแล้วจึงทำการเชื่อมต่อพอร์ตทีละตัวใหม่ทีละอันไม่จำเป็น หากมีเพียงหนึ่งพอร์ตที่จับคู่ 'ทรี' เข้าด้วยกันคุณสามารถค้นหาได้โดยยกเลิกการเชื่อมต่อทีละพอร์ต
อย่างไรก็ตามวิธีการหรืออัลกอริทึ่มทั่วไปกลายเป็นสิ่งที่ฉันอธิบายไว้ข้างต้น
อุ๊ยตาย แต่ตกลงฉันคิดได้สองวิธีที่ฉันจะไปที่นี้ ...
นัยน์ตามัน: หากสวิตช์มีตัวบ่งชี้พอร์ตคุณควรจะสามารถมองเห็นได้ว่าพอร์ตใดที่ใช้งานได้ดีที่สุด เหล่านี้คือคนที่จะเริ่มมองครั้งแรก หวังว่าสายเคเบิลจะมีป้ายกำกับเพื่อให้คุณสามารถค้นหาผลไม้แขวนต่ำของการค้นหาสองพอร์ตที่ไม่ว่างบนสวิตช์ทั้งสองด้วยสายเคเบิลเดียวกัน
การตรวจสอบ SNMP: หากคุณมีสถิติการใช้งาน SNMP (หรือคล้ายกัน) ให้มองหาสวิตช์ที่ทำงานได้ดีที่สุดและพอร์ตที่ทำงานได้ดีที่สุด จากนั้นไปดูที่สายเคเบิล
... หากคุณมีสายเคเบิลที่ไม่มีป้ายกำกับให้เริ่มการติดตามและการติดฉลากซึ่งเป็นส่วนหนึ่งของการตรวจสอบพอร์ตที่พลุกพล่านที่สุด
ฉันจะตอบคำถามนี้ตามความเข้าใจว่ามีปัญหาการหยุดทำงานสำหรับโดเมนเลเยอร์ 2 ที่เป็นปัญหาและคุณไม่สามารถเข้าถึงการจัดการได้เนื่องจากซีพียูถูกตรึงไว้ทั้งหมด
วิธีที่ดีที่สุดในการแก้ปัญหาการเชื่อมโยงลูปคือการเริ่มถอดปลั๊กอัปลิงค์จนกว่ามันจะหายไป สมมติว่าคุณมีเลเยอร์การเข้าถึงแบบสวิตช์ที่มีมาตรฐานพร้อมสวิตช์การเข้าถึงทั้งหมดที่เชื่อมต่อกับสวิตช์การกระจายคู่ ไปที่สวิตช์การเข้าถึงตัวแรกและถอดปลั๊กอัปลิงค์ถ้า LED ของ switchports หยุดที่จะคิดว่าไม่ใช่สวิตช์นั้นให้เสียบกลับเข้าไปแล้วไปที่หน้าถัดไป ทำซ้ำจนกว่าคุณจะไปที่สวิทช์ที่คุณได้ถอดปลั๊กอัปลิงค์และไฟ LED ยังคงกะพริบอย่างรวดเร็วนี่คือสวิตช์ของคุณพร้อมลูป
ตอนนี้เริ่มต้นกระบวนการถอดปลั๊กที่พอร์ตผู้ใช้จนกว่าไฟ LED จะสงบลงเมื่อทำเช่นนั้นสิ่งสุดท้ายที่คุณถอดปลั๊กก็คือพอร์ตปัญหาให้ติดตามสายเคเบิล
หากคุณเชื่อมต่อจากระยะไกล (หรือผ่านสายคอนโซล) เข้ากับอุปกรณ์คุณจะสังเกตเห็นว่ามันทำงานช้ามากจะมีความล่าช้าจากเมื่อคุณพิมพ์ตัวอักษรที่มากับ CLI
ถ้าเป็นสวิตช์ของซิสโก้ 2 ตัวที่ง่ายคือการดูสถิติอินเตอร์เฟสมันจะเป็นการใช้งาน 100% (หรือ 255/255) ตลอดเวลา ในช่วงเวลาหลายปีที่ฉันทำงานกับสวิตช์ฉันยังไม่เห็นการใช้งานพอร์ตอย่างถูกต้องตามกฎหมายได้รับผลกระทบ 100% นอกเหนือจากนั้นให้ตรวจสอบการใช้งาน CPU (โดยปกติจะ "แสดงประวัติซีพียูกระบวนการ") ส่วนต่อประสานแบบวนรอบมักจะทำให้ CPU ของคุณค่อนข้างแรงยกเว้นว่าคุณใช้สวิตช์ระดับสูง
ควรเปิดใช้งาน STP จริงๆแล้ว!
ฉันมีปัญหานี้เกิดขึ้นในเครือข่ายที่ปลายอีกด้านหนึ่งของสหรัฐอเมริกาและต้องช่วยเหลือนักวิเคราะห์ระดับหนึ่งผ่านทางโทรศัพท์และลิงค์วันของฉันไปยังเว็บไซต์ของพวกเขา ปัญหามีความซับซ้อนมากขึ้นเนื่องจากข้อเท็จจริงที่ว่าพวกเขามีสวิตช์หลายยี่ห้อซึ่งพวกเขาได้เพิ่มเครือข่ายอย่างช้าๆในช่วงหลายปีที่ผ่านมา เมื่อพวกเขาย้ายสำนักงานพวกเขาทำเครื่องหมายที่แต่ละพอร์ตไปแล้วแนบทุกอย่างในลักษณะเดียวกันที่สำนักงานใหม่และเริ่มทุกอย่างขึ้น จำเป็นต้องพูดว่าสวิตช์จำนวนหนึ่งที่ทำงานต้นไม้ทอดซึ่งไม่ได้รวมกันเป็นแบบเดียวกันและมีลูปและปัญหาทุกประเภท เมื่อถึงเวลาที่ฉันทำการแก้ไขทุกอย่างไม่น้อยกว่าสามสวิตช์ที่ไม่มีการจัดการถูกค้นพบว่ามีการเชื่อมต่อในลูปกับส่วนที่เหลือของโครงสร้างพื้นฐาน
วิธีที่ฉันสามารถติดตามสวิตช์ที่ไม่มีการจัดการแต่ละรายการได้โดยใช้เครื่องมือที่เรียกว่า nedi (บนสวิตช์ซึ่งสามารถจัดการได้ฉันเปิดใช้งาน lldp / cdp) ฉันสร้างแผนที่ครั้งแรกด้วย nedi จากนั้นในพื้นที่ที่แผนที่แสดงการเชื่อมต่อจากสวิตช์หนึ่งไปอีกสวิตช์หนึ่งแล้วย้อนกลับไปยังสวิตช์เดียวกันอีกครั้งฉันมีช่างเทคนิคเครือข่ายในไซต์ติดตามเส้นด้วยตนเอง ฉันจะปิดการเชื่อมต่อด้วยตนเองที่เกี่ยวข้องกับการวนรอบหรือมีการถอดสายคนในสถานที่ ในท้ายที่สุดฉันก็สามารถทำให้เครือข่ายทำงานได้อย่างที่ควรจะเป็นแม้จะมีสวิตช์ยี่ห้อที่บ้าคลั่ง
สิ่งหนึ่งที่สามารถทำได้ที่นี่คือการมองเห็นสิ่งที่เครื่องจะเชื่อมต่อกับสวิทช์โดยใช้คำสั่งหรือshow cdp neighbor
show lldp neighbor
หากไม่ได้ใช้คำสั่งป้องกัน BPDU และมีคนเชื่อมต่อสวิตช์โกงที่มีลำดับความสำคัญต่ำกว่า (หรือที่อยู่ mac ที่เก่ากว่า) อุปกรณ์ใหม่จะเจรจาเป็นรูท Spanning Tree ซึ่งจะทำให้เกิดปัญหาอย่างแน่นอน
จากประสบการณ์ของฉันมันมักจะเป็นสายเคเบิลที่ฉันเพิ่งเสียบเข้าหรือไม่ปิดหรือเพิ่มลงในพอร์ตช่อง รุนแรงกว่าเมื่อมีคนอื่นทำและไม่ยอมทันที
การพิจารณาลูปนั้นขึ้นอยู่กับยี่ห้อสวิตช์ที่คุณมี ตัวอย่างเช่นบน Extreme switch ฉันสามารถรัน elrp-client บน VLAN และสวิตช์นั้นจะส่งเฟรมบรอดคาสต์บนพอร์ตทั้งหมดสำหรับ VLAN นั้นและดูว่ามันส่งกลับโดยพวกมันหรือไม่ถ้าเป็นเช่นนั้นมันจะบอกฉันว่า พอร์ตที่ได้รับเฟรมกลับมาซึ่งจะเป็นการเปิดตัวลูป
ใน Cisco คุณสามารถเปิดใช้งานการควบคุมสตอร์มซึ่งเป็นเครื่องมือทื่อมากกว่าเดิมเนื่องจากมันจะบล็อกพอร์ตเป็นระยะเวลาหนึ่งจนกว่าสถานะจะเคลียร์ (หรือคุณเคลียร์สถานะที่ผิดพลาด) สิ่งนี้มีความเกี่ยวข้องเฉพาะเมื่อคุณใช้สวิตช์ของ Cisco ในโทโพโลยีแบบผสมของอุปกรณ์ที่ไม่ได้ขยายโครงสร้างต้นไม้หรือส่งต่อ BPDU
ไม่ต้องสงสัยเลยว่าวิธีที่เร็วที่สุดที่ฉันพบคือการตรวจสอบอัตราแพ็คเก็ต / วินาทีของอินเทอร์เฟซ อินเทอร์เฟซการแสดงอย่างรวดเร็วพร้อมตัวกรอง CLI ที่เหมาะสมจะแสดงรายการแต่ละอินเตอร์เฟสและอัตราแพ็คเก็ต / วินาที เพื่อค้นหาแหล่งที่มาของลูปค้นหาอินเทอร์เฟซเดียวที่มีอัตราการส่งข้อมูลสูงต่อแพ็คเก็ตบ้า / วินาที ภายในสภาพแวดล้อมขององค์กรทั่วไปที่มีโปรไฟล์การใช้งานทั่วไปจะทำงานได้ทุกครั้งโดยไม่ล้มเหลว ใน 6500 ที่มีอินเทอร์เฟซหลายตัวใช้เวลาไม่นานในการมองเห็นแหล่งที่มา ...
ระหว่างลูปสำหรับการรับส่งข้อมูลออกอากาศจำนวนมาก (เช่น ARP Request) ที่สถานีปลายทางอาจเพิ่มโหลดบน CPU (ตัวอย่างเช่นถ้าคุณใช้การ์ดราคาถูก 100Mbit / s realtek ที่คำนวณ checksum บน CPU) ในฐานะที่เป็นไปได้ทางกายภาพในการค้นหาลูปหากถอดสายเคเบิลลิงก์จะหายไปใน 2 พอร์ตทันที