การแก้ไขปัญหาเครือข่าย“ ช้า”


21

เราทุกคนมีข้อร้องเรียนว่า "เครือข่าย" เป็น "ช้า" ในบางจุด: อาจแปลเป็นหนึ่งห้อง (สวิตช์) หรือคอมพิวเตอร์หนึ่งเครื่องอาจเป็นเพียงอินเทอร์เน็ต (DNS ปัญหาเบราว์เซอร์?) อาจเป็นแอปพลิเคชันเดียว (การสืบค้น SQL ที่ใช้เวลานานหรือไม่การสแกน AV กำลังทำงานอยู่)

เมื่อคุณตัดปัญหาระบบและ / หรือแอปพลิเคชันที่เห็นได้ชัดออกไปคุณจะทำการทดสอบเครือข่ายเพื่อหาพฤติกรรมที่ช้าหรือผิดปกติได้อย่างไร คุณทำงานเพิ่มเลเยอร์ OSI หรือไม่ ถ้าเป็นเช่นนั้นจะตรวจสอบแต่ละเลเยอร์ได้อย่างไร คุณจะทำอย่างไรเพื่อให้แน่ใจว่าเครือข่ายทางกายภาพนั้นใช้ได้ในสภาพแวดล้อมที่ไม่รู้จัก ออกอากาศหรือพายุออกอากาศมากเกินไป ชั้นที่ 3 ขึ้นไป traceroute? เคล็ดลับวิธีการความคิดอื่น ๆ คุณสมบัติและเครื่องมือที่ต้องมี (การทำมิเรอร์พอร์ต, SNMP, การตรวจสอบและอื่น ๆ ) สำหรับเครือข่ายทุกขนาด?



1
อาจเป็นไปได้ แต่ฉันคิดว่าวิกิจะมีชีวิตยืนยาวขึ้นอีกเล็กน้อยและให้โอกาสผู้คนมากขึ้นที่จะมีส่วนร่วม
WuckaChucka

ก่อนอื่นฉันต้องมั่นใจว่ามันเป็น "อินเทอร์เน็ต"! บ่อยกว่านั้นไม่ใช่ "อินเทอร์เน็ต" lusers ที่สุดที่ผมเคยบอกว่ารับรอบ internets ลงแม้ในขณะที่พวกเขากำลังพยายามที่จะเข้าถึงไฟล์เซิร์ฟเวอร์ท้องถิ่น ..
tony Roth

2
เป็นเพราะผู้ใช้ทั้งหมดของคุณกำลังสตรีมวิดีโอฟีดของการแข่งขันฟุตบอลโลกในขณะนี้!
BillN

คำตอบ:


9

tcpdump และ wireshark เป็นเพื่อนของคุณ

ฉันพบว่าการดูแพ็กเก็ตบนเครือข่าย 'ช้า' และเครือข่าย 'ดี' มักเป็นสิ่งที่ชี้ปัญหา

มี 'ช้า' หลายประเภท

คุณสามารถติดตามเวลาในการตอบสนองต่อเว็บไซต์ท้องถิ่นและอินเทอร์เน็ตโดยใช้เครื่องมือเช่น SmokePing (SmokePing สามารถกำหนดค่าให้ติดตาม ICMP latency รวมถึง Latency Service จากบริการ TCP)

สวิตช์ของคุณควรติดตามการออกอากาศแพ็คเก็ต vs unicast แพ็กเก็ต กราฟอัตราส่วนนั้น

ฉันยังต้องการตรวจสอบ traceroutes (ตรวจสอบชื่อโดเมนของ ISP hops ระหว่างไซต์ 'สำคัญ' ของตัวเอง)

ฉันหวังว่าความคิดเห็นเหล่านี้จะช่วยได้


1
เมื่อดูแพ็คเก็ตคุณกำลังมองหาอะไรหรือ "สัญญาณบอกเล่า" ว่ามีปัญหาอะไร
WuckaChucka

3
ค้นหา TCP retransmissions จำนวนมากและ \ หรือ TCP รีเซ็ต ค้นหาเปอร์เซ็นต์การออกอากาศที่สูงเช่นกัน
joeqwerty

ยอดเยี่ยม ฉันเกือบจะใส่มันลงในคำตอบที่แยกต่างหาก
WuckaChucka

ถ้าคุณสามารถใช้ netmon 3+ จาก MS ไปที่การวิจัยของไมโครซอฟท์และดาวน์โหลดตัววิเคราะห์ tcp research.microsoft.com/en-us/downloads/ ...... มันยอดเยี่ยมมากสำหรับการแก้ไขปัญหาเครือข่าย ยังมีรุ่น 32 บิตหากจำเป็น
tony roth

+1 สำหรับ SmokePing พร้อมด้วยสิ่งต่าง ๆ เช่น IPSLA ในเราเตอร์และสวิตช์ของ Cisco สามารถช่วยให้คุณเข้าใจได้ว่ามีเครือข่ายที่ช้าหรือแอปพลิเคชันที่ช้า
Christopher Cashell

6

เป็นการยากที่จะให้คำตอบที่เฉพาะเจาะจงเนื่องจาก 90% ของงานนี้เป็นประสบการณ์ที่สอนคุณว่าจะมองหาปัญหาแบบไหนและอีก 90% รู้ว่าจะต้องดูที่ Google เพื่อรับคำแนะนำว่าจะเริ่มจากตรงไหน

ฉันมักจะลองใช้ถุงกระดาษอย่างเช่นทำให้ลูกค้าแสดงให้เห็นถึงปัญหา (ส่วนใหญ่จะแยกแยะปัญหานิ้วมือและปัญหาใด ๆ ที่ลูกค้าอาจอธิบายถึงปัญหาของเขา) จากนั้นลองทำซ้ำปัญหาบนคอมพิวเตอร์เครื่องอื่น การทำเช่นนั้นมักจะช่วยให้คุณมองเห็นสถานที่ได้อย่างชัดเจน

อย่าลืมปัญหาที่ถูกต้องของการรีบูตโดยเฉพาะอย่างยิ่งสำหรับระบบ Windows แม้กระทั่งทุกวันนี้ มันเคยเป็นเช่นนี้มากจนฉันจะถามคนว่า "คุณรีบูทแล้วหรือยังลองดูแล้วแจ้งให้เราทราบหากปัญหายังคงมีอยู่" - นี่เป็นการแก้ไขปัญหาที่ฉันถูกถามเป็นจำนวนมาก

นอกจากนี้ยังมีผลไม้แขวนลอยต่ำในปัญหาการแก้ไข DNS และการเชื่อมต่อพื้นฐาน (ACLs บนเราเตอร์, ช่องว่างอากาศในเครือข่าย, ส่ง Ping / traceroutes / mtrs ไปยังไซต์ระยะไกล ฯลฯ )

สำหรับบริการที่คุณควบคุมโดยตรงการใช้งาน nagios หรือบางอย่างเพื่อให้แน่ใจว่าบริการกำลังทำงานอยู่จริง ๆ สามารถทำให้คุณแก้ไขปัญหาได้ก่อนที่ลูกค้าจะบอกคุณเกี่ยวกับบริการเหล่านั้น คุณอาจต้องการเรียกใช้การรวบรวมสถิติไม่ว่าจะโดยตรงผ่านทางมินนินต์หรืออะไรบางอย่างหรือผ่านทาง SNMP ไปยังสิ่งที่ต้องการ Cacti

ฉันมักจะพยายามให้ Cacti ทำงานอย่างน้อยกับสวิตช์หลักและไฟร์วอลล์ทั้งหมดของฉัน ที่เป็นไปได้ฉันเรียกใช้ Cacti กับทุกสิ่งที่ฉันทำได้ ในกรณีเหล่านี้ฉันมักจะมองหาสิ่งต่าง ๆ เช่นจำนวนข้อผิดพลาดของพอร์ตหรือการรับส่งข้อมูลที่มากเกินไป กราฟไฟร์วอลล์จากอุปกรณ์บางชนิดสามารถแสดงการใช้งาน CPU และเซสชันที่ใช้งานพร้อมกัน คุณจะได้เรียนรู้ว่าอุปกรณ์ไฟร์วอลล์ของคุณมีปัญหาอะไร

ไฟร์วอลล์ของคุณอาจเข้าสู่อุปกรณ์ syslog ถ้าเป็นเช่นนั้นให้บันทึกทุกสิ่งที่คุณทำได้และมองหาคำแนะนำ สิ่งนี้จะง่ายขึ้นหากคุณเรียกใช้บางอย่างเช่น syslog-ng หรือ rsyslog หรือ splunk ที่ให้คุณแบ่งบันทึกของคุณค่อนข้างจะแทนที่จะจัดการกับไฟล์เสาหินเดียว

ฉันยังพยายามใช้ nfsen อย่างน้อยภายในไฟร์วอลล์ของฉันและอัปลิงค์ไปยังผู้ให้บริการอินเทอร์เน็ตหากเป็นไปได้ สิ่งนี้จะช่วยให้คุณย้อนเวลากลับไปดูเซสชันเพื่อดูว่าใครกำลังทำอะไรอยู่ บางครั้งสิ่งนี้สามารถจับพฤติกรรมที่น่าสนใจ


5

ต่อไปนี้เป็นเครื่องมือที่มีประโยชน์สำหรับแก้ไขปัญหาเวลาแฝงและปัญหาเครือข่ายอื่น ๆ :

  • โหมด OSIลิตร - เริ่มต้นจากด้านล่างและวิธีการทำงานของคุณ
  • ping - ตรวจสอบ RTT ของคุณ (เช่นเวลาแฝง)
  • HTTP ping - มีประโยชน์หากไฟร์วอลล์ของคุณบล็อก ICMP ปกติ
  • ping -r 9 - มีประโยชน์สำหรับการระบุสถานการณ์การเราต์แบบอสมมาตร
  • traceroute - แพ็คเก็ตของฉันจะไปที่นั่นได้อย่างไรและเราเตอร์เป็นวิธีการตอบสนองอย่างไร โปรดทราบว่าเราเตอร์มักจะประมวลผลแพ็กเก็ตเหล่านี้ในระดับความสำคัญต่ำดังนั้นประสิทธิภาพที่แท้จริงอาจดีกว่า
  • Wireshark - ใช้ความเชี่ยวชาญบางอย่าง แต่คุณไม่สามารถได้รับในระดับที่ต่ำกว่ามาก
  • SpeedGuide.net ตัววิเคราะห์ TCP / IP - ตรวจสอบการตั้งค่า TCP ของพีซี
  • SG TCP Optimizer - (Windows เท่านั้น) แนะนำวิธีเพิ่มประสิทธิภาพการตั้งค่า NIC ของคุณ
  • IP Chicken - ที่อยู่ IPของคุณคืออะไร (ไม่ใช่ของ NAT)
  • http://downforeveryoneorjustme.com/ - บางทีคุณอาจเป็น ...
  • ทดสอบความเร็วแบนด์วิดธ์ - ตรวจสอบความเร็วในการดาวน์โหลด / อัพโหลดของคุณ
  • เครื่องมือเครือข่าย - เรียกใช้เครื่องมือ / การทดสอบจากนอกเครือข่ายของคุณ
  • ตรวจสอบพอร์ตเครือข่ายของคุณเพื่อหาข้อผิดพลาด / CRC's / etc -
  • ตรวจสอบเครือข่ายของคุณสำหรับการใช้งานเกิน (ตรวจสอบแบนด์วิดธ์) และพายุออกอากาศ
  • ตรวจสอบ unicast flooding - ใช้ wireshark และตรวจสอบการรับส่งข้อมูล unicast ที่ไม่ได้กำหนดไว้สำหรับเวิร์กสเตชันของคุณ
  • ตรวจสอบว่ารูทบริดจ์ของคุณถูกวางไว้อย่างเหมาะสม

ถ้า ping -r หมดเวลามันจะพูดอะไร? ตัวอย่างเช่น a ping 8.8.8.8ทำงานได้ แต่ a ping -r 9 8.8.8.8ไม่ทำงาน
Michiel van Vaardegem

4

หากคุณใช้เครือข่ายไร้สายหนึ่งในการลดความเร็วที่พบบ่อยคือการรบกวนช่องสัญญาณ SSID จำนวนมากในพื้นที่หนึ่งสามารถชะลอการรับส่งข้อมูลเครือข่ายได้ (คิดว่า: ตัวอย่างของ iPhone 4 ที่ WWDC '10)

การแก้ไขปัญหานี้ค่อนข้างง่ายหากมีซอฟต์แวร์ที่สามารถแสดงรูปแบบการรับส่งข้อมูลแบบไร้สายในพื้นที่ มีโปรแกรมฟรีและทางเว็บที่ดีที่: http://meraki.com/tools/stumbler http://meraki.com/tools/stumbler(การเปิดเผย: ฉันทำงานให้ Meraki)

เพื่อลดสัญญาณรบกวนควรใช้ช่อง 1, 6 หรือ 11 การใช้อุปกรณ์ 802.11n ที่มีความถี่ 5GHz อาจช่วยได้เช่นกัน


1

ฉันมักจะเริ่มต้นด้วยการตรวจสอบชั้น 2 สิ่งที่ใช้Cacti ที่จะให้ข้อมูลจำนวนมากที่คุณสามารถใช้เพื่อค้นหารูปแบบและคุณสามารถเปรียบเทียบกราฟ Cacti ของคุณเมื่อทุกอย่างทำงานได้ดีเทียบกับเมื่อผู้ใช้เห็นความเชื่องช้า

มันอาจจะไม่พบปัญหาที่แน่นอน แต่มันจะช่วยให้คุณมีจุดเริ่มต้นที่ดีเพื่อช่วยให้ปัญหาแคบลง


มีอะไรเป็นพิเศษที่คุณกำลังมองหาในกราฟ Cacti?
WuckaChucka

1

ฉันเริ่มที่เราเตอร์นอกสุดและหาทางลงและวัดประสิทธิภาพด้วยวิธีดั้งเดิมที่สุด: ใช้ไซต์ทดสอบแบนด์วิดท์หรือไซต์ FTP ภายนอกที่เป็นที่รู้จักซึ่งจะให้ความเร็วในการอัพโหลด / ดาวน์โหลดของคุณ ค้นหาระดับที่ปัญหาเกิดขึ้น

เมื่อคุณทราบว่าปัญหาอยู่ที่ใดให้ปรับใช้เครื่องมือแฟนซีและจอภาพของคุณ แต่อย่าเสียเวลาทำสิ่งนั้นในทุกเลเยอร์ มันจะใช้เวลาตลอดไป


แล้วประสิทธิภาพของแอปพลิเคชันภายในนั้นเป็นอย่างไร
WuckaChucka

@wuckachucka: โดยปกติหากมีปัญหาเกี่ยวกับรหัสมันจะปรากฏขึ้นทั่วบันทึกดังนั้นการแก้ไขปัญหาไม่ได้เลวร้าย คุณยังรู้ว่าจะเริ่มต้นอย่างไร (แอปพลิเคชัน) ปัญหาที่ใหญ่ที่สุดในการแก้ไขปัญหาเครือข่ายกำลังค้นหาปัญหา หากคุณมีความเร็วพอร์ตไม่ตรงกันหรือ MTU ที่ไม่ดีหรือปัญหาทางกายภาพอื่น ๆ สิ่งเหล่านี้เป็นไอ้ที่สมบูรณ์ในการแก้ไขปัญหาผ่านบันทึกและแนวทางมนุษย์ถ้ำมีข้อดีมากมาย
Satanicpuppy

1

คุณต้องรู้เซิร์ฟเวอร์และสภาพแวดล้อมเดสก์ท็อป / ไคลเอนต์ของคุณแทนที่จะคิดว่าผู้ใช้นั้นถูกต้องเมื่อพวกเขาพูดว่า "เครือข่ายช้า" คุณจำเป็นต้องแก้ไขปัญหาอย่างเป็นระบบในแต่ละประเด็น - อย่างที่คนอื่นพูดคุณควรจะสามารถดูและทำซ้ำข้อผิดพลาดได้อย่างดีเยี่ยมจากนั้นทำงานจากที่นั่นในลักษณะที่เหมาะสมสำหรับสถานการณ์

การมีการจัดการและตรวจสอบเครือข่ายและเซิร์ฟเวอร์ที่ดีสามารถช่วยให้คุณประหยัดเวลาได้มากเนื่องจากคุณไม่ได้พยายามใช้เครื่องมือในการทำงานขณะที่ยังพยายามที่จะลดหรือแก้ไขอาการและข้อตกลงกับผู้ใช้บ่น / ลูกค้า

คำตอบสำหรับ tcpdump และ wireshark นั้นไม่ถูกต้องสิ่งเหล่านี้เป็นส่วนสำคัญของชุดเครื่องมือของคุณ แต่ถ้าคุณไม่แน่ใจว่าเป็นเครือข่ายจริง ๆ พวกเขาไม่ควรเป็นสิ่งแรกที่คุณจะเข้าถึง


0

เครือข่ายช้าเป็นปรากฏการณ์ทั่วไป ความเร็วเครือข่ายช้าอาจเกิดจากหลายสิ่ง การแก้ไขปัญหาเครือข่ายที่ช้าเป็นหนึ่งในงานที่พบบ่อยที่สุดและลำบากในการจัดการเครือข่ายรายวัน

จากการวิเคราะห์พบว่าสาเหตุหลักของเครือข่ายที่ช้าคือ:

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

เราจะทราบสาเหตุของการเกิดเครือข่ายที่ช้าได้อย่างรวดเร็วได้อย่างไร เป็นความคิดที่ดีที่จะรวบรวมและวิเคราะห์แพ็กเก็ตด้วยตัววิเคราะห์เครือข่าย (Ax3soft Unicorn, wireshark และอื่น ๆ )

คุณอ่านบทความ "ค้นหาสาเหตุของเครือข่ายช้า" คลิกไปที่ URL ( http://www.ids-sax2.com//Unicorn/Tutorials/Find-Reasons-for-Slow-Network-with-Ax3soft-Unicorn) URL .htm ) เพื่อเข้าชม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.