การหยุดชะงักทางอินเทอร์เน็ตที่ผิดปกติ: บางภาพและ JS ไม่โหลด


11

ครั้งแรกใน ServerFault และฉันมีปริศนาเล็ก ๆ น้อย ๆ ที่ดี

เมื่อไม่กี่เดือนที่ผ่านมาเรามีปัญหากับการเชื่อมต่ออินเทอร์เน็ตของเรา

สิ่งแวดล้อม:

Servers: 2 Terminal Servers as an RDSFarm running Windows Server 2008 R2
Browser: Internet Explorer 9
Test/debug browser: Chrome
AntiVirus: Avast 7.0.1455

ปัญหา:

ในช่วงเวลาที่ผิดปกติเว็บไซต์ปฏิเสธที่จะโหลดให้ข้อผิดพลาดว่าหน้าไม่สามารถเข้าถึงได้หรือภาพบางภาพไม่โหลดอย่างสมบูรณ์ นอกจากนี้หลังจากตรวจสอบไฟล์. js ของเซิร์ฟเวอร์ไม่สามารถโหลดได้

ป้อนคำอธิบายรูปภาพที่นี่

การค้นพบ & สิ่งที่เราพยายาม:

ความประทับใจแรก:

เมื่อฉันใช้ Chrome ในช่วงเวลานั้นไซต์จะส่งคืน net :: Error 101 หรือ Error 103 หลังจากรีเฟรชบางอย่าง ในบางครั้งหากไม่ได้เกิดข้อผิดพลาดภาพหลายภาพจะไม่สามารถมองเห็นได้และแสดงภาพ X IE เพิ่งบอกว่าหน้าไม่สามารถแสดงได้

ป้อนคำอธิบายรูปภาพที่นี่

การใช้เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ Chrome:

มันแสดงให้เห็นในคอนโซลว่าทรัพยากรหลายอย่างไม่พร้อมใช้งาน แต่เมื่อฉันคลิกขวาที่ภาพหายไปและเลือก "แสดงภาพ" พวกเขาจะแสดง เมื่อฉันเปิดภาพผ่าน URL โดยตรงพวกเขาก็จะแสดง

ป้อนคำอธิบายรูปภาพที่นี่

การตรวจสอบผ่านเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ Chrome:

ฉันรันการตรวจสอบบนหน้าเว็บเมื่ออยู่ในสถานะ buggy และพบว่าไฟล์. js บางไฟล์ไม่ได้โหลดพร้อมกับไฟล์. png, .jpg และ. gif บางไฟล์ โหลดภาพที่แตกต่างกันสำหรับ Chrome และ IE

ป้อนคำอธิบายรูปภาพที่นี่ ป้อนคำอธิบายรูปภาพที่นี่

ไฟล์ JS และ Avast ที่สับสน:

หลังจากตรวจสอบแล้วฉันพบว่าไฟล์. js ส่วนใหญ่เป็นไฟล์ JS ที่ทำให้สับสนและเนื่องจากเรากำลังใช้งาน Avast 7.0.1455 ฉันสงสัยว่า Web Shield ไม่ได้ยุ่ง

จากนั้นอีกครั้งมันเกิดขึ้นเฉพาะใน TS แรกไม่ใช่วินาที

ดังนั้นฉันจึงปิด WebShield เป็นเวลาหนึ่งวันและดูว่ามีอะไรดีขึ้นบ้าง มันไม่ได้ กลับไปที่ตารางหนึ่ง

ไม่มีการหมดอายุของไฟล์:

ไฟล์เหล่านั้นหลายไฟล์ที่ไม่ได้โหลดถูกระบุว่าไม่มีการหมดอายุของแคช

เก็บเอาไว้:

หนึ่งใน Sysadmins ของเราเปลี่ยนขนาดแคช IE เป็น 10MB ในขณะที่ย้อนกลับไปซึ่งฉันคิดว่าอาจเป็นสาเหตุของปัญหา เขาเปลี่ยนกลับเป็น 65MB หรือมากกว่านั้น แต่คนก็ยังมีปัญหากับภาพของพวกเขา มันยังคงเกิดขึ้นใน 1 TS และใน Chrome ดังนั้นฉันไม่คิดว่านโยบายกลุ่มที่กำหนดว่าแคชจะมีผลกับ Chrome ใช่หรือไม่

ป้อนคำอธิบายรูปภาพที่นี่

ปัญหาเครือข่าย: ฉันยังคิดว่าอาจเป็นปัญหาเครือข่ายหรือการกำหนดเส้นทาง แต่ทั้งเซิร์ฟเวอร์ TS อยู่ใน NIC แบบทีมเดียวกันและอีกอันทำงานได้ดี

ช่วยด้วย!

หากใครมีเคล็ดลับในการค้นหาปัญหาหรือต้องการข้อมูลเพิ่มเติมโปรดช่วยฉันออก สิ่งนี้รบกวนฉันมาหลายสัปดาห์แล้ว

แก้ไขและอัปเดต

ปัญหายังคงมีอยู่และเฉพาะในเซิร์ฟเวอร์เทอร์มินัล 2 เครื่องของเรา

นี่คือสิ่งที่ฉันและเพื่อนร่วมงานทำมาจนถึงตอนนี้:

  • ปิด Antivirus เป็นเวลาหนึ่งวันในเซิร์ฟเวอร์เดียวเพื่อดูว่าไม่เกิดขึ้นหรือไม่ ปัญหายังคงเกิดขึ้น

  • ตรวจสอบขนาด MTU
    เป็นการตั้งค่าเริ่มต้น (ลืมค่าที่แน่นอน: P) ปัญหายังคงเกิดขึ้น

  • ติดตั้ง Windows Updates แล้ว ปัญหาIE10ยังคงเกิดขึ้น

  • ตรวจสอบว่ามีพร็อกซี่ใด ๆ
    AV ทำให้พร็อกซีเป็น WebShield ที่เรียกว่า เราปิดใช้งานบริการและโปรแกรมบนเซิร์ฟเวอร์หนึ่งเครื่องเป็นเวลาหนึ่งวัน ปัญหายังคงเกิดขึ้น

  • ติดตั้งทีม NIC ใหม่เมื่อมันเกิดความสับสน (ติดตั้งไดรเวอร์ NIC อีกครั้ง)ปัญหายังคงเกิดขึ้น

  • นโยบายกลุ่มที่ตรวจสอบแล้ว เห็นได้ชัดทั้งใน Terminal Server มี Local Machine Policy ที่เปิดใช้งานโหมด Preference ใน IE ซึ่งมีการปรับแต่งแปลก ๆ ปิดการใช้งานนั้นและ ...ปัญหายังคงเกิดขึ้น

ตอนนี้มันหายไปแล้วเนื่องจากผู้คนมีปัญหาในการอัปโหลดและดาวน์โหลดไฟล์จาก SharePoint และเว็บไซต์จำนวนมากที่เราใช้ไม่ทำงานเนื่องจากสิ่งนี้

ลางสังหรณ์

เป็นไปได้ที่ WebShield จะหยุดการเชื่อมต่อเมื่อพบสิ่งแปลกประหลาด แต่ก็ไม่ควรเกิดขึ้นเมื่อปิด AV

อาจเป็นไปได้ว่าการเปลี่ยนเส้นทางมีความยุ่งเหยิงอย่างใดอย่างหนึ่งหรือมีบางอย่างเกี่ยวกับแคช แปลก แต่ที่เกิดปัญหาเดียวกันใน Chrome เช่นเดียวกับ IE9 และ IE10

หากใครมีความคิดใด ๆ มันก็จะได้รับการชื่นชมอย่างมาก

ขอบคุณไปที่ HopelessN00b ที่ช่วยฉันออกไป!

UPDATE:

เราได้รับข้อผิดพลาดบางอย่างใน Event Viewer เช่นนี้ใน TS ดั้งเดิมของเรา:

Error: (04/04/2013 08:44:42 AM) (Source: Application Error) (User: )
Description: Faulting application name: iexplore.exe, version: 9.0.8112.16470, time stamp: 0x510c8801
Faulting module name: MSHTML.dll, version: 9.0.8112.16470, time stamp: 0x510c9046
Exception code: 0xc0000005
Fault offset: 0x002d0174
Faulting process id: 0x21728
Faulting application start time: 0xiexplore.exe0
Faulting application path: iexplore.exe1
Faulting module path: iexplore.exe2
Report Id: iexplore.exe3

และบางครั้งสิ่งนี้ก็ปรากฏขึ้น แต่เห็นได้ชัดว่าเป็นเพราะเทอร์มินัล WYSE บางอันเก่าเกินไป (แทนที่พวกมันด้วย Raspberry Pi ในไม่ช้าหวังว่า)

Error: (04/04/2013 11:21:46 AM) (Source: TermDD) (User: )
Description: The Terminal Server security layer detected an error in the protocol stream and has disconnected the client.
Client IP: [IP REDACTED].

หวังว่านี่จะช่วยได้


1
มันทำให้ฉันนึกถึงปัญหาที่เราเห็นจากมุมมองที่แตกต่างอย่างสิ้นเชิงโดยพื้นฐานแล้วมันเกี่ยวข้องกับการกำหนดค่า MTU บางส่วนของการห่อหุ้มแพ็กเก็ตไม่ได้ถูกนำมาพิจารณาประกอบ แพ็คเก็ตจะไม่โหลด .. ถ้าหน้านั้นเป็น https จะไม่มีอะไรโหลดเลย
NickW

1
ไม่มีปัญหาฉันลองและเรียกใช้งานที่ใดที่หนึ่งระหว่าง TS และเครื่องที่มีปัญหา บางทีคนในเครือข่ายของคุณสามารถมิเรอร์พอร์ตที่ TS เชื่อมต่ออยู่ (หรือเครื่องที่คุณกำลังทดสอบอยู่) ดังนั้นคุณสามารถติดเครื่องด้วย wireshark ที่นั่นเพื่อดูทราฟฟิก
NickW

1
ใช่นั่นไม่น่าจะทำให้เกิดปัญหามากนัก
NickW

1
BTW คุณได้ดูสิ่งนี้ถูกต้องแล้ว: community.spiceworks.com/topic/
......

4
มีสองสิ่งที่ฉันจะลองเมื่อสิ่งนี้เกิดขึ้น หากเป็นเพียงโดเมนและ JS ให้ตรวจสอบเส้นทางไปยังเซิร์ฟเวอร์ที่อยู่ในนั้น (การวางเส้นทางค่อนข้างดีที่นั่น) - เนื่องจากหากมีเพียงองค์ประกอบบางอย่างเท่านั้นมูลค่าการใช้งานจึงเป็นสิ่งที่พบได้ทั่วไปและสาเหตุที่ล้มเหลว นอกจากนี้ยังมีโอกาสเล็กน้อยที่ ISP จะตั้งค่าผิดพลาด - ISP ในบ้านของฉันทำสิ่งนี้และมันก็เป็นความเจ็บปวดที่สุดในตูดที่จะตามมาและได้รับการแก้ไขโดยสุ่มในวันเดียว
Journeyman Geek

คำตอบ:


0

ลองโดยไม่ต้องผูก NICs ติดตั้งเพียงหนึ่ง NIC และดูว่ายังมีสิ่งใดบ้างไหม ในกรณีที่ตรวจสอบให้แน่ใจว่าการกำหนดค่าพอร์ตสวิทช์ของคุณและการกำหนดค่า Teaming เป็นแถว


ดูเหมือนว่าฉันเช่นนี้ควรเป็นความคิดเห็นมากกว่าคำตอบ ความคิดที่ดีแม้ว่า ฉันเคยเห็นสาเหตุของทีม NIC ผิดพลาดหลายเรื่องแปลกในเวลาของฉัน
HopelessN00b

เมื่อติดตั้งทีม NIC ใหม่เราพยายามเรียกใช้โดยไม่มีทีมโดยใช้เพียง NIC เดียว ไม่ทำงานเช่นกัน
blaa

0

หากต้องการวินิจฉัยปัญหาโดยไม่มีข้อความแสดงข้อผิดพลาดที่ถูกต้องคุณต้องเรียกใช้:

  • tcpdump ที่ฝั่งไคลเอ็นต์ (wireshark มีจอแสดงผลที่ดี)
  • tcpdump ที่ฝั่งเซิร์ฟเวอร์ (ดูสิ่งที่เซิร์ฟเวอร์กำลังส่ง)
  • รอให้ปัญหาเกิดขึ้น
  • ตรวจสอบแพ็กเก็ตและดูว่าการสื่อสารหยุดลงที่ใด หากคุณต้องการความช่วยเหลือในการตรวจสอบร่องรอยให้เขียนลงไฟล์

ฉันสงสัยว่าคุณจะพบคำค้นหา DNS ที่ยังไม่ได้ตอบ หาก ISP ของคุณกรองการรับส่งข้อมูลของคุณผ่านพร็อกซีคุณควรจะพบร่องรอยของมันในทราฟฟิกโดยเฉพาะอย่างยิ่งเมื่อเปรียบเทียบการจับด้านฝั่งเซิร์ฟเวอร์กับการจับด้านฝั่งไคลเอ็นต์

หากมีปัญหาคุณภาพเครือข่ายคุณอาจสังเกตได้อย่างตรงไปตรงมากับ traceroute หากดัมพ์เครือข่ายแสดงว่าการสื่อสารเป็นไปอย่างราบรื่น แต่เบราว์เซอร์ไม่สามารถแสดงข้อมูลที่ระบุได้แสดงว่าปัญหาของคุณคือเดสก์ท็อป funnies บนเซิร์ฟเวอร์เทอร์มินัล

คุณควรเรียกใช้การจับแพ็คเก็ตบนเซิร์ฟเวอร์เทอร์มินัลที่ทำให้การเชื่อมต่อเบราว์เซอร์ที่ไม่ทำงาน


0

ISP ได้รับการ "แก้ปัญหา" แล้ว รูปภาพและ JS และรูปภาพเหล่านี้ทั้งหมดจะปรากฏขึ้นตามปกติในสัปดาห์นี้ ISP ภายนอกไซต์หนึ่งไม่สามารถเข้าถึงได้รับการแก้ไขโดยการวาง proxy ระหว่างไซต์ทั้งหมด

โชคไม่ดีที่เหตุผลที่แน่ชัดว่าทำไมหรืออย่างไรสิ่งนี้เกิดขึ้นยังคงเป็นปริศนา แต่การพนันที่ปลอดภัยมีบางสิ่งที่ ISP ของฉันเปลี่ยนไป

ขอบคุณทุกคนที่ให้การสนับสนุนและแม้ว่าคำตอบจะมีประโยชน์มาก แต่ฉันก็ไม่สามารถเลือกหนึ่งในนั้นให้ถูกต้องได้ด้วยตัวเอง

ขอขอบคุณอีกครั้งสำหรับเวลาและความพยายามทั้งหมดของคุณและฉันหวังว่าจะไม่มีใครสามารถรับมือกับเครือข่ายที่แปลกประหลาดนี้ได้


1
ฉันหวังว่าจะได้เห็นอะไรแบบนี้สักวันหนึ่ง!
NickW
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.