ทำไม HyperV VM ของฉันถึงขาดการเชื่อมต่อแบบสุ่ม?


10

ฉันมีปัญหาการเชื่อมต่อที่ผิดปกติเกิดขึ้นทุกสองสัปดาห์

การกำหนดค่าครั้งแรกของฉัน: ฉันกำลังเรียกใช้คลัสเตอร์ล้มเหลว HyperV ที่มีโฮสต์ฟิสิคัลสองโฮสต์ (node01 และ node02) โฮสต์ต่าง ๆ กำลังเรียกใช้เซิร์ฟเวอร์ Windows Server 2008 R2 HyperV (ฟรี) ด้วย SP1 บนโฮสต์เหล่านั้นฉันกำลังเรียกใช้ VM สองเครื่องแต่ละรุ่นที่ใช้ Windows Server 2008 R2 Web พร้อม SP1 เซิร์ฟเวอร์ที่เก็บข้อมูลของฉันคือ Windows Storage Server 2008 เชื่อมต่อผ่าน iSCSI ทั้งโฮสต์และเซิร์ฟเวอร์หน่วยเก็บข้อมูลกำลังเรียกใช้ไดรเวอร์เครือข่ายล่าสุดที่ดาวน์โหลดโดยตรงจากเว็บไซต์ของ Intel

นี่คือปัญหา: 99.99% ของเวลาทุกอย่างทำงานได้อย่างสมบูรณ์แบบ ประมาณทุกๆสอง - สามสัปดาห์ VMs ทั้งคู่จะสูญเสียการเชื่อมต่อเครือข่ายพร้อมกันทั้งขาเข้าและขาออก เมื่อสิ่งนี้เกิดขึ้น

  1. ฉันไม่สามารถ RDP เป็น VM ได้
  2. ฉันสามารถ RDP เป็นโฮสต์ใดก็ได้
  3. ฉันสามารถเชื่อมต่อกับ VM ได้จาก Failover Cluster Manager โดยคลิกขวาที่โหนดและเลือก 'เชื่อมต่อกับเครื่องเสมือน'
  4. เมื่อฉันเชื่อมต่อกับ VM ตามที่อธิบายไว้ใน # 3 ข้างต้นฉันไม่สามารถไปที่เว็บไซต์หรือเครื่องใด ๆ บน LAN การปิดใช้งานและเปิดใช้งานการเชื่อมต่อเครือข่ายเสมือนจริงใหม่ภายใน VM ไม่สามารถแก้ไขปัญหาได้
  5. ถ้าฉันย้าย VM ไปยังโหนดอื่นนั่นจะช่วยแก้ไขปัญหาได้ (สำหรับสองสัปดาห์ถัดไป)
  6. ถ้าฉันรีบู๊ตโฮสต์และย้าย VM กลับมาอีกครั้งนั่นเป็นการแก้ไขปัญหา (สำหรับสองสัปดาห์ถัดไป)
  7. เมื่อสิ่งนี้เกิดขึ้นคลัสเตอร์ล้มเหลวจะไม่ทำการเฟลโอเวอร์ VM โดยอัตโนมัติ
  8. ไม่มีรายการบันทึกเหตุการณ์ที่ผิดปกติในโฮสต์หรือ VM ใด ๆ

สิ่งนี้เกิดขึ้นประมาณ 5 ครั้งโดยมีอาการเดียวกับที่อธิบายไว้ข้างต้น ฉันสงสัยว่าไดรเวอร์เครือข่ายหรือปัญหาฮาร์ดแวร์เครือข่าย แต่เนื่องจากฉันใช้ไดรเวอร์ล่าสุดอยู่แล้วฉันไม่แน่ใจว่าต้องทำอย่างไร

นี่เป็นตัวขูดหัวจริง ๆ ... คิดอะไรบ้าง?

ปรับปรุง

ฉันพบเคสที่คล้ายกันมากที่นี่: Virutal Machine สูญเสียการเชื่อมต่อเครือข่ายบน Hyper V Cluster

อัปเดต 7/29/2011

หลังจากติดตั้งโปรแกรมแก้ไขด่วนและปรับปรุงไดรเวอร์เครือข่ายฉันยังคงพบปัญหาเดียวกัน เพื่อตอบสนองต่อความคิดเห็นที่ขอรายละเอียดฮาร์ดแวร์เซิร์ฟเวอร์คือ Intel SR1670HV ซึ่งเป็นแชสซี 1U ที่มีมาเธอร์บอร์ดอิสระ S5500HV สองตัว การสื่อสารผ่าน NIC ของเมนบอร์ดซึ่งเป็น Intel 82574L ไดรเวอร์เครือข่ายคือรุ่น 16.2.49.0


คุณสามารถเพิ่ม detials เกี่ยวกับฮาร์ดแวร์ของคุณ (จำนวนนิคส์)
จิม B

คุณมียี่ห้อ / รุ่นใดของ NICs ในเซิร์ฟเวอร์
Chris S

ข้อมูลเกี่ยวกับฮาร์ดแวร์และ NIC ที่เพิ่มไว้ด้านบน
Mike

คุณกำลังเชื่อมต่อสวิตช์ยี่ห้อ / รุ่นใด
ErnieTheGeek

ฉันมีปัญหาเกี่ยวกับภาพ CentOS บนเซิร์ฟเวอร์ MS hyperV คุณมี NIC เฉพาะสำหรับแต่ละเครื่องหรือ NIC ที่ใช้ร่วมกันหรือไม่ เมื่อเราเปลี่ยนเป็นนิคส์เฉพาะปัญหานี้ก็หายไป ... นั่นไม่ใช่การแก้ไขที่แท้จริงแม้ว่า ...
n8whnp

คำตอบ:


7

เราเคยมีปัญหาเช่นนี้ที่ฉันอยู่ ฉันจำรายละเอียดไม่ถูกต้อง แต่โซลูชันสุดท้ายเกี่ยวข้องกับที่อยู่ Mac ที่ขัดแย้งกันซึ่งกำหนดให้กับอะแดปเตอร์เครือข่ายเสมือนแบบไดนามิก การตรึงคนเหล่านั้นไว้กับพวกเขาไม่ใช่พลังช่วยอะไรมากมาย ตามปกติคุณไม่ต้องการทำเช่นนั้นเพราะจะทำให้การย้ายเครื่องเสมือนไปยังโฮสต์อื่นยากขึ้น แต่มันก็ช่วยเราในกรณีนี้

อีกส่วนหนึ่งคือว่าฟิสิคัลนิคส์ทำโดย Broadcom และเรายังมีข้อผิดพลาดในการกำหนดค่าที่ผู้ดูแลระบบคนก่อนหน้านี้พยายามใช้ยูทิลิตี้ Broadcom อย่างไม่ถูกต้องเพื่อเก็บสองนิคส์ไว้บนโฮสต์ เราลบการตั้งค่านั้นและกำหนดค่าหนึ่งใน nics ดังนั้นจึงไม่มี IP เลยบนเครื่องโฮสต์ แต่ยังสามารถใช้สำหรับส่งผ่านไปยังผู้เยี่ยมชมเสมือน จากนั้นเราตั้งค่าเครื่องเสมือนแต่ละเครื่องให้ใช้เพียงหนึ่งนิคหรืออย่างอื่นเท่านั้นซึ่งจะทำให้สมดุลของโหลดตามการรับส่งข้อมูลในอดีต แน่นอนว่าไม่มีการล้มเหลวหากอะแดปเตอร์หรือการเชื่อมต่อล่มและเรายังไม่ได้ทำตามอย่างดีเพื่อดูว่าการจราจรยังคงมีความสมดุลอยู่ตลอดเวลาหรือไม่ แต่มันมั่นคงมากตั้งแต่นั้นมา


5

ฉันรู้ว่านี่เป็นคำถามเก่า แต่ฉันพบปัญหาเดียวกันและเสียเวลามากในการแก้ปัญหาที่ฉันคิดว่าฉันจะแบ่งปันโซลูชันที่เหมาะกับฉัน ฉันพบวิธีแก้ปัญหาของฉันที่นี่:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

ทางออกในสถานการณ์ของฉันคือการปิดการใช้งาน TCP Offloading บน VMs ฉันจะอ้างอิงส่วนที่เกี่ยวข้องจากลิงค์:

เพื่อปิดการใช้งาน TCP Offloading ฉันต้องสร้างและตั้งค่ารีจิสทรีใหม่ในแต่ละ VM ที่เชื่อมต่อกับ Broadcom 8507 Nextreme II NIC

ฉันใช้การเปลี่ยนแปลงรีจิสทรีต่อไปนี้เพื่อปิดใช้งาน TCP Offloading:

รหัส: HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

ค่า (DWORD): DisableTaskOffload = 1

หลังจากปิดการใช้งาน TCP offload ใน VM แต่ละครั้งปัญหานี้หมดไปและฉันสามารถเชื่อมต่อ VM หลายเครื่องกับพอร์ต NIC หนึ่งพอร์ตของ Broadcom 5708 Nextreme II NIC

เซิร์ฟเวอร์ของฉันมีBroadcom NetExtremeNIC ดังนั้นสำหรับฉันสาเหตุของปัญหานี้เกี่ยวข้องกับไดรเวอร์อย่างแน่นอน แต่การตั้งค่าDisableTaskOffload= 1 แก้ไขปัญหาให้ฉันได้อย่างสมบูรณ์ หวังว่าข้อมูลนี้จะช่วยประหยัดเวลาในการค้นหาของคนอื่น!


1
+1 ขอบคุณสำหรับเคล็ดลับนี้ฉันใช้งานมาสองสามวันโดยไม่มีปัญหา
m0dest0

1
ไม่มีปัญหา m0dest0 ดีใจที่ได้ยินว่ามันช่วยคุณ :)
BruceHill

3

ฉันพบสิ่งที่คล้ายกันในสภาพแวดล้อม Hyper-V ที่ง่ายกว่ามากและวิ่งข้ามบทความนี้ที่ Microsoft ดูเหมือนว่าจะเหมาะสมกับสถานการณ์ของคุณหากมีการใช้เว็บเซิร์ฟเวอร์เป็นอย่างมาก

http://support.microsoft.com/kb/974909 - การเชื่อมต่อเครือข่ายของเครื่องเสมือน Hyper-V ที่ทำงานอยู่จะสูญหายไปภายใต้ปริมาณการใช้งานเครือข่ายขาออกอย่างมากบนคอมพิวเตอร์ที่ใช้ Windows Server 2008 R2


บทความ KB ที่คุณอ้างอิงคือ pre-SP1 แต่ฉันได้ทำการติดตั้ง post-SP1 ที่คล้ายกันซึ่งดูมีแนวโน้ม: support.microsoft.com/kb/2263829
Mike

1
ฉันลบสิ่งนี้เป็นคำตอบเพราะฉันติดตั้งโปรแกรมแก้ไขด่วน แต่ปัญหายังคงเกิดขึ้น ดังนั้นคำถามนี้ยังคงไม่ได้รับคำตอบ ...
Mike

2

เรามีปัญหาเดียวกันนี้ แต่ในกรณีของเรามันคือทุก ๆ 24-48 ชั่วโมง ฉันจะตรวจสอบอีกครั้งว่าผลิตภัณฑ์ป้องกันไวรัส / ไฟร์วอลล์สนับสนุน spcefically Server 2008 ด้วย Hyper-V ถ้าไม่ลองใช้วิธีอื่น (หรือลบออกชั่วคราวถ้าทำได้) ผลิตภัณฑ์ป้องกันไวรัส / ไฟร์วอลล์ของคุณเป็นการทดสอบเพื่อดูว่าปัญหาหายไปหรือไม่ .

หลังจากการโทรไปยัง Microsoft และอัพโหลดไฟล์ / ดัมพ์ / ล็อกจำนวนมากในภายหลังพวกเขาระบุว่า TrendMicro OfficeScan เป็นผู้ร้ายในกรณีของเรา เรากำลังใช้รุ่นที่ไม่สนับสนุน Hyper-V อย่างชัดเจนเมื่อเราอัปเกรดเป็นรุ่นล่าสุดปัญหาก็หายไป


2

สิ่งนี้กลายเป็นปัญหาฮาร์ดแวร์ - ฉันแยกปัญหากับสวิตช์จัดการของ Netgear GSM7224v2 แทนที่มันด้วย D-Link DGS-1024D และทุกอย่างทำงานได้ดีนับตั้งแต่

ในฐานะที่เป็น "บทเรียนที่เรียนรู้" ในกรณีนี้ฉันอาจใช้เวลา 99% ของการตั้งค่าซอฟต์แวร์แก้ไขปัญหาความพยายามในการวินิจฉัยของฉันสำหรับสิ่งที่กลายเป็นปัญหาฮาร์ดแวร์ ฉันยังจ่ายเงินให้ Microsoft Support $ 259 (และใช้เวลากับพวกเขาทางโทรศัพท์เป็นจำนวนมาก) เพื่อช่วยฉันคิดออกโดยใช้การตั้งค่าซอฟต์แวร์ ฉันเดาว่าคุณธรรมของเรื่องนี้คือการสงสัยฮาร์ดแวร์ของคุณมากเท่ากับซอฟต์แวร์ของคุณ


1

บนคุณสมบัติอะแดปเตอร์เครือข่ายสำหรับผู้เยี่ยมชม VM คุณได้ปิดใช้งาน Jumbo Packets และ Large Send Offload หรือไม่ จากประสบการณ์ของฉันกับการตั้งค่าเหล่านี้ฉันจะลองแน่นอน


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.