ตรวจสอบฮาร์ดแวร์ DELL บนเซิร์ฟเวอร์ VMware ESXi 5.5


11

แม้จะมีการค้นคว้าหัวข้อนี้ค่อนข้างออนไลน์ (จะยุติธรรมฉันไม่ได้ดูแลระบบเต็มเวลา) ฉันไม่สามารถคิดออก

เรามีเซิร์ฟเวอร์ VMWare ESXi 5.5 จำนวนหนึ่งซึ่งบางส่วนได้รับการรวมเข้ากับ vSphere ซึ่งบางส่วนไม่ได้เป็น (สำหรับเหตุผลด้านต้นทุน)

พวกเขาทั้งหมดเรียกใช้อิมเมจ ESXi มาตรฐานยกเว้นเครื่องเดียวซึ่งจริงๆแล้วรันอิมเมจของ DELL VMWare ESXi

สิ่งที่ฉันต้องการทำให้สำเร็จดูเหมือนง่าย: กำหนดค่าระบบเพื่อให้สามารถสอบถามผ่าน SNMP จากโฮสต์ระยะไกลไม่ว่าจะเป็น snmpwalk, Nagios, PRTG เป็นต้นฉันต้องการดูข้อมูลจากเซ็นเซอร์อุณหภูมิดิสก์ที่ติดตั้งและสถานะของพวกเขา ความเร็วพัดลมสถานะ PSU ฯลฯ

ฉันรู้สึกว่าการติดตั้งรุ่น VMWare จาก DELL จะเปิดใช้งานโมดูลที่จำเป็นโดยอัตโนมัติ (OpenManage สำคัญที่สุด) แต่ดูเหมือนว่าไม่ใช่กรณีนี้

ฉันมีข้อมูลที่ขัดแย้งกันไม่ว่าจะเป็นไปได้หรือไม่เอกสารบางอย่างบอกว่าคุณไม่สามารถสืบค้นเซิร์ฟเวอร์ DELL VMware WXX ผ่าน SNMP และคุณต้องใช้ไคลเอนต์ CIM จากนั้นจะมี OMSA VIBs หนึ่งสามารถติดตั้ง ฯลฯ

ฉันคิดว่านี่เป็นข้อกำหนดที่พบได้ทั่วไป แต่เอกสารที่มีอยู่นั้นสามารถดึงได้ในทุกทิศทาง

ฉันกำลังพยายามทำสิ่งที่เป็นไปได้ (โดยไม่มีสภาพแวดล้อม vSphere สมบูรณ์) เป็นไปได้หรือไม่


ด้วย OMSA เซิร์ฟเวอร์ dell ของเราจะตอบสถานะขั้นสูงให้กับเครื่องมือภายในของเรานั่นคือ snmp
yagmoth555

และพวกเขากำลังเรียกใช้ VMWare ESXi หรือไม่ คุณสามารถบอกฉันว่าคุณติดตั้งอะไร
ลัคกี้ลุค

1
คุณต้องทำให้ OSMA ทำงานได้ มันเป็นสองไฟล์ที่จะติดตั้ง แต่ฉันลืมชื่อ เว็บเพจบนพอร์ต 1311 จะทำงานเมื่อ addon ของคุณถูกติดตั้งอย่างถูกต้อง
yagmoth555

1
ตลกที่คุณพูดว่า โมเดลที่ฉันต้องทดสอบไม่ใช่ฮาร์ดแวร์ชิ้นใหม่ล่าสุดอย่างแน่นอนคือ PowerEdge 2970 และอย่างน้อย 3-4 ปี
ลัคกี้ลุค

1
ฉันไปที่หน้าดาวน์โหลดของ Dell สำหรับ ESXi 6.0 ที่กำหนดเอง ( dell.com/support/home/us/en/19/Drivers/ … ) และแน่นอนเซิร์ฟเวอร์ใหม่ของฉัน แต่ "ระดับรายการ" ไม่อยู่ในรายการภายใต้ "ระบบที่เข้ากันได้" "
Steve Bonds

คำตอบ:


5

ใช่คุณสามารถตรวจสอบโฮสต์ ESXi แบบสแตนด์อโลนโดยใช้ซอฟต์แวร์ตรวจสอบ SNMP ใด ๆ แต่บางรายการอาจมองเห็นได้โดยใช้เครื่องมือตรวจสอบที่รองรับโปรโตคอล CIM

ESXi Host ทั้งหมดของฉันเป็นส่วนหนึ่งของ vCenter แต่เราตรวจสอบโดยตรง (ใช้ที่อยู่ IP โฮสต์ vmkernal) ด้วย SolarWinds NPM มีโมดูล CIM 5 หรือ 6 ตัวที่สร้างขึ้นใน ESXi 5.5 ที่ให้ความสมบูรณ์ของฮาร์ดแวร์แก่คุณ แต่ความแข็งแรงของการ์ด RAID ไม่ได้เป็นหนึ่งในนั้น คุณจะต้องเพิ่ม Dell OMSA VIB ที่เพิ่มเอเจนต์ CIM เพิ่มเติมรวมถึงอันสำหรับอาร์เรย์ RAID โพสต์ของ Brian Atkinson ยังคงเป็นสิ่งที่ดีที่สุดที่ฉันได้พบซึ่งอธิบายถึงกระบวนการ

https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi

คุณจะต้องทำตามคำแนะนำสำหรับการติดตั้ง OMSA ESXi VIB หากคุณจะใช้เครื่องมือตรวจสอบบุคคลที่สามที่ให้ข้อมูลในอดีตและทำการแจ้งเตือน หากคุณต้องการใช้เซิร์ฟเวอร์ Dell OMSA คุณสามารถติดตั้งเซิร์ฟเวอร์จากระยะไกลบนเซิร์ฟเวอร์กระดูกเปล่าได้จากระยะไกลใน VM หรือภายในเครื่องเป็น VM

คุณสามารถใช้เซิร์ฟเวอร์ OMSA เพื่อเชื่อมต่อกับการ์ดจัดการ DRAC และ iDRAC Out of Band (OOB / IPMI / iLo) หรือไปยังโฮสต์ ESXi หลังจากที่คุณติดตั้ง OMSA VIB บนโฮสต์ ESXi คุณจะไม่เห็นข้อมูล RAID Health ใน DRAC หรือ iDRAC - เฉพาะเมื่อเชื่อมต่อเซิร์ฟเวอร์ OMSA กับโฮสต์ ESXi - ฉันทำซ้ำคำหลักเซิร์ฟเวอร์ดังนั้นจึงไม่มีความสับสนระหว่างเซิร์ฟเวอร์ซึ่งทำหน้าที่เป็นไคลเอนต์กับ OMSA VIB ที่ ถูกติดตั้งบน ESXi Host

ทรัพยากรที่มีประโยชน์:

แสดงผู้ให้บริการ CIM ปัจจุบันบนโฮสต์ ESXi https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715

แสดง VIB ที่ติดตั้งในปัจจุบันบน ESXi Host จาก CLI ของโฮสต์ esxcli software vib list

คุณเห็นรายละเอียดความสมบูรณ์ของฮาร์ดแวร์เพิ่มเติมเล็กน้อยเมื่อคุณเชื่อมต่อกับเซิร์ฟเวอร์ vCenter กับโฮสต์ ESXi โดยตรง แต่โดยทั่วไปถ้าคุณไม่เห็นสถานะฮาร์ดแวร์ที่คุณกำลังมองหาในพาเนลการกำหนดค่า / สถานะสุขภาพแสดงว่าคุณไม่มีผู้ให้บริการ CIM และ คุณต้องค้นหาและติดตั้ง VIB บนโฮสต์ ESXi เมื่อคุณเพิ่ม Dell OMSA VIB ไปยัง ESXi Host คุณจะเห็นเซ็นเซอร์หน่วยเก็บข้อมูลที่เพิ่มในหน้าสถานะสุขภาพซึ่งแสดงปริมาณโวลุ่ม RAID, ไดรฟ์, ตัวควบคุมและความแข็งแรงของแบตเตอรี่สำหรับตัวควบคุมพื้นที่เก็บข้อมูลของคุณ คุณอาจต้องรีเซ็ตเซ็นเซอร์เพื่อให้ปรากฏขึ้นและบางครั้งใช้เวลา 15 ถึง 20 นาทีในครั้งแรกหลังจากการติดตั้ง VIB และรีบูตโฮสต์ ESXi

หากคุณไม่เห็นเซ็นเซอร์ในหน้าสถานะสุขภาพของโฮสต์ ESXi เมื่อคุณเชื่อมต่อกับไคลเอนต์ vSphere คุณมักจะไม่เห็นเซ็นเซอร์เมื่อคุณทำการสำรวจเซ็นเซอร์ด้วยซอฟต์แวร์ตรวจสอบระยะไกล

นอกจากนี้คุณควรทราบว่าเซิร์ฟเวอร์ทั้งหมดไม่มีเซ็นเซอร์ตัวเดียวกันและคุณอาจไม่สามารถรับสถานะสุขภาพที่เหมือนกันจากทั้งหมดขึ้นอยู่กับฮาร์ดแวร์ของเซิร์ฟเวอร์การ์ด RAID และรุ่น CIM ที่มีให้สำหรับชุดค่าผสม คุณอาจต้องอัพเกรดหรือเปลี่ยน VIB สำหรับการ์ด RAID เพื่อให้สถานะสุขภาพทำงานได้ ผู้ให้บริการ CIM (ซึ่งเป็น OMSA VIB ในกรณีนี้) พูดคุยกับฮาร์ดแวร์ผ่านอุปกรณ์ VIB (ไดรเวอร์อุปกรณ์จริง) และส่งผ่านข้อมูลนี้ไปยัง CIM Broker บนโฮสต์ ESXi - หรือที่รู้จักในชื่อ Small Footprint CIM Broker Daemon ( sfcbd) เมื่อคุณสำรวจความคิดเห็น ESXi Host เพื่อตรวจสอบสถานะฮาร์ดแวร์ด้วยซอฟต์แวร์การตรวจสอบที่มีประสิทธิภาพมันจะได้รับข้อมูลบางอย่างจากการสอบถาม SNMP บางคนใช้ CIM และบางคนใช้ ESXi API (ซึ่งเป็นคำขอ SOAP) ไคลเอนต์ CIM พูดคุยกับกระบวนการ sfcbd บนโฮสต์ ESXi

บางครั้งกระบวนการ CIM ก็หยุดทำงาน เมื่อสิ่งนี้เกิดขึ้นคุณจะเริ่มต้นกระบวนการ sfcbd-watchdog ใหม่บนโฮสต์ ESXi สิ่งนี้จะรีสตาร์ทเซอร์วิส sfcbd และ CIM polling จะทำงานอีกครั้ง จาก CLI ของโฮสต์/etc/init.d/sfcbd-watchdog restart

ฉันคิดว่าครอบคลุมรายการส่วนใหญ่ที่คุณต้องการเพื่อให้คุณใช้งานได้


หลังจากติดตั้ง DELL VIB ฉันเห็นข้อมูล HW บางอย่างในไคลเอนต์ vSphere เมื่อเชื่อมต่อจากระยะไกลยอดเยี่ยม น่าเสียดายที่มันไม่ได้ให้ข้อมูลผ่าน SNMP ด้วยเหตุผลบางอย่างฉันสงสัยว่ามันเป็นไปไม่ได้และฉันจะต้องเปลี่ยนกลับไปใช้ CIM
ลัคกี้ลุค

4

ฉันเข้าใจสิ่งที่คุณกำลังมองหา หมายเหตุเฉพาะเกี่ยวกับวิธีการจัดการและตรวจสอบสภาพของโฮสต์ VMware ESXi แบบสแตนด์อโลน

ในทางปฏิบัติวิธีการควรแตกต่างกันเล็กน้อย ฉันจะอธิบายวิธีจัดการโฮสต์

ในสถานการณ์ที่คุณมีโฮสต์ ESXi หลายแห่งภายใต้การจัดการ vCenter สมมติฐานคือคุณใช้ประโยชน์จาก vCenter สำหรับการตรวจสอบและสถานะสุขภาพเมื่อเทียบกับการสอบถามโฮสต์แต่ละรายการ มีสัญญาณเตือนทั้งหมดที่ฉันกำหนดค่าใน vCenter เพื่อแจ้งเตือนเกี่ยวกับ "สุขภาพฮาร์ดแวร์ของโฮสต์" ฉันมักจะไม่สนใจว่ามันเป็นแหล่งจ่ายไฟ, RAM, ดิสก์หรือส่วนประกอบอื่น ๆ แต่โฮสต์ที่ไม่แข็งแรง

การตรวจสอบโฮสต์ ESXi แบบสแตนด์อโลนจะไม่เป็นประโยชน์อย่างมากเนื่องจากจุดของไดรเวอร์ Dell / HP คือการเปิดเผยข้อมูลไปยัง vCenter และฉันไม่เชื่อว่าเป็นวิธีที่ดีที่สุดในการค้นหาโฮสต์แต่ละคนในลักษณะนี้ จริงอยู่นั่นเป็นเพราะคุณต้องการให้โฮสต์ VM ของคุณจัดการจากส่วนกลาง

หากคุณเรียกใช้ vCenter ด้วยโฮสต์เดียวคุณจะได้รับความสามารถนี้ดังนั้นอาจเป็นตัวเลือกสำหรับสภาพแวดล้อมของคุณ

หากคุณต้องการการตรวจสอบนอกวงคุณไม่สามารถค้นหา DRAC แทนได้หรือไม่


ขอบคุณ เรามี vCenter แต่ไม่ใช่สำหรับโฮสต์ทั้งหมด การออกใบอนุญาตของ VMWare นั้นค่อนข้างแปลกและมีราคาแพงมาก (ฉันบอก) เมื่อคุณมีโฮสต์เกิน 3 โฮสต์ ดังนั้นฉันจึงพยายามหาวิธีที่แตกต่างสำหรับโฮสต์เหล่านั้นซึ่งไม่ครอบคลุมโดย vCenter ฉันจะต้องดูเส้นทาง DRAC นั่นจะบอกอะไรฉันเช่น RAID failure ฯลฯ หรือไม่
ลัคกี้ลุค

OSMA จะให้สถานะดิสก์หรือการแจ้งเตือนการโจมตีซึ่งแตกต่างจาก DRAC
yagmoth555

0

คุณสามารถใช้https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environment/VMWare/check_vmware_api/details ที่ยอดเยี่ยม(โดยมีหรือไม่มี nagios) ได้อย่างยอดเยี่ยม ข้อมูลที่คุณต้องการสำหรับการตรวจสอบฮาร์ดแวร์:

check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green 

คุณต้องการ Perl vmware sdk แต่นอกเหนือจากนั้นมันค่อนข้างตรงไปตรงมา ใช้งานได้กับฮาร์ดแวร์ทุกประเภท (ตราบใดที่เซ็นเซอร์ตรวจจับได้โดย vmware api จะถูกตรวจสอบ)


-1

ลอง zabbix ( http://zabbix.com ):

1) ซอฟต์แวร์ตรวจสอบระดับโลกที่สมบูรณ์แบบเป็นที่รู้จักกันดี

2) คุณสามารถเริ่มต้นใช้งานอุปกรณ์ Zabbix ได้อย่างง่ายดายเช่นเดียวกับภาพเสมือนจริงที่กำหนดไว้ล่วงหน้า (ขึ้นอยู่กับ OpenSuSE)

3) สามารถตรวจสอบโฮสต์และเครื่อง ESX [I] โดยใช้บริการเว็บ Vmware (เช่นเว็บไคลเอนต์) คุณสามารถใช้กฎการค้นพบระดับต่ำเพื่อค้นหา VMware hypervisors และเครื่องเสมือนโดยอัตโนมัติและสร้างโฮสต์เพื่อตรวจสอบกฎเหล่านั้นโดยอิงตามต้นแบบโฮสต์ที่กำหนดไว้ล่วงหน้า

4) คุณจะสามารถตรวจสอบฮาร์ดแวร์ทั้งหมดของเซิร์ฟเวอร์ Dell ของคุณโดยใช้ SNMP ผ่าน iDrac รวมถึง RAID controller และสถานะโวลุ่ม, ดิสก์ทางกายภาพ / โมดูลหน่วยความจำ / PSU และอื่น ๆ ...

ข้อมูลสถานะฮาร์ดแวร์ทุกประเภท [ตามที่มีอยู่ใน iDrac] สามารถเข้าถึงได้ผ่าน SNMP (อย่างน้อยบนเซิร์ฟเวอร์ที่มี IDrac 7/8 - ฉันได้ทำการตรวจสอบฮาร์ดแวร์ของเซิร์ฟเวอร์รุ่น 50 + Dell 12/13 สำหรับ บริษัท ของฉันในเรื่องนี้ เดียว)

ด้วยคุณสมบัติ LLD (การค้นพบระดับต่ำ) ที่สมบูรณ์แบบของ zabbix คุณสามารถรวบรวมส่วนประกอบฮาร์ดแวร์ทั้งหมดสำหรับการตรวจสอบโดยไม่ต้องแจกแจงด้วยตนเองและสร้างรายการสำหรับการตรวจสอบโดยอัตโนมัติ (สถานะอุณหภูมิความเร็วพัดลมขนาดดิสก์และ serials เป็นต้น) (นิพจน์เพื่อประมวลผลข้อมูลการตรวจสอบ) และการกระทำต่าง ๆ ...

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.