ฉันจะออกจากสถานการณ์นี้อย่างปลอดภัยได้อย่างไร
รายละเอียดดังนี้
เซิร์ฟเวอร์ xen มีอุปกรณ์บล็อกที่จัดสรรให้กับ VMs แต่อุปกรณ์เหล่านี้ยังได้รับการติดตั้งภายใน Xen
ในความเป็นจริง 44 ของอุปกรณ์บล็อกเหล่านี้ได้รับการติดตั้งเช่นนี้ ในการทำให้เรื่องแย่ลงอุปกรณ์ทางกายภาพแต่ละตัวจะถูกมองเห็นได้มากกว่า 4 เส้นทางและแต่ละตัวจะถูกเมานต์บนจุดเมานต์แยกกัน กล่าวอีกนัยหนึ่งอุปกรณ์เหล่านี้จะถูกเมาท์ 5 ครั้ง
VM guest OS มองเห็นเส้นทางผ่านอุปกรณ์หลอก PowerPath (จัดสรรเป็นอุปกรณ์ phy: block ไปยัง domU)
อุปกรณ์บางอย่างถูกจัดรูปแบบเป็น ext2 และ reiserfs
ไม่จำเป็นต้องอธิบายให้ฉันฟังถึงความเสี่ยงของการทุจริตของระบบไฟล์ที่เกี่ยวข้อง
ฉันกลัวว่าแม้เพียงแค่ unmounting ระบบแฟ้มอาจทำให้เกิดความเสียหายและรู้สึกว่าณ จุดนี้การดึงไฟจากโฮสต์เป็นตัวเลือกที่ปลอดภัยที่สุด
โปรดทราบว่าแอปพลิเคชันฐานข้อมูล Oracle ส่วนใหญ่ใน VMs ทั้งหมดยังคงทำงานและใช้งานอยู่
ฉันค้นพบสิ่งนี้เมื่อตรวจสอบการใช้งาน CPU สูงใน dom0 มีกระบวนการ "ค้นหา" ที่ไม่สามารถทำได้ซึ่งมี cwd -> / media / disk-12 ซึ่งถูกเมาท์จาก / dev / sdf1 ซึ่งเป็นของ / dev / emcpowerr
ก่อนที่จะมีคนถามครั้งเดียวที่ฉันเห็นกระบวนการไม่สามารถฆ่าและใช้ CPU และ RAM ต่อไป (ซึ่งแตกต่างจากกระบวนการตาย / ซอมบี้) คือเมื่อมี I / Os ที่ค้างชำระเช่นซิงค์กลับ แต่ยังไม่ได้อยู่บนดิสก์ . โดยทั่วไปเกิดขึ้นบนเทป I / O
ข้อเสนอแนะ !?
ป.ล. ฉันคาดว่าจะมีอุปกรณ์ "สงวน" ติดตั้งครั้งเดียวเพื่อป้องกันสิ่งนี้? หรือว่าเป็นไปไม่ได้บน Linux?
แก้ไข: ประการแรกฉันเชื่อว่า KDE ภายใน hypervisor) เป็นผู้ร้าย ดูเหมือนว่า KDE กำลังติดตั้งอุปกรณ์ที่สามารถบันทึกเพื่อสร้างไอคอนเดสก์ท็อป สิ่งเดียวกันนั้นไม่ได้เกิดขึ้นกับเซิร์ฟเวอร์ Xen อื่น ๆ แต่เซิร์ฟเวอร์อื่นทั้งหมดกำลังใช้ SLES และ KDE รุ่นเก่ากว่ามาก ... V4 ดูเหมือนจะเป็นเซิร์ฟเวอร์ที่ถูกละเมิดซึ่งมี 3.4 พฤติกรรมที่ดีกว่า)
นอกจากนี้ VM ที่ไม่สำคัญสองตัวก็หยุดทำงาน หลังจากปิดพวกเขาพวกเขาจะไม่บูตขึ้นอีกครั้งเนื่องจากความเสียหายของระบบไฟล์ VM หลัก / การผลิตยังคงทำงานอยู่และฐานข้อมูลยังคงทำงานอยู่ แต่ชัดเจนว่านี่เป็นระเบิดเวลา ลูกค้ากำลังพยายามสร้างสภาพแวดล้อมบน VM อื่นบนเซิร์ฟเวอร์อื่น แต่ติดอยู่กับปัญหาในการกำหนดค่าองค์ประกอบบางอย่างดังนั้นเราจึงรอ ...
ไม่ว่าในกรณีใดฉันรู้สึกว่าไม่มีคำตอบใดที่เกินกว่า "แนวปฏิบัติที่ดีที่สุดจะปิดตัวลงอย่างสง่างาม" และฉันหวังว่าจะได้สิ่งที่เป็นรูปธรรมมากขึ้น ... ในทุกกรณีฉันรู้สึกว่าสถานการณ์นี้อาจรับประกันได้มากขึ้น ความคิด การปิดระบบจะทำให้ IO ค้างอยู่โดยเฉพาะอย่างยิ่งการอัพเดตข้อมูลเมตาของระบบไฟล์จากไฮเปอร์ไวเซอร์ที่จะซิงค์และทำให้เกิดความเสียหายกับระบบไฟล์ที่สำคัญ?