ฉันคุ้นเคยกับสิ่งที่ BBWC (แคชการเขียนสำรองแบตเตอรี่) ตั้งใจทำ - และก่อนหน้านี้ใช้มันในเซิร์ฟเวอร์ของฉันแม้จะมี UPS ที่ดี มีความล้มเหลวอย่างรุนแรงซึ่งไม่ได้ให้ความคุ้มครอง ฉันอยากรู้ว่าจะให้ประโยชน์ใด ๆ ในทางปฏิบัติจริงหรือไม่
(NB ฉันกำลังมองหาคำตอบเฉพาะจากผู้ที่มี BBWC และมีปัญหา / ล้มเหลวและ BBWC ช่วยกู้คืนหรือไม่)
ปรับปรุง
หลังจากข้อเสนอแนะที่นี่ฉันสงสัยมากขึ้นว่า BBWC เพิ่มคุณค่าใด ๆ
เพื่อให้มีความมั่นใจเกี่ยวกับความถูกต้องของข้อมูลระบบไฟล์จะต้องรู้ว่าเมื่อใดที่ข้อมูลมีความมุ่งมั่นในการจัดเก็บข้อมูลที่ไม่ลบเลือน (ไม่จำเป็นต้องเป็นดิสก์ เป็นที่น่าสังเกตว่ามีดิสก์จำนวนมากอยู่ที่เมื่อข้อมูลถูกส่งไปยังดิสก์ ( http://brad.livejournal.com/2116715.html ) ในขณะที่ดูเหมือนว่ามีเหตุผลที่จะสมมติว่าการปิดใช้งานแคชบนดิสก์อาจทำให้ดิสก์มีความซื่อสัตย์มากขึ้น แต่ก็ยังไม่รับประกันว่าจะเป็นเช่นนั้น
เนื่องจากบัฟเฟอร์ขนาดใหญ่ที่พิมพ์ผิดใน BBWC สิ่งกีดขวางอาจต้องการข้อมูลมากกว่าที่จะส่งไปยังดิสก์ดังนั้นจึงทำให้เกิดความล่าช้าในการเขียน: คำแนะนำทั่วไปคือการปิดใช้งานสิ่งกีดขวางเมื่อใช้แคชเขียนย้อนกลับที่ไม่ลบเลือน การแคชดิสก์) อย่างไรก็ตามการทำเช่นนี้ดูเหมือนว่าจะเป็นการบ่อนทำลายความสมบูรณ์ของการดำเนินการเขียน - เพียงเพราะข้อมูลจำนวนมากถูกเก็บรักษาไว้ในหน่วยความจำที่ไม่ลบเลือนไม่ได้หมายความว่ามันจะสอดคล้องกันมากขึ้น แน่นอนว่าไม่มีการแบ่งแยกระหว่างการทำธุรกรรมเชิงตรรกะดูเหมือนว่าจะมีโอกาสน้อยกว่าในการรับรองความมั่นคงกว่าอย่างอื่น
หาก BBWC ต้องรับรู้ถึงอุปสรรค ณ จุดที่ข้อมูลเข้าสู่ที่เก็บข้อมูลแบบไม่ลบเลือน (แทนที่จะมุ่งมั่นกับดิสก์) ก็จะปรากฏขึ้นเพื่อตอบสนองความต้องการด้านความสมบูรณ์ของข้อมูลโดยไม่มีการลงโทษด้านประสิทธิภาพซึ่งหมายความว่ายังคงเปิดใช้งาน อย่างไรก็ตามเนื่องจากอุปกรณ์เหล่านี้มักแสดงพฤติกรรมที่สอดคล้องกับการล้างข้อมูลไปยังอุปกรณ์ทางกายภาพ (ช้าลงอย่างมากเมื่อมีสิ่งกีดขวาง) และคำแนะนำอย่างกว้างขวางเพื่อปิดการใช้งานสิ่งกีดขวางพวกเขาจึงไม่สามารถทำงานในลักษณะนี้ได้ ทำไมไม่
หาก I / O ในระบบปฏิบัติการถูกสร้างแบบจำลองเป็นชุดของสตรีมดังนั้นจึงมีขอบเขตบางอย่างที่จะลดผลกระทบการบล็อกของอุปสรรคการเขียนเมื่อระบบปฏิบัติการแคชถูกจัดการโดยระบบปฏิบัติการ - เนื่องจากระดับตรรกะธุรกรรม (ตรรกะ) ) จะต้องมีการมุ่งมั่น ในทางกลับกัน BBWC ที่ไม่มีความรู้ว่าบิตของข้อมูลประกอบธุรกรรมจะต้องส่งมอบแคชทั้งหมดไปยังดิสก์ เคอร์เนล / ระบบไฟล์ใช้งานจริงหรือไม่ในทางปฏิบัติจะต้องใช้ความพยายามมากกว่าที่ฉันต้องการลงทุนในขณะนี้
การรวมกันของดิสก์ที่บอกว่าเป็นพังผืดเกี่ยวกับสิ่งที่เกิดขึ้นและการสูญเสียพลังงานอย่างฉับพลันนำไปสู่การทุจริตอย่างไม่ต้องสงสัย - และด้วยระบบไฟล์ Journalling หรือ log ที่มีโครงสร้างซึ่งไม่ได้ทำ fsck เต็มหลังจากดับไฟ มีความพยายามซ่อมแซม
ในแง่ของโหมดความล้มเหลวในประสบการณ์ของฉันไฟฟ้าดับส่วนใหญ่เกิดขึ้นทันทีเนื่องจากการสูญเสียพลังงานไฟหลัก (ลดลงอย่างง่ายดายด้วย UPS และการปิดระบบที่ถูกจัดการ) ผู้คนดึงสายเคเบิลที่ไม่ถูกต้องออกจากชั้นวางแสดงถึง hyacene datacentre ที่ไม่ดี (การติดฉลากและการจัดการสายเคเบิล) มีเหตุการณ์การสูญเสียพลังงานฉับพลันบางประเภทที่ไม่ได้รับการป้องกันจาก UPS - ความล้มเหลวใน PSU หรือ VRM และ BBWC ที่มีปัญหาและอุปสรรคที่จะให้ความสมบูรณ์ของข้อมูลในกรณีที่เกิดความล้มเหลวที่นี่ การตัดสินที่หายากมากโดยขาดคำตอบที่นี่
แน่นอนว่าการย้ายค่าเผื่อความผิดพลาดที่สูงกว่าในกองซ้อนนั้นมีราคาแพงกว่าอย่างมากใน BBWC - อย่างไรก็ตามการนำเซิร์ฟเวอร์ไปใช้เนื่องจากคลัสเตอร์มีประโยชน์อื่น ๆ มากมายสำหรับประสิทธิภาพและความพร้อมใช้งาน
อีกทางเลือกหนึ่งในการลดผลกระทบของการสูญเสียพลังงานอย่างกะทันหันคือการนำ SAN - AoE มาใช้ทำให้เป็นข้อเสนอเชิงปฏิบัติ