RAM โหมดมิเรอร์: มันคุ้มหรือไม่


18

ไม่คุ้นเคยกับ "Mirrored Channel Mode" ของ Intel สำหรับการตั้งค่าเซิร์ฟเวอร์เบลด (ฐานข้อมูล MySQL OLTP ที่หนักหน่วงปานกลางโดยทั่วไปของคุณทำงานอยู่บนเบลดโลหะเปลือยโดยไม่มีการจำลองเสมือนในขณะนี้)

จากเอกสารของ Intel ฉันสามารถค้นหา:

Intel Xeon Processor 5500 series และ Intel Xeon Processor 5600 series รองรับการจำลองช่องทางเพื่อกำหนดค่าช่องสัญญาณที่มีอยู่ของ DDR3 DIMM ในการกำหนดค่าแบบมิเรอร์ การกำหนดค่าที่มิเรอร์เป็นภาพที่ซ้ำซ้อนของหน่วยความจำและสามารถทำงานต่อไปได้แม้จะมีข้อผิดพลาดที่ไม่สามารถแก้ไขได้เป็นระยะ การจำลองช่องสัญญาณเป็นคุณสมบัติ RAS ซึ่งมีการเก็บรักษาข้อมูลหน่วยความจำภาพเหมือนกันสองภาพจึงให้ความซ้ำซ้อนสูงสุด

ในโปรเซสเซอร์ Intel Xeon 5500 series และโปรเซสเซอร์ Intel Xeon Processor 5600 series ที่ใช้เซิร์ฟเวอร์บอร์ด Intel การทำมิเรอร์นั้นทำได้ในหลายช่องทาง ช่องที่ใช้งานอยู่จะเก็บภาพหลักและอีกช่องหนึ่งจะเก็บภาพที่สองของหน่วยความจำระบบ คอนโทรลเลอร์หน่วยความจำในตัวในโปรเซสเซอร์ Intel Xeon 5500 series และโปรเซสเซอร์ Intel Xeon โปรเซสเซอร์ 5600 ซีรีส์สลับกันระหว่างทั้งสองช่องทางสำหรับการอ่านธุรกรรม ธุรกรรมการเขียนจะถูกออกให้กับทั้งสองช่องทางภายใต้สถานการณ์ปกติ

อย่างไรก็ตามฉันไม่ได้เลือกสิ่งที่พวกเขาวางลงที่นี่ ฉันสูญเสียความจุในการจัดเก็บลงครึ่งหนึ่ง แต่ฉันได้รับ "ความซ้ำซ้อน" ของหน่วยความจำและได้รับประโยชน์ด้านประสิทธิภาพการอ่าน / เขียนใช่หรือไม่ ชอบ RAID 1 สำหรับ RAM ไหม? ใครมีประสบการณ์เชิงปฏิบัติกับการกำหนดค่านี้

คำตอบ:


7

โดยส่วนตัวแล้วฉันจะใช้การรวมกลุ่มในรูปแบบมากกว่าความยืดหยุ่นของฮาร์ดแวร์ในระดับนั้น มันสมเหตุสมผลสำหรับส่วนประกอบของ cheapo เช่นดิสก์ที่เพิ่มขึ้นเป็นสองเท่า แต่การมิเรอร์หน่วยความจำเป็นสิ่งที่ดี แต่ไม่มีประโยชน์ ฉันหมายถึงสิ่งที่มีแนวโน้มที่จะล้มเหลว; CPU, ระบบปฏิบัติการ, ซอฟต์แวร์, mobo ของคุณ, PSU / s ของคุณ ฉันจะนำเงินไปสู่การรวมกลุ่มในไม่ช้า


1
ความคิดของฉัน: ในขณะที่มีประโยชน์สำหรับจุดความล้มเหลวที่เฉพาะเจาะจงอย่างแน่นอนฉันสามารถติ๊กช่อง "HA" อื่น ๆ อีกมากมายโดยไปที่เส้นทางการจัดกลุ่มด้วยเบลดหรือสองอีกอัน
gravyface

1
การรวมกลุ่มจะไม่ช่วยคุณเมื่อต้องคำนวณตามกำหนดเวลาหรือภายในกรอบเวลา ในบางสถานการณ์ความล้มเหลวใช้เวลานานกว่าการดำเนินการที่ต้องดำเนินการ
Jim B

7

"RAID 1 for RAM" เป็นคำอธิบายที่ถูกต้อง จากประสบการณ์ของฉันมีประสิทธิภาพไม่มากนัก แต่ขึ้นอยู่กับความเร็วบัสเทียบกับความเร็วของโมดูลไมล์สะสมของคุณอาจแตกต่างกันไป

เท่าที่ความซ้ำซ้อนไปได้ .. ก็ไม่บ่อยนักที่โมดูลจะเสีย

ส่วนตัวฉันปิดมิเรอร์เมื่อใดก็ตามที่ฉันเห็นมันเปิดใช้งาน


2
ขอบคุณเชน เคยทำการเปรียบเทียบมาก่อนหรือหลัง?
gravyface

@gravyface ไม่สามารถพูดได้ว่าฉันมีโชคไม่ดี เพิ่งไม่ได้สังเกตเห็นประสิทธิภาพที่มองเห็นได้แตกต่างกันเมื่อเทียบกับ (บนเซิร์ฟเวอร์ฐานข้อมูลและโฮสต์ vm) ตัวเลขที่ยากบางอย่างน่าจะดี
Shane Madden

2
ฉันจะทำเกณฑ์มาตรฐานบางอย่างแล้ว ดูว่ามันสร้างความแตกต่าง ไม่สามารถพูดได้ว่าผลประโยชน์การแก้ไขข้อผิดพลาดดูเหมือนเป็นประโยชน์ที่จับต้องได้ แต่ฉันอยากรู้ว่ามันทำงานอย่างไร ฉันจะรอสองสามวันเพื่อหาคำตอบเพิ่มเติมจากนั้นทำเครื่องหมายถูกต้อง
gravyface

ฉันเห็นสลัวไม่ดีตามปกติ แต่เนื่องจากขนาดของสภาพแวดล้อมฉันควรเห็น 1 dimm ทุก 2 สัปดาห์ (การพูดเชิงสถิติ)
Jim B

4

ฉันได้อ่านแล้วว่าสิ่งนี้ (คุณสามารถทำกับซีพียูได้) มีประโยชน์มากในกลุ่มซุปเปอร์คอมพิวเตอร์ขนาดใหญ่

กลุ่มเหล่านี้บางส่วนกำลังใช้งานเครื่องจำนวนมากซึ่งจะมีความล้มเหลวของเครื่องทุกสองสามชั่วโมง เร็วกว่างานที่ทำได้ นั่นทำให้การคำนวณยุ่งเหยิงจริงๆ การเพิ่มความซ้ำซ้อนเช่นนี้ให้กับแต่ละโหนดสามารถเพิ่มเวลาเป็นสองเท่าระหว่างความล้มเหลวได้


ดังนั้นนี่คือสิ่งที่ระดับ high-end ตอนนี้ไหลลงไปที่กระแสหลักฉันเอามัน ไม่เห็นคุณค่ามากนักสำหรับความต้องการของฉัน ขอบคุณ
gravyface

ใช่มันเป็นไฮเอนด์ รอจนกว่าคุณจะได้ CPU hot plug และซีพียู MIRRORING (!) ในพีซี;) mainframes สามารถสลับไปยัง cpu อื่นเมื่อล้มเหลว
TomTom

3

โหมดหน่วยความจำนี้ได้รับการออกแบบมาสำหรับสถานการณ์ที่คุณต้องการความพร้อมใช้งานสูงคุณไม่ควรเห็นความแตกต่างด้านประสิทธิภาพ (เนื่องจากการสูญเสียหนึ่งช่องอาจไม่ชัดเจนภายใต้การทำงานปกติ) แต่จริง ๆ แล้วคุณเสีย RAM จำนวนมาก เมื่อเปิดใช้งานการทำมิเรอร์จะมีหน่วยความจำรวมเพียงหนึ่งในสามเท่านั้นเนื่องจากช่องเสียบ DIMM สองช่องเป็นช่องสัญญาณหลักช่อง DIMM สองช่องเป็นช่องสำรองและไม่ใช้ช่อง DIMM สองช่อง (อย่างน้อยนั่นคือสิ่งที่เป็นใน IBMs)

ฉันมักจะแนะนำว่ามันจะปิด (ถ้าคุณมีแอพหรือระบบปฏิบัติการที่ชอบ ram - และลองหน้ามัน: มีอันที่ไม่ได้หรือไม่) หรือบันทึกขึ้นเพื่ออัพเกรดเป็นชิป ex5 จาก IBM (HP และอื่น ๆ ในไม่ช้า เพื่อปฏิบัติตามข้อเสนอที่คล้ายกัน) ซึ่งเพิ่มปริมาณเรือ QPI มากขึ้น

มีบางครั้ง "เซิร์ฟเวอร์นี้จะต้องมีขึ้นโดยไม่คำนึงถึงจำนวนภาพที่ยิงได้ที่มัน" และความซ้ำซ้อนประเภทนี้จะช่วย นอกเหนือจากที่คุณซื้อ ram คุณภาพต่ำกว่าดาวอาจช่วยให้คุณประหยัดจากหน้าจอสีน้ำเงินหรือ 2


ใช่ไม่เห็นความต้องการมากในตอนนี้ เห็นได้ชัดว่าไม่มีใครชอบการหยุดทำงาน แต่เมื่อเราพูดถึง HA เราจะมองกลุ่มอย่างแน่นอนที่สุด
gravyface

1
สิ่งนี้เพื่อตอบสนองต่อ "เห็น DIMM ที่ไม่ดีเพียงครั้งเดียวทุกสองสัปดาห์" คุณเห็น DIMM ที่ไม่ดีในช่วงเวลาผ่อนผันบ่อยเพียงใด ฉันจำไม่ได้ว่าเคยมี RAM ไม่ดีครั้งเดียวในการผลิต ฉันมักจะสังเกตเห็นมันสองสามชั่วโมงแรก / วันภายใต้ภาระงานทั่วไป
gravyface

ผลของเราสะท้อน Google อัตราเห็นcs.toronto.edu/~bianca/papers/sigmetrics09.pdf เรามีการกำหนดค่าเซิร์ฟเวอร์ในทำนองเดียวกัน - แผงวงจรที่เต็มไปด้วยสลัวจำนวนมากและแอพพลิเคชั่นที่ใช้หน่วยความจำมาก เมื่อดูที่หนึ่งในสภาพแวดล้อม vmware ของฉันฉันเห็น 3 dimms ที่ไม่ดีใน 18 hs22vs ที่มีประชากรทั้งหมดของ IBM hs22vs (324 dimms) เซิร์ฟเวอร์เหล่านี้ใช้งานมาประมาณหนึ่งปีแล้ว
Jim B
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.