คำถามติดแท็ก ecc

Error Correcting Code (หน่วยความจำ ECC) ถูกใช้ในคอมพิวเตอร์ส่วนใหญ่ซึ่งไม่สามารถยอมรับความเสียหายของข้อมูลได้ในทุกสถานการณ์


3
ฉันจะได้รับแจ้งข้อผิดพลาด ECC ใน Linux ได้อย่างไร
ฉันจะได้รับแจ้งได้อย่างไรเมื่อเครื่อง Linux ที่ติดตั้งหน่วยความจำ ECC รู้จักหน่วยความจำล้มเหลว ฉันสนใจข้อผิดพลาดทั้งที่แก้ไขและไม่สามารถแก้ไขได้ หากข้อความถูกเขียนไปยัง dmesg / syslog นี่เป็นเรื่องปกติ แต่ฉันชอบที่จะรู้ว่าจะต้องค้นหาอะไร ติดตั้ง daemons เพิ่มเติม (เช่น smartmontools สำหรับฮาร์ดไดรฟ์) เป็นที่ยอมรับ การติดตาม Nagios / Icinga จะเป็นอีกหนทางหนึ่ง เครื่องบางเครื่องที่ไม่ได้รับการตรวจสอบมี IPMI ระบบที่น่าสนใจมีบอร์ด Supermicro (X9SCM-F) เกี่ยวกับ Microserver HP N54L ฉันแค่อยากรู้อยากเห็น แต่ไม่สนใจมากเกินไป ระบบทั้งหมดใช้ Debian หรือ Ubuntu Linux
23 linux  ecc 


2
ข้อผิดพลาด Rowhammer DRAM คืออะไรและฉันควรปฏิบัติต่อมันอย่างไร
ชิป DRAM นั้นแน่นมาก การวิจัยแสดงให้เห็นว่าบิตที่อยู่ใกล้เคียงสามารถพลิกโดยการสุ่ม ความน่าจะเป็นของข้อผิดพลาดที่เกิดขึ้นแบบสุ่มในชิป DRAM ระดับเซิร์ฟเวอร์ด้วย ECC คืออะไร ( กระดาษ CMU-Intelอ้างอิงเช่นหมายเลข 9.4x10 ^ -14 สำหรับชิปที่ไม่รู้จักหนึ่งครั้งในหนึ่งปีที่ล้มเหลว)? ฉันจะทราบได้อย่างไรว่าข้อบกพร่องได้รับการแก้ไขก่อนซื้อหน่วยความจำ ฉันควรทำอย่างไรเพื่อต่อต้านความพยายามที่เป็นอันตรายในการเพิ่มสิทธิ์โดยผู้เช่าหรือผู้ใช้ที่ไม่มีสิทธิเช่น CentOS 7 อ้างอิง: บั๊ก Hammer DRAM ใช้ประโยชน์จากการปลดล็อคการเข้าถึงหน่วยความจำกายภาพ พลิกบิตในหน่วยความจำโดยไม่ต้องเข้าถึงพวกเขา: การศึกษาทดลองข้อผิดพลาดรบกวน DRAM PoC repo ของ Google การเขียนโครงการเป็นศูนย์
20 security  memory  ecc  bug 

2
ตัวเลือก RAM ใดที่ฉันต้องรู้ก่อนซื้อ Server RAM
ต้องการปรับปรุงโพสต์นี้หรือไม่? ให้คำตอบโดยละเอียดสำหรับคำถามนี้รวมถึงการอ้างอิงและคำอธิบายว่าทำไมคำตอบของคุณถึงถูกต้อง คำตอบที่ไม่มีรายละเอียดเพียงพออาจแก้ไขหรือลบออกได้ นี่เป็นคำถามที่ยอมรับได้เกี่ยวกับหน่วยความจำเซิร์ฟเวอร์ ฉันต้องซื้อเซิร์ฟเวอร์ Dell R420 และมีชุดค่าผสมต่าง ๆ (1600 และ 1333 MHz RDIMMS และ UDIMMS) และ Performance Optimized vs. ECC ขั้นสูงที่มีและไม่มีการประหยัด ฉันสังเกตเห็นว่ามีเพียง 4gb DIMMS พร้อม UDIMM ดังนั้นฉันจะไปถึง 16GB RDIMMS อย่างเต็มที่ ตัวเลือกเหล่านี้คืออะไรและฉันต้องรู้อะไรบ้างเกี่ยวกับพวกเขา
18 memory  hardware  ecc 

3
หน่วยความจำ Non-ECC พร้อม ZFS: ความคิดงี่เง่า?
ฉันมีเซิร์ฟเวอร์ใหม่และวางแผนที่จะอัพเกรดหน่วยความจำขนาดเล็ก 2 GB เป็นสูงสุด 16 GB (ตามหลักวิชา 8 GB นั้นมีขีด จำกัด แต่แสดงให้เห็นแล้วว่าใช้งานจริงได้ 16 GB) คำแนะนำบางคำแนะนำว่าหน่วยความจำ ECC นั้นไม่สำคัญ แต่ฉันไม่แน่ใจว่าฉันเชื่ออย่างนั้น ฉันได้ติดตั้งFreeNASแล้วและวางแผนที่จะเพิ่มปริมาณ ZFS ทันทีที่ฮาร์ดไดรฟ์ใหม่ของฉันมาถึง มันจะโง่ที่จะปล่อยทิ้งและรับหน่วยความจำที่ไม่ใช่ ECC สำหรับ NAS ที่ใช้ ZFS หรือไม่ ถ้าจำเป็นฉันก็จะกัดกระสุน แต่ถ้ามันเป็นแค่ความหวาดระแวงฉันก็จะข้ามมันไป มีเหตุผลใดที่ ZFS หรือ FeeeNAS โดยเฉพาะจะต้องใช้หน่วยความจำ ECC หรือประสบโดยเฉพาะอย่างยิ่งเมื่อทำงานบนระบบที่ใช้หน่วยความจำที่ไม่ใช่ ECC?
16 memory  zfs  freenas  ecc 

1
ฉันควรใช้ไบออส“ Advanced ECC” ใน Dell PowerEdge R710 Bios กับ ECC DIMM หรือไม่
ฉันมี Dell PowerEdge R710 พร้อมด้วย Intel Xeon E5503 ซีพียูคู่ มี 96GB (12x8GB) ของ ECC DIMM ใน BIOS หน่วยความจำถูกกำหนดค่าสำหรับ "Advanced ECC" คำถามของฉันคือถ้า DIMM ของฉันเป็น ECC แล้วมันสมเหตุสมผลหรือไม่ที่จะเปิดใช้งานโหมด "Advanced ECC" ใน BIOS หรือฉันควรเปลี่ยนไปใช้ "Optimized" หรือไม่? Dell อธิบายโหมดเหล่านี้ดังนี้: โหมด ECC ขั้นสูงโหมด นี้ใช้ MCH สองตัวและ“ เชื่อมโยง” เข้าด้วยกันเพื่อจำลองบัสข้อมูล DIMM 128 บิต สิ่งนี้ถูกใช้เพื่อบรรลุการแก้ไขข้อมูลอุปกรณ์เดียว (SDDC) สำหรับ DIMM ตามเทคโนโลยี …

5
ความสำคัญของหน่วยความจำ ECC
โมดูลหน่วยความจำ ECC มีความสำคัญที่ต้องมีบนเซิร์ฟเวอร์ที่ไม่สำคัญหรือไม่? ฉันกำลังคิดว่าจะทำให้ตัวเองเป็นเซิร์ฟเวอร์เฉพาะสำหรับของเล่นสำหรับสิ่งที่สุ่มและไม่สำคัญมากมาย การเรียบเป็นระยะ ๆ นั้นไม่ใช่เรื่องใหญ่ ฉันกำลังดูผู้ให้บริการรายหนึ่ง แต่ราคาถูกอย่างไม่น่าเชื่อ ฮาร์ดแวร์ของพวกเขาฟังดูตลกสำหรับกล่องเซิร์ฟเวอร์ร้ายแรงใด ๆ : โปรเซสเซอร์เดสก์ท็อป, RAM ที่ไม่ใช่ ECC, แชสซีที่ไม่มีชื่อ, ไม่มี hotswap SATA HDD และอื่น ๆ (ดี, ราคาสมเหตุสมผล, ฉันเดา) ฉันใช้หน่วยความจำ ECC เพื่อให้สิทธิ์บนเซิร์ฟเวอร์ "ร้ายแรง" ใด ๆ ดังนั้นฉันสงสัยว่ามันเป็นเรื่องใหญ่หรือไม่สำหรับอุปกรณ์ "ของเล่น"

4
จะตรวจสอบว่า RAM ทำงานในโหมด ECC ได้อย่างไร?
ฉันอัปเดตโพสต์นี้ตั้งแต่ฉันเปลี่ยนโปรเซสเซอร์ แต่หลักของคำถามของฉัน (และน่าเสียดายที่ผลลัพธ์เช่นกัน) เหมือนกัน ฉันสร้างกล่อง FreeNAS แรกและต้องการใช้ ECC RAM เนื่องจากฉันต้องการจัดเก็บข้อมูลสำคัญ เนื่องจากฉันอยู่ในงบประมาณฉันต้องการไปหาทางออกที่เหมาะสมที่สุดที่จะยังคงสนับสนุน ECC RAM หลังจากทำการวิจัยบางอย่างฉันพบว่าฉันต้องการแผงวงจรหลักหน่วยความจำและ CPU ที่รองรับ ECC เมนบอร์ดที่ฉันเลือกคือ "Gigabyte X150M-Pro ECC" ซึ่งมีชิปเซ็ต C232, DDR4 และซ็อกเก็ต LGA1151 ฉันยังซื้อชุดอุปกรณ์สอง DIMM ที่ผลิตโดย KINGSTON ด้วยหมายเลขรุ่น "KVR21E15S8K2 / 8" ( แผ่นข้อมูลจำเพาะ ) Gigabyte เผยแพร่รายการของโมดูลหน่วยความจำที่ผ่านการทดสอบและดูเหมือนว่าโมดูลของฉันจะรองรับ ECC ที่ใช้งานได้ ( รายการของโมดูลที่รองรับ ) เนื่องจากฉันอยู่ในงบประมาณฉันต้องการ Skylake CPU ราคาไม่แพงที่รองรับ ECC ตามIntel …

1
วิธีการบังคับให้เกิดข้อผิดพลาด ECC [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับข้อบกพร่องของเซิร์ฟเวอร์ ปิดให้บริการใน4 ปีที่แล้ว ฉันกำลังมองหาวิธีที่จะบังคับให้เกิดข้อผิดพลาด ECC ใน DRAM DIMM เพื่อทดสอบโค้ดบางอย่างที่เกี่ยวข้องกับการกู้คืนจากข้อผิดพลาดเหล่านี้ ฉันเชื่อว่า Intel ทำการทดสอบจิ๊กหลายพันดอลลาร์ แต่ฉันกำลังมองหาบางอย่างที่ถูกกว่า ฉันได้ลองซื้อตัวปล่อยเบต้า (Strontium 90, 0.01uCi) ที่ติดอยู่กับ DIMM เพื่อบังคับให้ "บิตพลิก" ในฮาร์ดแวร์ หลังจากทำงานสองสัปดาห์ฉันไม่ได้รับรายงานข้อผิดพลาด ECC ขั้นตอนต่อไปของฉันคือซื้ออีซีแอลที่แรงกว่า ... หรือดูว่ามีใครแก้ปัญหานี้ด้วยวิธีอื่นบ้าง คำถาม : มีใครพบวิธีที่จะบังคับให้ความล้มเหลวของ ECC ใน DIMM สำหรับวัตถุประสงค์ในการทดสอบ (นอกเหนือจากการค้นหา DIMM ที่ล้มเหลวและใช้สิ่งนั้น .. ซึ่งเป็นเทคนิคเก่าของเราจนกระทั่ง DIMM เลิกใช้ผีอย่างสมบูรณ์)
10 ecc 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.