การทดสอบ RAM ไม่สอดคล้องกัน - ผู้ร้ายคนใดที่มีแนวโน้มมากที่สุด (เช่นสิ่งที่ฉันควรใช้จ่ายเงินในการเปลี่ยน)


20
  • เมนบอร์ด: GA-B85M-DS3H-A
  • CPU: Core i5 4430
  • RAM: PNY XLR8 DDR3 32GB (4x8GB) 1600MHz (MD32768K4D3-1600-X9)
  • PSU: EVGA 500 W1 80+

ปัญหา

เมื่อติดตั้ง RAM 32GB ทั้งหมดระบบจะล้มเหลว MemTest86 + 6.2 อย่างสม่ำเสมอ ความล้มเหลวเกิดขึ้นเสมอในระหว่างการส่งครั้งแรกและข้อผิดพลาดจะเพิ่มขึ้นอย่างรวดเร็วสู่ข้อผิดพลาดนับล้าน การพยายามเรียกใช้ Windows จะส่งผลให้เกิดข้อผิดพลาดในการเริ่มระบบใหม่และหยุดข้อผิดพลาดแบบสุ่ม (ตามที่คาดไว้พร้อมกับข้อผิดพลาด RAM)

สิ่งที่ฉันได้ลอง

  • ทดสอบโมดูล PNY 8GB เดียวในซ็อกเก็ต DIMM1 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบโมดูล PNY 8GB เดียวในซ็อกเก็ต DIMM2 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบโมดูล PNY 8GB เดียวในซ็อกเก็ต DIMM3 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบโมดูล PNY 8GB เดียวในซ็อกเก็ต DIMM4 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบ 8GB PNY DIMM ทั้งสี่แยกทีละตัวในซ็อกเก็ต DIMM1 โมดูลทั้งหมดสำเร็จผ่าน 4 MemTest สำเร็จ
  • ทดสอบสองโมดูล 8GB PNY ในซ็อกเก็ต DIMM1 และ DIMM2 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบสองโมดูล 8GB PNY ในซ็อกเก็ต DIMM3 และ DIMM4 ประสบความสำเร็จในการผ่าน 4 MemTest
  • ทดสอบมาเธอร์บอร์ดด้วย DIMM ที่รู้จักดี 2GB สี่ตัวในซ็อกเก็ตทั้งหมด ประสบความสำเร็จในการผ่าน 4 MemTest
  • สลับลำดับของ PNY DIMM ในซ็อกเก็ต ไม่มีการเปลี่ยนแปลง - ข้อผิดพลาด MemTest ยังคงเกิดขึ้น
  • เพิ่มแรงดัน RAM ของเมนบอร์ดจาก 1.5v เป็น 1.65V ไม่มีการเปลี่ยนแปลง - ข้อผิดพลาด MemTest ยังคงเกิดขึ้น
  • เล่นด้วยการผสมผสานการตั้งค่า RAM แบบแมนนวลในยูทิลิตี้การตั้งค่า - การเปิด / ปิดการใช้งานโปรไฟล์ XMP, การตั้งค่าล่วงหน้า "เพิ่มความเสถียร" ฯลฯไม่มีการเปลี่ยนแปลงข้อผิดพลาด MemTest ยังคงเกิดขึ้น

ฉันคิดว่าฉันสามารถแยกแยะแรมที่ไม่ดีและซ็อกเก็ต RAM ที่ไม่ดีได้อย่างปลอดภัย เพียงเวลาทดสอบ MemTest ล้มเหลวคือถ้าทั้งสี่โมดูล 8GB มีการติดตั้งไปพร้อม ๆ กัน

ฉันวัดแรงดันไฟฟ้าที่ออกมาจาก PSU และทุกอย่างที่ปรากฏมีความเสถียรแม้จะติดตั้งทั้งสี่แท่ง

ขณะที่ฉันเขียนสิ่งนี้ฉันได้ลองตัวเลือกสุดท้ายของการลดความเร็ว RAM ลงไปที่ 1066MHz ใน BIOS จนถึงตอนนี้ MemTest เสร็จสมบูรณ์หนึ่งรอบและอยู่ในอันดับที่สองโดยไม่มีข้อผิดพลาด (การทดสอบทั้งหมดข้างต้นดำเนินการที่ความเร็ว RAM 1600MHz ดั้งเดิม) สิ่งนี้อาจทำให้ฉันใช้ระบบได้แม้ว่าจะมีความเร็ว RAM ช้าลงเล็กน้อย แต่นี่ดูเหมือนจะไม่เป็นการแก้ไขแบบถาวร

เมื่อใดก็ตามที่ข้อผิดพลาดของ MemTest เกิดขึ้นพวกเขาจะอยู่ในตำแหน่งที่แน่นอนบนบัสแอดเดรส 64 บิตเสมอ:

Bit Error Mask: 00000000FF000000

นอกจากนี้ข้อผิดพลาดไม่เคยเกิดขึ้นใต้สิ่งกีดขวาง 4GB กล่าวอีกนัยหนึ่งข้อผิดพลาดเกิดขึ้นในพื้นที่ที่อยู่ระหว่าง 4GB และ 32GB

ฉันอนุมานว่านี่เป็นการโต้ตอบที่แปลกประหลาดหรือปัญหาเกี่ยวกับเวลากับ CPU และ RAM และเมนบอร์ดเนื่องจากข้อผิดพลาดมีความสอดคล้องกันมากเกิดขึ้นเฉพาะในการกำหนดค่าหนึ่งเท่านั้นดูเหมือนจะบรรเทาลงด้วยการชะลอ RAM และ เกิดขึ้นเหนือสิ่งกีดขวาง 4GB เท่านั้น คำถามของฉันคือ: มีแนวโน้มว่า CPU หรือเมนบอร์ดของฉันเป็นผู้ร้ายหรือไม่

ฉันตั้งใจจะอัพเกรดเครื่องนี้เป็น Core i7-4790K ดังนั้นหาก CPU เป็นผู้ร้าย (ฉันรู้ว่าตัวควบคุมหน่วยความจำอยู่บน CPU ในรุ่นที่ใหม่กว่านี้) มันทำงานได้ดีเพราะฉันวางแผนที่จะอัพเกรด แต่ฉันสงสัยว่ามีโอกาสที่เมนบอร์ดตัวเองอาจเป็นส่วนหนึ่งของปัญหาด้วยหรือไม่ เช่นฉันไม่ต้องการที่จะใช้จ่ายเงินใน i7 CPU เท่านั้นที่จะประสบปัญหาเดียวกันแน่นอนและพบว่าฉันต้องเปลี่ยนเมนบอร์ด ...

แนะนำ?


แก้ไข: ความเร็วแรมช้าลงยังคงเกิดข้อผิดพลาด แต่เมื่อการทดสอบถึงรอบที่สาม ฉันรีสตาร์ทการทดสอบโดยมี CPU เพียงตัวเดียวที่ใช้งานได้เพียงเพื่อทดสอบการมีปฏิสัมพันธ์กับ CPU เอง


วิธีเดียวที่จะยืนยันว่าเป็นหน่วยความจำ mobo หรือ cpu คือการทดสอบ ram ในระบบที่เข้ากันได้อื่น
Moab

2
หากปัญหาไม่ได้รับการเคลื่อนย้ายเมื่อคุณย้ายแรมชิปแสดงว่ามาเธอร์บอร์ดเป็นชุด
Joshua

1
เมื่อคุณใช้หน่วยความจำนี้เป็นแบบดูอัลหรือเมื่อคุณมีโมดูล 4 (8g) คุณอาจจะถอด SPD (อัตโนมัติ) และปรับแต่งเวลาเล็กน้อยและทำให้มันใช้งานได้ บอกว่ามันคือ 10,11,10,24 ปรับเป็น 11,12,11,32 และทดสอบแบบนั้นแทน (ใช่นี่คือการคาดเดา) หากใช้งานได้ 100% ไม่หยุดยั้งนั่นอาจเป็นปัญหาความร้อนหรือปัญหาเมนบอร์ดน้อยกว่า ผู้ที่มีโมดูล 4x8gig มีปัญหาที่คุณอธิบายก่อนหน้านี้หากมีการรองรับการปรับแรงดันไฟฟ้าและซีพียูไม่มีหมุดที่งออาจเป็นวิธีที่จะทำให้สิ่งต่าง ๆ ไม่อยู่ในรายการความเข้ากันได้ในการทำงาน ดังนั้นทดสอบและกลับมาหาเรา
Psycogeek

2
"ความเร็วแรมช้าลงยังคงเกิดข้อผิดพลาด แต่เมื่อการทดสอบถึงรอบที่สาม" ในระหว่างนี้คุณกำลังทำขั้นตอนพิเศษเพื่อทดสอบการระบายความร้อนของแรมหรือไม่? แม้แต่พัดลมเพิ่มชั่วคราวหรือพัดลมภายนอกที่เคลื่อนย้ายอากาศผ่านหน่วยความจำและสิ่งควบคุมแรงดันไฟฟ้าสามารถทดสอบเพื่อดูว่าความร้อนเป็นปัญหาอย่างหนึ่งหรือไม่
Psycogeek

@Psycogeek +1 สำหรับการแนะนำการปรับเปลี่ยนเวลา โมดูล RAM บางตัวเล่นได้ไม่ดีเท่าที่ควรสำหรับคนอื่น ๆ (แม้จะเป็นยี่ห้อหรือประเภทโมดูลเดียวกัน) ฉันมีปัญหาคล้ายกับ OP และแก้ไขโดยการตั้งเวลาด้วยตนเอง
Amziraro

คำตอบ:


18

สิ่งนี้ไม่ได้ดูเหมือนว่าองค์ประกอบใด ๆ มีข้อบกพร่อง แต่คุณกำลังใช้ชุดค่าผสมที่เข้ากันไม่ได้

การมีซ็อกเก็ตจำนวนมากบนบัสหน่วยความจำเดียวกันจะเพิ่มความจุในแต่ละบรรทัดข้อมูลและทำให้เวลาการทำงานช้าลงซึ่งอาจทำให้การเปลี่ยนผ่านมาถึงช้าและตรวจสอบผิด ปรากฏการณ์นี้เป็นที่ทราบกันโดยวิศวกรไฟฟ้าว่าเป็น "พัดลมออก"

นี่คือความซับซ้อนเพิ่มเติมเนื่องจากการ fan-out ภายในกับโมดูลหน่วยความจำ จำนวนและโทโพโลยีของอุปกรณ์ DRAM บนโมดูลที่เรียกว่า "อันดับ" จะมีผลต่อจำนวนโมดูลที่คุณสามารถเชื่อมต่อในแบบคู่ขนานได้สำเร็จ

มาเธอร์บอร์ดเซิร์ฟเวอร์ที่รองรับซ็อกเก็ตหน่วยความจำจำนวนมากจำเป็นต้องมีหน่วยความจำบัฟเฟอร์ซึ่งใช้เครือข่ายแบบเรียงซ้อนของบัฟเฟอร์เพื่อ จำกัด พัดลมออก (และความจุดังนั้น) ที่แต่ละคนเห็น มีความล่าช้าเกิดจากตัวบัฟเฟอร์เอง แต่มันจะเพิ่มลอการิทึมตามจำนวนการโหลดเท่านั้นส่วนความจุหน่วยความจำที่ไม่มีบัฟเฟอร์เพิ่มขึ้นเป็นเส้นตรง

Wikipedia กล่าวถึงสิ่งนี้: https://en.wikipedia.org/wiki/Memory_rank

คู่มือมาเธอร์บอร์ดบางรุ่นเรียกสิ่งนี้ออกมา สำหรับคนอื่นคุณสามารถอนุมานข้อมูลจากรายการความเข้ากันได้ของ RAM ตัวอย่างเช่นมาเธอร์บอร์ด ASUS Z170-A แสดงให้เห็นว่าอันดับสอง (เรียกว่า DS = double sided ในคู่มือ) สามารถใช้ได้เฉพาะในสองสล็อตพร้อมกันบนบอร์ดนั้นเท่านั้นซึ่งตรงข้ามกับความสามารถในการใช้ DIMM อันดับเดียวสี่ครั้ง .

ป้อนคำอธิบายรูปภาพที่นี่


สมมติว่านี่เป็นสาเหตุของปัญหามันจะช่วยปิด SPD และปรับการตั้งค่าเวลาให้ช้าลงเล็กน้อยเพื่อชดเชยการเพิ่มขึ้นหรือลดลงของเวลาที่ช้าลงหรือไม่
brhans

1
ฉันไม่แน่ใจว่าสิ่งนี้ถูกต้องจริงหรือไม่ โดยทั่วไปแล้วโปรเซสเซอร์Haswell ของผู้บริโภคจะรองรับหน่วยความจำสี่ระดับต่อช่องสัญญาณซึ่งเพียงพอที่จะอนุญาตให้โมดูลสองด้านสี่ช่องในหน่วยความจำสองช่อง เหตุใดจึงเป็นปัญหา ดูเหมือนว่านี่จะไม่อธิบายความจริงที่ว่าปัญหาเกิดขึ้นเหนือสิ่งกีดขวาง 4 GB เท่านั้น นอกจากนี้คู่มือของเมนบอร์ดระบุว่าชิปเซ็ต B85 ที่รองรับรองรับหน่วยความจำ 32 GB และไม่ได้กล่าวถึงข้อ จำกัด เกี่ยวกับจำนวนหน่วยความจำ
bwDraco

2
@bwDraco: แม้ว่าตัวควบคุมหน่วยความจำจะอยู่บน CPU แต่เมนบอร์ดก็มีความสำคัญเช่นกัน เลย์เอาต์ PCB สามารถส่งผลกระทบต่อมันการจับคู่ความยาวน้อยที่สุดจะลดระยะขอบของสัญญาณ ที่คู่มือเมนบอร์ดไม่ได้พูดถึงอันดับไม่ได้หมายความว่าการรวมกันทั้งหมดได้รับการสนับสนุนก็หมายความว่ามันเป็นคู่มืออึที่ไม่ได้ลงรายละเอียด
Ben Voigt

1
@brhans: ไม่ใช่พารามิเตอร์เวลาที่สำคัญ แต่เป็นความถี่สัญญาณนาฬิกาหน่วยความจำเนื่องจากปัญหาคือการถ่ายโอนระหว่าง CPU และ DIMM ไม่ใช่ภายใน DRAM SPD มักจะมีโปรไฟล์จำนวนหนึ่งที่สอดคล้องกับความถี่สัญญาณนาฬิกาที่แตกต่างกันการเลือกหนึ่งในโปรไฟล์เหล่านี้จะดีกว่าการใช้แบบเต็มรูปแบบ
Ben Voigt

1
ดูเหมือนว่าปัญหาสัญญาณความสมบูรณ์ของเมนบอร์ดแน่นอน โมดูลขนาดใหญ่อาจมีความจุต่อพินสูงกว่าโมดูลขนาดเล็กโดยเฉพาะอย่างยิ่งถ้าโมดูลเหล่านั้นเป็นสองอันดับ ซึ่งอาจทำให้เกิดปัญหานี้เมื่อคุณเติมอันดับทั้งหมด เป็นไปได้ที่โมดูลจะมีมากกว่าหนึ่งอันดับ ดังนั้นอันดับสี่ต่อช่องอาจเป็นโมดูลความหนาแน่นสูงสองระดับได้อย่างง่ายดาย สิ่งนี้อาจทำให้รุนแรงขึ้นโดยคุณสมบัติทางไฟฟ้าและการกำหนดเส้นทางของร่องรอยบนเมนบอร์ด คำแนะนำของฉัน: ลองเมนบอร์ดอื่น
alex.forencich

9

เสียงที่เหมือนเป็นปัญหาในการประมวลผลที่บูรณาการควบคุมหน่วยความจำ

ในระบบที่ทันสมัยมาเธอร์บอร์ดไม่ได้มีบทบาทในการจัดการหน่วยความจำมากไปกว่าการให้เส้นทางระหว่างหน่วยความจำและหน่วยประมวลผลกลาง หน่วยความจำเชื่อมต่อโดยตรงกับโปรเซสเซอร์เพื่อลดเวลาในการตอบสนอง " northbridge " ที่เชื่อมต่อหน่วยความจำกับโปรเซสเซอร์ในระบบเก่าตอนนี้เป็นส่วนหนึ่งของโปรเซสเซอร์ (เฟิร์มแวร์หรือ PCH อาจควบคุมวิธีที่โปรเซสเซอร์ใช้ RAM แต่มันไม่สมเหตุสมผลที่จะทำให้เกิดข้อผิดพลาดบิตของการเรียงลำดับที่คุณอธิบายเนื่องจากท้ายที่สุดมันเป็นความรับผิดชอบของโปรเซสเซอร์) ดังนั้นสิ่งแรกที่ฉันต้องทำคือ d สงสัยในสถานการณ์เช่นนี้เป็น IMC ที่ผิดพลาด

ในความเป็นจริงฉันจะประหลาดใจมากถ้าเมนบอร์ดหรือเฟิร์มแวร์ระบบต้องตำหนิสำหรับปัญหาที่คุณประสบอยู่


แล้วหมุดที่โค้งงอล่ะ?
Michael Hampton

6
@Michael: ขาที่โค้งงอจะส่งผลให้เกิดความล้มเหลวในการทดสอบแต่ละโมดูลด้วย
Ben Voigt

4

ฉันเห็นความคิดเห็นที่ไม่ดีสำหรับ BIOS บนแผงวงจรหลักนั้น ฉันจะเริ่มต้นด้วยการตรวจสอบการอัปเดต BIOS อย่าปล่อยทิ้งไว้บนเมนบอร์ด


ไบออสเป็นปัจจุบัน เป็นที่ยอมรับ RAM ไม่ได้อยู่ในรายการ "ที่ผ่านการรับรอง" แต่มีการกำหนดเวลาเช่นเดียวกับโมดูลอื่น ๆ อีกมากมายที่ระบุไว้ที่นั่น
fdmillion

ฉันจะพิจารณาเปลี่ยนเมนบอร์ดแล้ว ไม่จำเป็นต้องเป็นอันดับต้น ๆ เพียงแค่เริ่มต้นด้วยช่วงราคาที่คุณสามารถจ่ายได้และมองหาสิ่งที่มีความเห็นมากที่สุด (อ่านต่อ) ผู้ที่มีฐานผู้ใช้ที่ใหญ่ที่สุดมีแนวโน้มที่จะสนับสนุน BIOS และชิปเซ็ตอัพเดตในระยะยาว
Atoadaso

คุณตรวจสอบว่าเมนบอร์ดนั้นสามารถจัดการกับหน่วยความจำ 32 GB ในคราวเดียวได้หรือไม่? นอกจากนี้คุณสามารถค้นหาชิปตัวจัดการหน่วยความจำบนเมนบอร์ดและค้นหาจำนวนหน่วยความจำที่คาดว่าจะสามารถจัดการได้อย่างเหมาะสม
milesrf

1

เป็นไปได้ว่า RAM อาจมีข้อผิดพลาดเช่นกันแม้ว่าอาจไม่ปรากฏก็ตาม ฉันมีปัญหาเมื่อเร็ว ๆ นี้กับเซิร์ฟเวอร์ที่บ้านของฉันเกี่ยวกับอุบัติเหตุร้ายแรงกับชาเย็น ...

ฉันผ่านกระบวนการทั้งหมดในการแทนที่แต่ละส่วนแยกกัน (2 ซีพียู, mobo, พาวเวอร์ซัพพลาย, และ 2 แบ๊งค์ 16 GB (2x8GB) RAM) และทุกอย่างทดสอบได้ดีเมื่อฉันเพิ่งใช้ RAM ของธนาคารเดียวกับซีพียูตัวเดียว (ยกเว้น 1 CPU ซึ่งเป็นขนมปังปิ้ง)

มันไม่สำคัญว่าจะใช้การกำหนดค่าแบบใดมันใช้งานได้เสมอเมื่อฉันมี CPU และแบนด์วิธเดียว (ไม่ว่าจะเป็น 16GB หรือ 32GB ของ RAM) แต่เมื่อฉันใส่ CPU ตัวที่ 2 และแบ่ง RAM ดังนั้นมันจึงเป็น 16GB ต่อธนาคารเซิร์ฟเวอร์ไม่สามารถบูตได้

มันไม่ได้จนกว่าฉันจะเปลี่ยนหนึ่ง RAM ของธนาคารจนเสร็จสมบูรณ์ในที่สุดมันก็บู๊ตและรันได้ในที่สุดและนับตั้งแต่นั้นมา

tl; dr : ตามที่ @moab ระบุไว้ในความคิดเห็นของเขาคุณจะไม่สามารถบอกได้อย่างแน่นอนจนกว่าคุณจะทดสอบทุกองค์ประกอบในระบบที่เข้ากันได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.