บนเซิร์ฟเวอร์ CPU คู่มันเป็นเรื่องปกติหรือไม่ที่ CPU ตัวใดตัวหนึ่งจะทำงานร้อนกว่าอีกซีพียู?


51

ฉันมีเซิร์ฟเวอร์ Opteron คู่ที่ใช้ Linux กับ libvirt เพื่อโฮสต์ VMs หลายตัว VM ทำงานได้ดีและเซิร์ฟเวอร์ประมวลผลตกลง แต่ฉันสังเกตเห็นว่า CPU ตัวใดตัวหนึ่งทำงานอยู่ที่ 69C (throttles ที่ 70C) เสมอและตัวอื่น ๆ จะทำงานประมาณ 15C

นี่มันไม่ปกติหรอกเหรอ? พวกเขาทั้งคู่ไม่ควรอยู่ในอุณหภูมิที่ใกล้กว่านี้หรือ

ฉันไม่แน่ใจว่าจะทำอย่างไรต่อไป อาจมีความร้อนวางไม่เพียงพอในซีพียูตัวใดตัวหนึ่ง?

แก้ไข: เมนบอร์ดคือASUS KGPE-D16และระบายความร้อนด้วยแฟน Noctua NH-U9DOคู่

โปรดทราบว่าฉันคิดว่าอุณหภูมิอาจลดลงเหนือบรรยากาศโดยรอบมากกว่าค่าสัมบูรณ์ เมื่อเซิร์ฟเวอร์ไม่ทำงานอุณหภูมิของ CPU จะลดลงถึง 2C และ 13C ฉันใช้การกำหนดค่า lmsensors จากที่นี่


1
ยี่ห้อ / รุ่นของเซิร์ฟเวอร์คืออะไร
ewwhite

2
การกระจายโหลด CPU เป็นอย่างไร mpstat -P ALL 1ใน linux จะช่วย
Christopher Perrin

3
ฟังดูเหมือนเซ็นเซอร์วัดอุณหภูมิแตก
matcheek

14
15C มีแนวโน้มว่าจะมีเซ็นเซอร์ตรวจจับที่เสียหายมาก ....
เข้ามา

ดูเหมือนว่าเซ็นเซอร์ที่เสียหรือปรับเทียบไม่ดีหากคุณสามารถรีบูตเซิร์ฟเวอร์ลองดูที่ BIOS ซึ่งควรแสดงค่าที่ถูกต้อง

คำตอบ:


106

ปัญหาก็คือฮีทซิงค์แบบไม่ดีพอ บางทีแบบไม่ดีอาจไม่ใช่คำอธิบายที่ถูกต้อง กลับกลายเป็นว่าคุณต้องวางแผ่นระบายความร้อนบนฮีทซิงค์ไม่ใช่ฝาครอบพลาสติกที่อยู่เหนือฮีทซิงค์

ป้อนคำอธิบายรูปภาพที่นี่

หลังจากถอดฝาครอบพลาสติกแล้วซีพียูก็ยอดเยี่ยมและเจ๋งขอบคุณทุกคน!


51
+1 เพียงเพราะมันตลก
HBruijn

9
คุณหมายถึงใครบางคนทิ้งฝาพลาสติกไว้แล้ววางแปะไว้แล้ววางฮีทซิงค์ลงบนนั้น? มหากาพย์
TomTom

4
Baaaaaahaaahaaahahahaa !!
เคร็ก

8
ฉันชอบที่คุณสามารถดูข้อกำหนดและเงื่อนไขการรับประกันแบบ จำกัด และนโยบายการคืนสินค้าในพื้นหลัง :)
การแข่งขัน Lightness กับโมนิก้า

6
ถ้ามันทำให้คุณรู้สึกงี่เง่าน้อยลง (และมันจะไม่เกิดขึ้น) ฉันก็ทำสิ่งที่คล้ายกันกับเครื่องชงกาแฟในสำนักงานแห่งใหม่ของฉัน กาแฟเย็นเกินไปที่จะดื่มและฉันก็บรรจุมันกลับขึ้นสำหรับการกลับมาที่ร้านก่อนดิสก์ของกระดาษแข็งป้องกันลดลงปิดองค์ประกอบความร้อน :)
มาร์ตินเจมส์

25

จากประสบการณ์ของฉันมันเป็นเรื่องปกติสำหรับส่วนประกอบที่จับคู่ในกรณีที่ทำงานที่อุณหภูมิแตกต่างกันเนื่องจากการไหลของอากาศไม่เหมือนกันทุกที่ นี่คือกราฟอุณหภูมิ HDD จากกล่อง colo ของฉัน ไดรฟ์ถูกทำมิเรอร์ดังนั้นปริมาณงานบนไดรฟ์จึงใกล้เคียงกัน

กราฟ munin ของ HDD temps ปีที่ผ่านมา

อย่างที่คุณเห็นพวกเขาติดตามซึ่งกันและกัน แต่ไม่เหมือนกัน พวกเขายังโดยเฉลี่ยเพียง 6C เท่านั้น ไม่ว่าเซ็นเซอร์ของคุณจะรายงานอุณหภูมิสัมบูรณ์หรืออุณหภูมิสูงเกินไปความแตกต่างของ 55C ภายใต้โหลดดูเหมือนผิดอย่างมาก หากคุณมีความมั่นใจว่าข้อมูลถูกต้องจากนั้นความแตกต่างที่นิ่งเฉยจะลดลงถึง 10C ซึ่งเป็นความแตกต่างที่ฉันเห็นเนื่องจากการไหลของอากาศฉันสงสัยว่าฮีทซิงค์ที่ติดตั้งไม่ดี


1
ใช้ mpstat (จากคริสโตเฟอร์เพอร์รินขอบคุณ!) ฉันยืนยันว่าโหลดนั้นกระจายอย่างเท่าเทียมกัน ตอนนี้สิ่งต่าง ๆ กำลังไม่ทำงานที่ + 3C และ + 20C ฉันจะลองเล่นซอกับฮีทซิงค์เพื่อดูว่ามันหลวมหรือไม่ คุณคิดว่าอาจเป็นปัญหาวางความร้อนหรือไม่
samoz

นั่นเป็นไปได้มาก (และอื่น ๆ อีกมากมายหลังจากที่คุณเริ่มเล่น)
MadHatter

8

มันไม่ใช่. หากคุณไม่มีปัญหาร้ายแรงเกี่ยวกับการไหลเวียนของอากาศ หรือหนึ่งในเครื่องทำความเย็นไม่ดี อุณหภูมิจะแตกต่างกัน - แต่ไม่มาก (70 กับ 15 องศาเซลเซียส)

เมื่อพิจารณาถึงระดับต่ำสุดที่ 15 องศาฉันจะถือว่า (a) เซ็นเซอร์ของคุณปิด (คุณเก็บเซิร์ฟเวอร์ไว้ในห้องเย็นจริงหรือ?)

ฉันจะถือว่าซีพียูตัวหนึ่งใช้งานได้ไม่ว่าด้วยเหตุผลใดก็ตาม

ความแตกต่างเล็กน้อยเป็นเรื่องปกติ บางอันที่มีขนาดใหญ่กว่าเล็กน้อยอาจเป็น (การไหลของอากาศเข้ามาในความคิดของฉัน) แต่ที่นี่เราพูดถึงสิ่งหนึ่งที่เป็นเย็น


2

นี่อาจเป็นการระบายความร้อนหรือการโหลดที่ไม่สม่ำเสมอ (เนื่องจากอุณหภูมิที่แตกต่างสถานการณ์ของคุณอาจจะไม่สม่ำเสมอ) คุณควรใช้บางอย่างเช่น prime95 เพื่อโหลดแกนทั้งหมดอย่างเท่าเทียมกันและดูว่าอุณหภูมิยังคงแตกต่างกันหรือไม่ หากไม่มีคุณจำเป็นต้องปรับแต่ง VM ให้ตรวจสอบว่าแอพของคุณมีหลายเธรดและไม่ว่าง วิธีการทำนั้นขึ้นอยู่กับซอฟต์แวร์และปริมาณงานของแต่ละบุคคลดังนั้นจึงอยู่นอกเหนือขอบเขตของคำถามจริงๆ โปรดทราบว่าไม่มีข้อได้เปรียบที่แท้จริงในการทำเช่นนี้หากคุณไม่มีโหลดเพียงพอที่จะเติมซีพียู / คอร์เดียวในความเป็นจริง VM ของคุณอาจจงใจหลีกเลี่ยงการใช้ซีพียูตัวที่สองเพื่อให้สามารถเข้าสู่โหมดประหยัดพลังงานได้ - ระบบซีพียู

หากคุณได้แคบลงเพื่อระบายความร้อน ความแตกต่างเล็ก ๆ น้อย ๆ ของ 10C อาจเป็นความร้อนน้อยเกินไป (หรือมากเกินไป!) ความแตกต่างที่ใหญ่กว่าบ่งบอกถึงปัญหาหรือความแตกต่างที่สำคัญระหว่างตัวทำความเย็นซีพียู อาจเป็นไปได้ว่ามีการปิดกั้นการไหลของอากาศฮีทซิงค์ถูกทำให้หลวม ฯลฯ


0

ฉันจะต้องเห็นด้วยกับอุณหภูมิที่บกพร่อง เซ็นเซอร์เนื่องจาก 15C เพียง 59F !!! ฉันจะจินตนาการว่าอุณหภูมิของอากาศแวดล้อมจะสูงกว่า 59F ถ้าหากคอมพิวเตอร์ไม่อยู่ในดาต้าเซ็นเตอร์ที่เยือกเย็นอย่างยิ่ง คุณพยายามกำหนด VM ให้กับแกนอุณหภูมิต่ำและดูว่ามีการเปลี่ยนแปลงหรือไม่ ถ้าไม่ฉันก็จะสงสัยว่าเซ็นเซอร์มีความผิดปกติอย่างมาก

คุณอาจต้องการดูผลลัพธ์ของdmesg(ข้อความบูต) และดูว่ามีอะไรผิดปกติหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.