จะสามารถพิสูจน์ได้หรือไม่ว่าการใช้ GPU ที่อุณหภูมิสูงนั้นไม่ดีต่อการ์ด?


11

หากคุณเรียกใช้กราฟิกการ์ดของคุณอย่างต่อเนื่องที่ระหว่าง 80 ° C และ 90 ° C (176 ° F และ 194 ° F) จริง ๆ แล้วมันไม่ดีสำหรับการ์ดกราฟิกหรือไม่ มันลดอายุการใช้งานการ์ดหรือไม่ สิ่งนี้สามารถพิสูจน์ได้? หรือมันเป็นเพียงแค่สมมติฐาน?

ฉันเข้าใจว่าการปิดระบบความปลอดภัยสำหรับ GPU นั้นปกติ 90 ° C (194 ° F)


'การปิดระบบความปลอดภัย' ขึ้นอยู่กับสถานที่ที่มีการวัดอุณหภูมิและกระบวนการและอุณหภูมิสูงสุดที่วงจรถูกออกแบบด้วย ฉันจำได้ว่าในขณะที่ซีพียู Intel รุ่นหนึ่งมีอุณหภูมิสูงสุดที่ 110 ° C ซึ่งผู้ที่ชื่นชอบฮาร์ดแวร์บางคนกังวลเพราะพวกเขาคิดว่าชิปจะทำลายตัวเอง สปอยเลอร์: พวกเขาไม่ได้
Joren Vaes

1
ผมคิดว่าคำถามนี้เป็นเรื่องที่เกี่ยวข้องอย่างมากกับเรื่องนี้คำถามอื่น ๆIC-ผลิตภัณฑ์อายุการใช้งานตามที่ฟังก์ชั่นของทางแยกอุณหภูมิ บรรทัดล่างจากคำถามนั้นคือทุก ๆ 15 ° C เหนืออุณหภูมิห้องลดลงครึ่งหนึ่งของอายุขัยของ IC ดังนั้นการใช้กราฟิกการ์ดที่ 90 ° C เมื่อเทียบกับ 80 ° C จะลดอายุการใช้งานลง ~ 37% (ดังนั้นหากอายุการใช้งานคือ 8 ปีที่มี 80 ° C ก็คือ ~ 5 ปีกับ 90 ° C แทน)
Harry Svensson

1
Arhennius Law นั้นมีค่า MTBF / 10'C ต่ำกว่า 50% แต่มีปัจจัยอื่น ๆ ที่ต้องพิจารณาสำหรับ dielectrics โดยที่พวกเขาเริ่มต้นด้วย MTBF ที่ต่ำกว่ามากเช่น 1000 h @ 85h หรือ 105h ดังนั้นฉันสงสัยว่าพวกเขาใช้หมวกที่มีระดับ 105'C หรือ ดีกว่า
Tony Stewart Sunnyskyguy EE75

คำตอบ:


21

ให้เราศึกษากลไกความล้มเหลวและดูว่าพวกเขาได้รับผลกระทบจากความร้อนอย่างไร มันสำคัญมากที่ต้องจำไว้ว่าเพียงเพราะกลไกความล้มเหลวเกิดขึ้นเร็วขึ้นเมื่ออุณหภูมิสูงขึ้น GPU จะไม่จำเป็นต้องล้มเหลวเร็วกว่านี้! หากส่วนประกอบย่อยที่มีอายุ 100 ปีที่อุณหภูมิห้องเพียง 20 ปีหากเป็นองค์ประกอบร้อน แต่ส่วนประกอบย่อยอื่นจะใช้เวลา 1 ปีในการเริ่มต้นด้วย (แต่ไม่ได้รับผลกระทบจากความร้อน) อายุการใช้งานของผลิตภัณฑ์ของคุณจะเปลี่ยนแทบจะไม่ อุณหภูมิ.

ฉันจะเพิกเฉยต่อปัญหาการขี่จักรยานที่ไซเมียนพูดถึงเพราะนี่ไม่ใช่ความเชี่ยวชาญของฉัน

ในระดับบอร์ดฉันสามารถนึกถึงส่วนประกอบหลักหนึ่งที่จะ 'แตก' ได้ด้วยหัว: ตัวเก็บประจุด้วยไฟฟ้า ตัวเก็บประจุเหล่านี้จะแห้งและเป็นที่เข้าใจกันดีว่ามันจะแห้งเร็วขึ้นเมื่อใช้ความร้อน (ตัวเก็บประจุแทนทาลัมมีแนวโน้มที่จะมีอายุการใช้งานสั้นลง แต่ฉันไม่รู้ว่าสิ่งนี้เปลี่ยนแปลงไปอย่างไรด้วยความร้อน)

แล้วซิลิคอนล่ะ?

ที่นี่ฉันเข้าใจแล้วมีบางสิ่งที่สามารถทำให้เกิดความล้มเหลวได้ หนึ่งในคนหลักที่นี่คือการตรวจด้วยไฟฟ้า ในวงจรอิเล็กตรอนที่ผ่านชิ้นส่วนของโลหะจะเคลื่อนที่ไปรอบ ๆ อะตอม สิ่งนี้อาจแย่มากจนทำให้เกิดช่องว่างในตัวนำซึ่งจะนำไปสู่ความล้มเหลวได้

ภาพนี้แสดงภาพประกอบที่ดี (จาก Tatiana Kozlova, Henny W. Zandbergen; การสังเกตอิมมิเกรชั่นอิมมิเกรชั่นในแหล่งกำเนิด TEM ใน Ni nanob ตลับ):

ป้อนคำอธิบายรูปภาพที่นี่

กระบวนการนี้เพิ่มขึ้นอย่างทวีคูณกับอุณหภูมิและแน่นอนชิปจะมีอายุการใช้งานน้อยลงหากอุณหภูมิสูงขึ้นและการเกิดคลื่นแม่เหล็กไฟฟ้าเป็นสาเหตุหลักของความล้มเหลว

กลไกของ Anther คือการสลายตัวของออกไซด์ซึ่งภายในวงจรทรานซิสเตอร์จะได้รับการชกประตูทะลุ นี่ก็ขึ้นอยู่กับอุณหภูมิ อย่างไรก็ตามแรงดันไฟฟ้ามีผลกระทบมากขึ้นที่นี่

นอกจากนี้ยังมี VT shift ซึ่งอาจเกิดจากการเจือจางของสารเจือปนหรือเนื่องจากการฉีดด้วยความร้อน สิ่งเจือปนลอยเพิ่มขึ้นตามอุณหภูมิ (แต่ไม่น่าจะเป็นปัญหาโดยเฉพาะกับวงจรดิจิตอลเนื่องจากเป็นกระบวนการที่ช้ามาก) ฉันไม่แน่ใจเกี่ยวกับการพึ่งพาอุณหภูมิของการฉีดร้อน - พาหะ แต่ฉันคิดว่าแรงดันไฟฟ้าอีกครั้งเป็นปัจจัยสำคัญมากที่นี่

แต่มีคำถามที่สำคัญคือสิ่งนี้ลดอายุขัยลงเท่าไหร่? เมื่อรู้สิ่งนี้คุณควรตรวจสอบให้แน่ใจว่าการ์ดกราฟิกของคุณเย็นตลอดเวลาหรือไม่ ฉันเดาว่าไม่ได้ยกเว้นว่ามีข้อผิดพลาดเกิดขึ้นในขั้นตอนการออกแบบ วงจรได้รับการออกแบบโดยคำนึงถึงสถานการณ์ที่เลวร้ายที่สุดเหล่านี้และทำให้สามารถอยู่รอดได้หากถูก จำกัด ให้มีอายุการใช้งานสูงสุดของผู้ผลิต ในกรณีของผู้คนที่โอเวอร์คล็อกวงจร: แรงดันไฟฟ้าที่เพิ่มขึ้นพวกเขามักจะใช้เพื่อให้วงจรมีเสถียรภาพ (เนื่องจากสามารถเพิ่มความเร็วของวงจรให้สูงขึ้นได้) จะเป็นอันตรายมากกว่าอุณหภูมิเอง นอกจากนี้แรงดันไฟฟ้าที่เพิ่มขึ้นจะนำไปสู่การเพิ่มขึ้นของกระแสไฟฟ้าซึ่งจะช่วยเร่งปัญหาด้านอิเล็ก


2
นั่นเป็นภาพที่น่าอัศจรรย์ฉันสงสัยมาตลอดว่าอิเล็คตรอนมิกชั่นชั่นจะมีหน้าตาเป็นอย่างไร
Cursorkeys

9

ใช่มันได้รับการพิสูจน์แล้วว่าความร้อนลดส่วนประกอบทางไฟฟ้า โลหะขยายตัวเมื่อพวกเขาร้อนขึ้นประสาน (ใช้สำหรับการเชื่อมต่อวงจรไฟฟ้า) เป็นโลหะผสมดังนั้นมันจะขยายตัวเมื่อร้อนขึ้น ความร้อนและความเย็นที่คงที่จะทำให้ข้อต่อขยายตัวและหดตัวซึ่งอาจนำไปสู่การแตกร้าวและความล้มเหลวของข้อต่อในที่สุด

                                                      กราฟของอัตราความล้มเหลวเทียบกับอุณหภูมิ

กราฟข้างต้นแสดงให้เห็นว่าArrhenius'Lawจะช่วยให้ความสัมพันธ์ระหว่างการเพิ่มขึ้นในความร้อนและความล้มเหลวของเซมิคอนดักเตอร์ บทความนี้ให้รายละเอียดผลกระทบของความร้อนต่อชิ้นส่วนอิเล็กทรอนิกส์ มันเกี่ยวข้องกับสิ่งต่าง ๆ ในระดับอิเล็กตรอนมากขึ้นซึ่งอยู่นอกขอบเขตความรู้ของฉัน


1
ฉันเชื่อได้ว่าการปั่นจักรยานไม่ดีเนื่องจากคุณบอกว่าการขยายตัวและการหดตัว แต่มีปัญหากับการทำงานที่โหลดสูงและทำให้อุณหภูมิสูงตลอดเวลาหรือไม่
โคลิน

ฉันเป็นนักออกแบบ IC ดังนั้นฉันมีความรู้เพียงเล็กน้อยเกี่ยวกับโหมดความล้มเหลวระดับบอร์ด แต่ในทุกครั้งที่ฉันแก้ไขสิ่งต่าง ๆ (เป็นงานอดิเรก) ฉันยังต้องเจอกับความล้มเหลวเนื่องจากการปั่นจักรยานแบบขยายดังนั้นฉันต้องถามความสำคัญ มันถูกเปรียบเทียบกับกลไกอื่น ๆ
Joren Vaes

1
@ Colin ไม่มีสิ่งเช่น "โหลดสูงตลอดเวลา"; นอกเสียจากว่าคุณเป็นเพียงการขุด bitcoin บน GPU ของคุณจะมีเพียงไม่กี่วินาทีที่มีการโหลดมากกว่าคนอื่น ๆ ด้วยการระบายความร้อนจะต้องมีประสิทธิภาพใน GPU ค่อนข้างจะนำไปสู่ปัญหาที่กล่าวถึงแล้ว ดู: XBox วงแหวนแห่งความตาย
Marcus Müller

@ MarcusMüllerมีอยู่อย่างแน่นอน และไม่สำคัญว่าการโหลดไม่คงที่อย่างแน่นอน สำหรับการขี่จักรยาน temp เดลต้าเป็นสิ่งสำคัญ การ์ดที่ทำงาน 99% ของเวลาที่โหลด 95-100% (เช่นคำนวณ) ภายใน temps ที่ออกแบบจะมีความเสี่ยงต่อความเสียหายจากการปั่นจักรยานน้อยกว่าการ์ดเดียวกันที่สั่นระหว่าง 0% ถึง 100% อย่างรุนแรง 50% ของ ถ้า (เช่นเกม)
Dan M.

6

ความสัมพันธ์ระหว่างการเพิ่มขึ้นของอุณหภูมิทางแยกของเซมิคอนดักเตอร์และการลดลงของ MTBF (เวลาเฉลี่ยระหว่างความล้มเหลว) เป็นที่เข้าใจกันดี

หมายเหตุทางเทคนิคจากไมครอนพูดถึงเรื่องนี้

ในทางปฏิบัติอัตราความล้มเหลวจะเพิ่มขึ้นเป็นทวีคูณเมื่ออุณหภูมิทางแยกเข้าใกล้และเกิน ~ 125˚Cดังนั้นหากคุณทำงานต่ำกว่าอุณหภูมิที่เพิ่มขึ้นเล็กน้อยอาจไม่สำคัญ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.