ทำไมชิปเริ่มทำงานผิดปกติเมื่อพวกเขาร้อนมากเกินไป?


26

เมื่อชิปมีความร้อนสูงเกินไปก็สามารถเริ่มทำงานผิดพลาดได้ตัวอย่างเช่นหลายโปรแกรมอาจเริ่มทำงานล้มเหลวเมื่อชิ้นส่วนบางส่วนหรือทั้งหมดในคอมพิวเตอร์มีความร้อนสูงเกินไป

เกิดอะไรขึ้นที่ทำให้ชิปทำงานผิดปกติเมื่อมีความร้อนสูงเกิน

คำตอบ:


26

เพื่อขยายคำตอบอื่น ๆ

  1. กระแสการรั่วไหลที่สูงขึ้น: สิ่งนี้สามารถนำไปสู่ปัญหาการให้ความร้อนได้มากขึ้น
  2. การปันส่วนสัญญาณรบกวนจะลดลงเมื่อเสียงรบกวนจากความร้อนเพิ่มขึ้น : ซึ่งอาจส่งผลให้อัตราข้อผิดพลาดบิตสูงขึ้นซึ่งจะทำให้โปรแกรมถูกอ่านผิดและคำสั่งถูกตีความผิด สิ่งนี้อาจทำให้เกิดการดำเนินการ "สุ่ม"
  3. สารเจือปนกลายเป็นมือถือที่มีความร้อนมากขึ้น เมื่อคุณมีชิปที่ร้อนจัดจนเกินไปทรานซิสเตอร์สามารถหยุดเป็นทรานซิสเตอร์ได้ สิ่งนี้ไม่สามารถย้อนกลับได้
  4. ความร้อนที่ไม่สม่ำเสมอสามารถทำให้โครงสร้างของ Si แตกตัวได้ คนปกติสามารถสัมผัสได้โดยใส่กระจกผ่านการกระแทกที่อุณหภูมิ มันจะแตกเป็นเสี่ยง ๆ แต่มันแสดงให้เห็นถึงประเด็น สิ่งนี้ไม่สามารถย้อนกลับได้
  5. ความทรงจำ ROM ที่ขึ้นอยู่กับแผ่นแยกที่มีประจุจะทำให้สูญเสียความทรงจำเมื่ออุณหภูมิเพิ่มขึ้น พลังงานความร้อนถ้าสูงพอที่จะทำให้อุปกรณ์อิเล็กทรอนิกส์สามารถหลบหนีตัวนำที่มีประจุได้ นี่อาจทำให้หน่วยความจำของโปรแกรมเสียหาย สิ่งนี้เกิดขึ้นกับฉันในระหว่างการบัดกรี IC ที่ตั้งโปรแกรมไว้แล้วเมื่อมีคนใส่ชิปมากเกินไป
  6. การสูญเสียการควบคุมทรานซิสเตอร์: ด้วยพลังงานความร้อนเพียงพออิเล็กตรอนของคุณสามารถกระโดด bandgap เซมิคอนดักเตอร์เป็นวัสดุที่มี bandgap ขนาดเล็กเพื่อให้สามารถเชื่อมต่อกับสารเจือปนได้ง่าย แต่มีขนาดใหญ่พอที่อุณหภูมิการทำงานที่ต้องการจะไม่เปลี่ยนเป็นตัวนำที่ช่องว่างมีขนาดเล็กลงจากนั้นพลังงานความร้อนของวัสดุ นี่คือการทำให้ใหญ่เกินไปและเป็นพื้นฐานของการโพสต์อื่น แต่ฉันต้องการที่จะเพิ่มและวางไว้ในคำพูดของฉันเอง

มีเหตุผลเพิ่มเติม แต่สิ่งเหล่านี้ทำให้มีความสำคัญน้อย


ดูเหมือนว่าการล้มเหลวของเวลาจะเป็นหนึ่งใน "เหตุผลเพิ่มเติม" (ความต้านทานลวดมีแนวโน้มที่จะเพิ่มขึ้นตามอุณหภูมิดังนั้นเส้นทางเวลา จำกัด ความต้านทาน - ความจุอาจละเมิดเวลาที่เลวร้ายที่สุดที่รับประกันได้) แน่นอน DRAM ยังมีการรั่วไหลของประจุ (เช่นหน่วยความจำแฟลช) ได้เร็วขึ้นที่อุณหภูมิสูงขึ้น โดยไม่มีการชดเชยข้อมูลอัตราการรีเฟรชสามารถสูญหายได้
Paul A. Clayton

13

ปัญหาหลักของการทำงานด้วย IC ที่อุณหภูมิสูงคือการรั่วไหลของทรานซิสเตอร์แต่ละตัวเพิ่มขึ้นอย่างมาก กระแสรั่วไหลอาจเพิ่มขึ้นในระดับที่ระดับแรงดันสวิตช์ของอุปกรณ์ได้รับผลกระทบดังนั้นสัญญาณไม่สามารถแพร่กระจายได้อย่างถูกต้องภายในชิปและหยุดทำงาน พวกเขามักจะกู้คืนเมื่อได้รับอนุญาตให้เย็นลง แต่นั่นไม่ใช่กรณี

กระบวนการผลิตสำหรับการทำงานที่อุณหภูมิสูง (สูงถึง 300C) ใช้เทคโนโลยี CMOS แบบซิลิกอน - อิน - ฉนวนเนื่องจากการรั่วที่ต่ำในช่วงอุณหภูมิที่กว้างมาก


9

นอกจากคำตอบที่ยอดเยี่ยมเพียงหนึ่งเดียว: ในทางเทคนิคแล้วมันไม่ได้เป็นสารเจือปนที่ได้รับโทรศัพท์มือถือมากกว่า แต่เป็นการเพิ่มความเข้มข้นของผู้ให้บริการ หากสิ่งใดที่สารเจือปน / พาหะมีการเคลื่อนที่น้อยลงเนื่องจากซิลิคอนคริสตัลขัดแตะเริ่ม "สั่น" เนื่องจากพลังงานความร้อนที่เพิ่มขึ้นทำให้อิเล็กตรอนและหลุมไหลผ่านอุปกรณ์ยากขึ้น - การกระจายโฟตอนแสงฉันเชื่อว่า phsyics เรียกมัน แต่ฉันอาจ จะผิด.

เมื่อความเข้มข้นของพาหะภายในเพิ่มขึ้นเกินระดับยาสลบคุณจะสูญเสียการควบคุมอุปกรณ์ไฟฟ้า ผู้ให้บริการที่แท้จริงคือผู้ที่มีอยู่ก่อนที่เราจะวางจำหน่ายซิลิคอนความคิดของเซมิคอนดักเตอร์คือเราเพิ่มผู้ให้บริการของเราเองในการสร้าง pn junctions และสิ่งที่น่าสนใจอื่น ๆ ที่ทรานซิสเตอร์ทำ ซิลิคอนออกมาประมาณ 150degC ดังนั้น heat sinking RF และตัวประมวลผลความเร็วสูงจึงมีความสำคัญมากเนื่องจาก 150degC นั้นไม่ได้ยากเกินกว่าที่จะบรรลุในทางปฏิบัติ มีการเชื่อมโยงโดยตรงระหว่างความเข้มข้นของตัวพาภายในและการรั่วไหลของกระแสของอุปกรณ์

เช่นเดียวกับชิปอื่น ๆ ที่แสดงให้เห็นว่านี่เป็นเพียงหนึ่งในเหตุผลที่ชิปไม่ผ่าน - มันสามารถทำให้บางอย่างเรียบง่ายเหมือนสายไฟที่ร้อนเกินไปและปะทุมันเป็นแผ่นมีหลายสิ่งหลายอย่าง


เมื่อฉันบอกว่าสิ่งเจือปนกลายเป็นโทรศัพท์มือถือฉันหมายถึงอะตอมทางกายภาพไม่ใช่ผู้ให้บริการ ทางแยก PN สามารถลอยและหยุดไดโอดด้วยเวลาและความร้อน ประการที่สองเมื่อคุณได้อุณหภูมิพลังงานความร้อนสูงขึ้นซึ่งสร้างทั้งโฟนันพลังงานสูงที่มีปฏิสัมพันธ์กับอิเล็กตรอนและระดับ IR สูงกว่าภายในโครงสร้างสามารถให้อิเล็กตรอนพลังงานสูงพอที่จะข้ามช่องว่างระหว่างชั้นการนำและเวเลนซ์ . Si ออกมาดีเพราะ bandgap นั้น 150degC จะให้อิเล็กตรอนสามารถกระโดดได้
Kortuk

ใช่ฉันคิดว่าเรากำลังพูดสิ่งเดียวกันจากจุดเริ่มต้นที่แตกต่างกัน
SimonBarker

1
วิธีที่คุณอธิบายมันฟังดูเป็นอย่างที่ฉันต้องการหลังจากใช้ฟิสิกส์ของอุปกรณ์หลังจากใช้อุปกรณ์ควอนตัมและโซลิดสเตตที่ใช้แล้วฉันพูดว่ามันแตกต่างกันเล็กน้อย แต่เราทั้งคู่ต่างก็รู้ว่าคำอธิบายเหล่านี้ ฉันได้เพิ่มเล็กน้อยเกี่ยวกับสิ่งนี้ส่งผลกระทบต่อคำตอบของฉันเนื่องจากฉันคิดว่ามันสำคัญมากฉันให้ +1 แรกของคุณซึ่งคุณสมควรได้รับ นี่เป็นผลกระทบที่สำคัญเนื่องจากจะนำไปสู่การระบายความร้อนอย่างรวดเร็ว
Kortuk

8

แม้ว่ากระแสการรั่วไหลเพิ่มขึ้นฉันคาดว่าปัญหาที่ใหญ่กว่าสำหรับอุปกรณ์ที่ใช้ MOS หลายตัวคือปริมาณกระแสไฟฟ้าที่ผ่านทรานซิสเตอร์ MOS ในสถานะ "เปิด" จะลดลงเมื่ออุปกรณ์ร้อน เพื่อให้อุปกรณ์ทำงานได้อย่างถูกต้องทรานซิสเตอร์ที่สลับโหนดจะต้องสามารถชาร์จหรือคายประจุประจุใด ๆ ที่แฝงอยู่ในส่วนนั้นของวงจรก่อนที่สิ่งอื่นใดจะขึ้นอยู่กับโหนดนั้นที่ถูกเปลี่ยน การลดความสามารถในการส่งผ่านกระแสของทรานซิสเตอร์จะลดอัตราที่สามารถประจุหรือปล่อยโหนดได้ หากทรานซิสเตอร์ไม่สามารถชาร์จหรือปล่อยโหนดได้อย่างเพียงพอก่อนที่ส่วนอื่นของวงจรจะขึ้นอยู่กับโหนดนั้นที่ได้รับการสลับวงจรจะทำงานผิดปกติ

โปรดทราบว่าสำหรับอุปกรณ์ NMOS มีการออกแบบการแลกเปลี่ยนเมื่อปรับขนาดทรานซิสเตอร์แบบพาสซีฟแบบพาสซีฟ ยิ่งการดึงข้อมูลแบบพาสซีฟยิ่งใหญ่เท่าไรโหนดก็ยิ่งสามารถสลับจากต่ำไปสูงได้เร็วขึ้น แต่ยิ่งใช้พลังงานมากขึ้นจะสิ้นเปลืองเมื่อใดก็ตามที่โหนดอยู่ในระดับต่ำ อุปกรณ์ดังกล่าวจำนวนมากได้รับการดำเนินการค่อนข้างใกล้กับขอบของการทำงานที่ถูกต้องและความผิดปกติที่เกิดจากความร้อน (และสำหรับอุปกรณ์อิเล็กทรอนิกส์โบราณยังคงอยู่) เป็นเรื่องธรรมดา สำหรับอุปกรณ์อิเล็กทรอนิกส์แบบ CMOS ทั่วไปปัญหาดังกล่าวมักจะรุนแรงน้อยกว่า ฉันไม่มีความคิดในทางปฏิบัติเท่าที่พวกเขามีส่วนร่วมในสิ่งต่าง ๆ เช่นตัวประมวลผล multi-GHZ


2
นี่เป็นผลกระทบที่สำคัญมากฉันกำลังขอให้ Kortuk เพิ่มคำตอบของเขา หนึ่งในปัจจัยที่อยู่เบื้องหลังสเป็คสูงสุดของ Tj สำหรับโปรเซสเซอร์คือเหนือ Tj โปรเซสเซอร์อาจไม่ทำงานที่ความเร็วที่กำหนด นี่คือเหตุผลที่การระบายความร้อนที่ดีกว่าช่วยในการโอเวอร์คล็อก
Andy

ย่อหน้าแรกคือสาเหตุที่คอมพิวเตอร์ของคุณหยุดทำงานเมื่อเครื่องร้อน - ช้าลงมากเกินไปเพื่อให้ทันกับความถี่สัญญาณนาฬิกา
W5VO

ที่จริงแล้วมีอีกปัจจัยหนึ่งที่อาจมีบทบาทในอุปกรณ์ NMOS แม้ว่าฉันจะไม่คาดหวังว่ามันจะเป็นแบบทั่วไป: อุปกรณ์ NMOS จำนวนมากมีความเร็วสัญญาณนาฬิกาต่ำสุดซึ่งกำหนดโดยความต้องการใช้หรือรีเฟรชข้อมูลในโหนดหน่วยเก็บข้อมูลแบบไดนามิก ก่อนที่มันจะถูกระบายออกจากการรั่วไหล หากกระแสรั่วไหลเพิ่มขึ้นตามอุณหภูมิความเร็วสัญญาณนาฬิกาขั้นต่ำก็จะเพิ่มขึ้นเช่นกัน ฉันสงสัยว่าอุปกรณ์ส่วนใหญ่ทำงานเกินความเร็วสัญญาณนาฬิกาขั้นต่ำพอที่การเพิ่มความเร็วต่ำสุดจะไม่เป็นปัญหา แต่ฉันไม่แน่ใจ
supercat

@Andy, @ W5VO ฉันได้เขียนคำตอบเมื่อคืนและลืมกลางคัน กะกลางคืนสร้างความเสียหายต่อสมองของคุณ
Kortuk

2

เพื่อเติมเต็มคำตอบที่มีอยู่วงจรของวันนี้มีความอ่อนไหวต่อเอจจิ้งเอฟเฟกต์ต่อไปนี้

เนื่องจากอุณหภูมิเพิ่มความคล่องตัวของผู้ให้บริการจึงเพิ่มผลกระทบของ HCI และ NBTI แต่อุณหภูมิไม่ใช่สาเหตุหลักของ NBTI และ HCI:

  • HCI เกิดจากความถี่สูง
  • NBTI ด้วยไฟฟ้าแรงสูง

เอฟเฟกต์ซิลิคอนทั้งสองนี้ทำให้เกิดความเสียหายทั้งแบบย้อนกลับและย้อนกลับไม่ได้สำหรับทรานซิสเตอร์ (โดยส่งผลกระทบ / เสื่อมสภาพพื้นผิวฉนวน) ซึ่งเพิ่มแรงดันไฟฟ้าของทรานซิสเตอร์ (Vt) ดังนั้นชิ้นส่วนจะต้องใช้แรงดันไฟฟ้าที่สูงขึ้นเพื่อรักษาประสิทธิภาพในระดับเดียวกันซึ่งหมายถึงการเพิ่มขึ้นของอุณหภูมิในการทำงานและดังที่กล่าวไว้ในเสาอื่น ๆ การรั่วไหลของทรานซิสเตอร์ทรานซิสเตอร์ที่เพิ่มขึ้นจะตามมา

โดยสรุปอุณหภูมิจะไม่ทำให้อายุชิ้นงานเร็วขึ้นจริง ๆ คือความถี่และแรงดันไฟฟ้าที่สูงขึ้น (เช่นการโอเวอร์คล็อก) ที่จะทำให้อายุส่วนหนึ่ง แต่อายุของทรานซิสเตอร์นั้นจะต้องใช้แรงดันไฟฟ้าที่สูงกว่าซึ่งจะทำให้ชิ้นส่วนมีความร้อนมากขึ้น

ผลกระทบของการโอเวอร์คล็อกคือการเพิ่มอุณหภูมิและแรงดันไฟฟ้าที่ต้องการ


1

เหตุผลทั่วไปของวงจรรวมล้มเหลวกลับไม่ได้เพราะโลหะอลูมิเนียมภายในพวกเขาที่ใช้ในการสร้างการเชื่อมต่อระหว่างองค์ประกอบต่าง ๆ ละลายและเปิดหรืออุปกรณ์กางเกงขาสั้น

ใช่กระแสการรั่วไหลจะเพิ่มขึ้น แต่โดยทั่วไปไม่ใช่กระแสรั่วไหลของตัวเองซึ่งเป็นปัญหา แต่ความร้อนที่สาเหตุและความเสียหายที่เกิดขึ้นกับโลหะที่อยู่ภายใน IC

วงจรไฟฟ้า (เช่นแหล่งจ่ายไฟตัวขับกระแสไฟฟ้าสูง ฯลฯ ) อาจได้รับความเสียหายเนื่องจากแรงดันไฟฟ้าสูงเมื่อไดรเวอร์ทรานซิสเตอร์ปิดอย่างรวดเร็วกระแสภายในจะถูกสร้างขึ้นซึ่งทำให้เกิดการล็อคอุปกรณ์หรือการจ่ายพลังงานไม่สม่ำเสมอภายในเครื่อง ความร้อนและความล้มเหลวของโลหะที่ตามมา

จำนวนวงจรความร้อนซ้ำ ๆ (1000's) จำนวนมากสามารถทำให้เกิดความล้มเหลวได้เนื่องจากความไม่ตรงกันระหว่างการขยายตัวเชิงกลของ IC และบรรจุภัณฑ์ในที่สุดทำให้สายไฟพันธบัตรถูกฉีกหรือแยกวัสดุบรรจุภัณฑ์พลาสติกและความล้มเหลวทางกลไกที่ตามมา

แน่นอนว่าข้อมูลจำเพาะพารามิเตอร์แบบ IC จำนวนมากถูกระบุเฉพาะในช่วงอุณหภูมิที่กำหนดและสิ่งเหล่านี้อาจไม่ได้อยู่ในข้อมูลจำเพาะภายนอก ขึ้นอยู่กับการออกแบบสิ่งนี้อาจทำให้เกิดความล้มเหลวหรือการเปลี่ยนแปลงพารามิเตอร์ที่ยอมรับไม่ได้ (ในขณะที่ IC อยู่นอกช่วงอุณหภูมิ) - สิ่งนี้สามารถเกิดขึ้นได้สำหรับอุณหภูมิที่สูงหรือต่ำมาก


อลูมิเนียมหลอมที่ 660 ° C (1220 ° F) ไอซีตายดีก่อนถึงอุณหภูมินี้
Dmitry Grigoryev

พื้นฐานไม่มี ที่อุณหภูมิต่ำกว่านี้คุณจะได้รับพฤติกรรมทางไฟฟ้าที่ไม่พึงประสงค์อย่างแน่นอน การให้ความร้อนและการระบายความร้อนที่มากเกินไป แต่สิ่งนี้ไม่ได้ทำให้เกิดความล้มเหลวอย่างถาวรจนกว่าวงจรบางส่วนจะถึงอุณหภูมิที่อัล (หรือโลหะอื่น ๆ ) กระจายเข้าไปในซิลิคอน (จุดยูเทคติก) นี้อยู่ที่ประมาณ 500-600 C ความล้มเหลวอื่น ๆ ส่วนใหญ่สามารถกู้คืนได้ ความล้มเหลวเพิ่มเติมอาจเกิดจากความผิดปกติทางไฟฟ้าทำให้แรงดันไฟฟ้ามากเกินไปถูกนำไปใช้กับประตูของทรานซิสเตอร์หรือวงจรความร้อน (ซึ่งเป็นสาเหตุของความล้มเหลวทางกลไก)
jp314

ฉันยังมีข้อสงสัย ตัวอย่างเช่นไอซีมักจะระบุอุณหภูมิการบัดกรีสูงสุดประมาณ 300 ° C ดังนั้นดูเหมือนว่าการไปเกินขีด จำกัด นั้นเพียงพอที่จะทำให้เกิดความเสียหายถาวร
Dmitry Grigoryev
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.