จะตรวจสอบสาเหตุของการแฮงค์ทั้งหมดได้อย่างไร


19

เครื่องอาร์ชของฉันบางครั้งแฮงค์ก็ไม่ตอบสนองใด ๆ กับเมาส์หรือแป้นพิมพ์ เคอร์เซอร์ถูกตรึง Ctrl-Alt-Backsp จะไม่หยุด X11 และ ctrl-alt-del ไม่ทำอะไรเลย cpu, เครือข่ายและกิจกรรมของดิสก์ใน conky และ icewm หยุดการอัพเดต ในไม่กี่นาทีพัดลมก็จะเปิดขึ้น วิธีเดียวที่จะทำให้คอมพิวเตอร์ทำอะไรเลยก็คือปิดเครื่อง

เมื่อบู๊ตเครื่องหน้าจอแสดงอุณหภูมิของ CPU จะแสดง 70 ถึง 80C ก่อนที่จะหยุดฉันมักจะทำกิจกรรมความเข้มต่ำเช่นการท่องเว็บรับประมาณ 50C

บันทึกไม่มีอะไรพิเศษเมื่อเทียบกับการปิดปกติ ตัวตรวจสอบหน่วยความจำทำงานได้ดีโดยไม่มีข้อบกพร่อง

ฉันจะตรวจสอบได้อย่างไรว่าทำไมถึงวางสาย มีข้อมูลพิเศษที่ฉันสามารถหาเบาะแสได้หรือไม่? มีอะไรที่รุนแรงน้อยไปกว่าการปิดเครื่องเพื่อรับการกระทำบางอย่างถ้ามีกระสุน จำกัด หรือเสียงเตือน แต่อาจให้เบาะแสหรือไม่

เครื่องนี้เป็นแล็ปท็อป Gateway P6860 17 "(เทอะทะ แต่ทรงพลัง) และใช้งาน Arch 64 บิตเป็นรุ่นล่าสุด (ณ เดือนมีนาคม 2011) ฉันมี Arch มาเป็นเวลานานโดยไม่มีปัญหานี้เปลี่ยนเป็น Ubuntu เป็นเวลาประมาณหนึ่งสัปดาห์ จากนั้นถอยกลับไปที่การติดตั้ง Arch ครั้งใหม่นั่นคือตอนที่ Hangings เริ่มขึ้น

UPDATE: ใช่แน่นอนว่ามันร้อนเกินไป ที่อุณหภูมิเดียวเม้าส์และคีย์บอร์ดหยุดทำงานบางครั้งก็สามารถทำงานได้หลังจากผ่านไปหลายนาที ที่อุณหภูมิสูงกว่าสิ่งเลวร้ายเกิดขึ้นเช่นการไม่ตอบสนองรวมถึงการไม่สนใจ SysRq เงื่อนไขนี้จะตามมาในไม่ช้าโดยทันทีที่ปิดเครื่อง ฉันแก้ไขปัญหาด้วยการซื้อคอมพิวเตอร์ใหม่ 8D

คำตอบ:


7

คำตอบของเฟรดเดอริกเกี่ยวกับเวทย์มนตร์ SysRq และการทิ้งเคอร์เนลจะทำงานหากเคอร์เนลยังคงทำงานอยู่และไม่หยุดทำงานอย่างแท้จริง เคอร์เนลอาจจะไม่ว่างด้วยเหตุผลบางอย่าง

ความจริงที่ว่ามันไม่ตอบสนองต่อ Ctrl-Alt-Del บอกฉันว่าอาจไม่เป็นเช่นนั้นและเครื่องล็อคอย่างหนัก นั่นหมายถึงความล้มเหลวของฮาร์ดแวร์หรือสิ่งที่เกี่ยวข้องอย่างใกล้ชิดเช่นไดรเวอร์ที่ไม่ดี

การทดสอบการตรวจสอบหน่วยความจำของคุณนั้นดีถ้าคุณปล่อยให้มันรันนานพอ นอกจากนี้คุณควรลองสิ่งอื่น ๆ ที่จะลองและความเครียดระบบเช่นStressLinux มาตรฐานระยะยาวก็ดีเช่นกัน

อีกสิ่งที่ควรลองคือการบูทระบบด้วย Ubuntu live CD และพยายามใช้ระบบตามปกติ หากกลับไปที่ Ubuntu ชั่วคราวเช่นนั้นจะไม่ทำให้เกิดปัญหาขึ้นอีกมีโอกาสที่ดีที่จะไม่ใช้ฮาร์ดแวร์จริง แต่เป็นหนึ่งในสิ่งที่เกี่ยวข้องเช่นไดรเวอร์ที่ไม่ดีหรือเคอร์เนลที่กำหนดค่าไม่ถูกต้อง มีความเป็นไปได้ค่อนข้างมากที่การกระจายที่ได้รับความนิยมเช่นอูบุนตูอาจมีการกำหนดค่าเคอร์เนลที่เสถียรมากกว่าหนึ่งอย่างเช่น Arch เนื่องจากเครื่องจักรจำนวนมากที่ถูกลองใช้ในระหว่างขั้นตอนการทดสอบของ distro


ฉันเชื่อว่า Ctrl-Alt-Delete ถูกจัดการโดย init ดังนั้นจึงอาจไม่ทำงานแม้ว่าเคอร์เนลจะยังทำงานอยู่ OTOH AFAIR เคอร์เนลไม่รอคีย์ SysRq หลังจากตื่นตระหนก
jpc

1
นั่นเป็นไปได้ ในการแยกเคสให้ใส่ไฟล์ctrlaltdel hardของคุณ /etc/rc.localเมื่อระบบล็อคอัพให้ลอง Ctrl-Alt-Del ถ้ามันยังคงไม่ทำอะไรเลยคุณรู้แน่ว่าเคอร์เนลไม่ทำงานอีกต่อไป คุณมีฮาร์ดแวร์หรือไดรเวอร์ล้มเหลว
Warren Young

1
ฉันมีเมล็ดตอบสนองต่อคีย์ Magic SysRq แม้ว่ามันจะตื่นตระหนกก็ตาม การตั้งค่าบริการ kdump ที่เหมาะสมควรตรวจสอบให้แน่ใจว่าระบบที่มีการบูทอย่างสมบูรณ์เข้าสู่เคอร์เนล kdump ดังนั้นจึงควรกลับมาใช้งานในที่สุด
jsbillings

1
หลังจากโผล่รหัสการจัดการแป้นพิมพ์เคอร์เนลอย่างรวดเร็วฉันก็ดูเหมือนว่า Ctrl-Alt-Del และ Magic SysRq จะได้รับการจัดการในระดับเดียวกัน: หากใช้งานได้ผลจะดีกว่า ปัญหา init (1) / SIGINT แยกออกจากกันและจัดการโดยการตั้งค่าการจัดการ Ctrl-Alt-Del เพื่อทำการรีบูตใหม่ตามที่กล่าวไว้ในความคิดเห็นอื่นของฉัน
Warren Young

11

เกี่ยวกับการแช่แข็งมีตัวเลือกไม่กี่:

  • โดยใช้พอร์ตอนุกรมถ้ากล่องของคุณมีหนึ่งที่จะได้รับการถ่ายโอนข้อมูลโดยมีการเพิ่มconsole=ttyS0ตัวเลือกการบูตตามที่อธิบายไว้ที่นี่ คุณต้องมีเครื่องที่สองที่มีพอร์ตอนุกรมและสายเคเบิลโมเด็ม null เพื่อตรวจจับไฟล์การถ่ายโอนข้อมูล

  • ใช้ netconsole ที่จะได้รับการถ่ายโอนข้อมูลผ่านเครือข่ายดูที่นี่

  • ใช้ kexec / kdump วิธีนี้คุณจะได้รับการถ่ายโอนข้อมูลท้องถิ่นดูที่นี่

เกี่ยวกับปัญหาการปิดเครื่องฉันขอแนะนำให้คุณใช้ปุ่ม SysRq เวทย์มนตร์เพื่อ 'S'ync แผ่นดิสก์' U'mount พวกเขาและจากนั้นกดปุ่ม 're'B'oot (ตัวอักษรเป็นสิ่งที่คุณควรพิมพ์พร้อมกับ alt -sysrq

แก้ไข: หากคุณโพสต์ oops / trace ไปยัง lkml คุณควรใช้เคอร์เนลเวอร์ชันล่าสุด (ควรเป็นรุ่นล่าสุด) และไม่มีโมดูลที่เป็นกรรมสิทธิ์


1
ฉันนึกภาพออกมาได้หลายคำว่า "พอร์ตอนุกรมคืออะไรคุณปู่" ในความเป็นจริงฉันไม่คิดว่าเครื่องนี้จะมี
DarenW

ฉันจำได้ว่าอ่านอะไรเกี่ยวกับ SysReq เมื่อสองสามปีก่อน ถ้าเพียงฉันสามารถ google มันเมื่อเครื่องตาย! คิดว่าผมควรที่จะได้รับการตั้งค่าที่วุ่นวายขึ้นเครื่องที่สอง ...
DarenW
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.