วิธีการวินิจฉัยการค้างแบบสุ่ม?


14

ดูเหมือนว่า Ubuntu จะหยุดในช่วงประมาณ 15 นาทีแรกเมื่อมันถูกบูทบนเครื่องของฉัน บางครั้งมันเป็นใน 5 นาทีแรกบางครั้งก็ใช้เวลา 30 นาทีบางครั้งมันไม่เคยเกิดขึ้น ...

ฉันไม่สามารถสร้างมันขึ้นมาใหม่ได้ แต่มันก็เกิดขึ้นบ่อยครั้งพออยู่แล้วที่ฉันอาจจะรอให้มันเกิดขึ้นอีกครั้ง

ฉันจะวิเคราะห์การตรึงเพื่อหาสาเหตุได้อย่างไร

หมายเหตุใกล้ชิดผู้มีสิทธิเลือกตั้ง:
ไม่มีนี้ไม่ซ้ำนี้คำถาม คำถามนี้เกี่ยวกับการวินิจฉัยไม่ใช่การกู้คืนชั่วคราว คำตอบสำหรับคำถามนั้นบอกฉันเพียงวิธีฆ่า X Server ใช้ Magic Combo เพื่อรีเซ็ตเคอร์เนล ฯลฯ .... ซึ่งไม่ได้ช่วยฉันหาสาเหตุ

ข้อมูลบางอย่าง:

  1. Ubuntu 11.04: 2.6.38-15-generic # 66-Ubuntu SMP x86_64 GNU / Linux

  2. บางครั้งเมาส์จะเคลื่อนที่ไปมา แต่ UI ไม่ตอบสนอง

  3. การกดCtrl+ Alt+ F1เพื่อเข้าไปในเทอร์มินัลไม่ทำงาน

  4. Alt+ SysRqคอมโบทำงาน ... และดูเหมือนจะเป็นสิ่งเดียวที่ทำงานนอกเหนือจากเมาส์ (ซึ่งบางครั้งยังสามารถย้ายไปรอบ ๆ )

  5. ฉันไม่ได้ใช้ทรัพยากรหมด (RAM จำนวนมากและพื้นที่ระบบไฟล์ว่าง)

  6. ฮาร์ดแวร์ที่เกี่ยวข้องอาจเป็นไปได้ (จากแอปพลิเคชัน Hardware Lister):

    • อะแดปเตอร์เครือข่ายไร้สาย AR9285 (PCI-Express)

    • GT216 [GeForce GT 330M] (ฉันใช้ไดรเวอร์นูโวซึ่งดูเหมือนว่าจะทำงานได้ดี)


เห็นความคิดเห็นที่อื่นเกี่ยวกับการพยายาม ssh ในเครื่องของคุณจากเครื่องอื่น - ความสำเร็จ / ความล้มเหลวอย่างน้อยบ่งบอกถึงความรุนแรงของการแช่แข็ง - คำถามที่ดี!
david.libremone

ดูเพิ่มเติมได้ที่askubuntu.com/questions/75325/tools-to-diagnose-ubuntu-problems
david.libremone

คำตอบ:


7

บันทึกควรเป็นพอร์ตการโทรแรกของคุณเสมอ ตรวจสอบ syslog เพื่ออะไรที่ไม่ดี:

less /var/log/syslog

ตรวจสอบล็อก Xserver ในกรณีที่มีข้อบ่งชี้ว่ามีปัญหาไดรเวอร์กราฟฟิก (แม้ว่าฟังดูจะไม่ค่อยมีคำอธิบายของคุณก็ตาม):

less /var/log/Xorg.0.log

ในกรณีเฉพาะของคุณขั้นตอนเหล่านี้อาจไม่ทำให้เกิดสิ่งที่น่าสนใจ ในกรณีนี้ฉันสนใจที่จะดูว่าเกิดอะไรขึ้นกับระบบของคุณในขณะที่เกิดปัญหา ด้วยเหตุนี้โดยส่วนตัวฉันจะตั้งค่าล็อกtopเอาท์พุทชั่วคราวในช่วงเวลาสั้น ๆ - พูดทุก ๆ 5 หรือ 10 วินาที หวังว่าการเปิดเผยนี้จะเกิดขึ้นหากกระบวนการทำงานโดยใช้ทรัพยากรในช่วงเวลาของปัญหา

โปรดทราบว่ามีทางเลือกอื่นอยู่เช่นการสลับไปยัง tty อื่นด้วยCtrl+Alt+F1.. F6(เพื่อกลับไปที่ GUI มันCtrl+Alt+F7) และเรียกใช้คำสั่งแบบโต้ตอบหรือกำหนดค่าเซิร์ฟเวอร์ SSH และเข้าสู่ระบบจากระยะไกล ทั้งสองอย่างนี้อาจน่าอึดอัดใจหากเครื่องของคุณไม่ตอบสนองมากขึ้นดังนั้นข้อเสนอแนะที่น่าอึดอัดใจของฉันมากขึ้นในการเขียนล็อกไฟล์ (ซึ่งอาจประสบปัญหาเดียวกัน แต่มีแนวโน้มที่จะประสบความสำเร็จ)

มันจะเกี่ยวข้องกับสิ่งนี้:

while [ 1 -eq 1 ] ; do top -b >> ~/top.log; sleep 10; done

สิ่งนี้จะเขียนtopเอาต์พุตไปที่ logfile ที่ ~ / top.log ทุกๆ 10 วินาทีหรือมากกว่านั้น โปรดทราบว่าบันทึกนี้จะมีขนาดค่อนข้างใหญ่หากคำสั่งนี้ยังคงทำงานต่อเนื่องเป็นระยะเวลานานดังนั้นโปรดคอยสังเกตหากเครื่องของคุณเริ่มทำงานทันที! และลบบันทึกด้วยrm ~/top.logเมื่อคุณทำเสร็จแล้ว โปรดทราบว่าการดำเนินการคำสั่งข้างต้นเป็นสิ่งที่เกิดขึ้นครั้งเดียว มันจะไม่รีสตาร์ทตัวเองหลังจากรีบูต

หากต้องการอ่านบันทึกที่สร้างขึ้นหลังจากเกิดข้อขัดข้องคุณต้องใช้

less ~/top.log

และกดEndปุ่มเพื่อไปที่ด้านล่าง คุณกำลังมองหากระบวนการที่มีค่า CPU สูงผิดปกติหรือค่า RES สูงผิดปกติ

อาจช่วยได้หรือไม่ก็ได้ แต่เป็นข้อมูลที่มีประโยชน์


อ่าขอบคุณ ฉันเพิ่งค้นหา/var/log/messagesแต่มันไม่มีอยู่จริง ... เป็นไฟล์จริงหรือคุณตั้งใจจะดูบันทึกในไดเรกทอรีนั้นหรือไม่? (ถ้าเป็นเช่นนั้นจะบันทึกอะไร)
user541686

ฉันขอโทษฉันคิดถึงการแจกแจงอื่น พวกมันต่างกันเล็กน้อย! บน Ubuntu เท่ากับ / var / log / syslog ฉันจะอัปเดตคำตอบ
IlluminAce

อาไม่ต้องกังวลขอบคุณ :) ผมแค่มองไปที่syslogและkern.logและในทั้งสองที่ผมมองหาSysRq(ตั้งแต่สิ่งแรกที่ผมทำคือการล้างระบบแฟ้ม) ... แต่ไม่มีอะไรที่เกี่ยวข้องดูเหมือนจะเกิดขึ้นก่อนที่จะล้างตามบันทึก ให้ฉันตรวจสอบบันทึก xorg ...
user541686

อืมดูเหมือนว่าจะไม่มีอะไรโดดเด่นในXorgล็อกเช่นกัน นอกจากนี้ยังไม่ใช่ปัญหาของ CPU อย่างแน่นอน (นั่นเป็นเหตุผลที่ฉันบอกว่ามันไม่ใช่การขาดทรัพยากร), CPU ของฉันแทบจะไม่มีการใช้เลยในช่วงที่หยุดทำงาน การแช่แข็งเป็นการสุ่มอย่างสมบูรณ์ ... บางครั้งฉันลากหน้าต่างและค้างบางครั้งฉันเพิ่งออกจากคอมพิวเตอร์ที่นั่นเป็นเวลาห้านาทีและเมื่อฉันกลับมามันจะแข็ง แต่มันไม่เกี่ยวข้องอย่างสมบูรณ์กับการขาดทรัพยากร ยังคงข้อมูลที่ดีขอบคุณ
user541686

ฉันควรจะบอกว่ามีข้อแม้เล็กน้อยในบันทึก Xorg ซึ่งคุณอาจพบว่าข้อมูลจากเซสชันก่อนหน้านี้ถูกเขียนทับโดยเซสชันใหม่ที่คุณอยู่ในขณะนี้ หากเป็นเช่นนั้นคุณสามารถดูข้อมูลต้นฉบับได้โดยการบู๊ตตรงไปยัง tty (หลังจากเกิดข้อผิดพลาด ... ) และตรวจสอบบันทึกที่นั่น คุณสามารถบูทได้ที่เทอร์มินัลโดยตรงโดยเพิ่ม "text" ที่ส่วนท้ายของเคอร์เนล boot line - ดังที่อธิบายไว้ที่นี่: askubuntu.com/questions/158382/เมื่อคุณทำเสร็จแล้วให้รีบูทหรือป้อน X ด้วยบริการ sudo lightdm start หรือ startx โดยตรง
IlluminAce
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.