* คุณ * ติดตามและบำรุงรักษาเอกสารเป็นประจำได้อย่างไร?


10

ซอฟต์แวร์หรือระบบใดที่คุณใช้กับข้อผิดพลาดของเซิร์ฟเวอร์เพื่อเตือนให้คุณทำการบำรุงรักษาตามปกติ คุณจะตรวจสอบและบันทึกรายการต่าง ๆ ที่คุณควรตรวจสอบได้อย่างไร คุณมีเอกสารกระบวนการภายในหรือไม่? คุณมีอีเมล cron ถึงคุณทุกสัปดาห์พร้อมเตือนเพื่อตรวจสอบบันทึกระบบหรือไม่?

นอกจากนี้คุณทำงานเป็นทีมเพื่อทำการบำรุงรักษาระบบและถ้าเป็นเช่นนั้นคุณจะประสานงานกับใครที่จะทำการบำรุงรักษาอะไรบ้าง?

หากคุณใช้ระบบติดตามบั๊ก / ปัญหาเพื่อป้อนงานคุณมีงาน cron ในการเข้าทำงานที่เกิดขึ้นซ้ำหรือไม่?

คำตอบ:


5

ขณะนี้ฉันใช้ Request Tracker ( http://www.bestpractical.com/rt )
กิจกรรมการบำรุงรักษาทั้งหมดจะได้รับตั๋วที่เกี่ยวข้องในคิว "ระบบ" หมายเหตุเกี่ยวกับปัญหาที่พบผู้ปฏิบัติงานเมื่อใด ฯลฯ ทั้งหมดถูกป้อนเข้าสู่ตั๋วพร้อมกับการอนุมัติที่จำเป็น

ในขณะนี้งานที่เกิดซ้ำของเรา (การปะแก้รายไตรมาสและอื่น ๆ ) ถูกสร้างขึ้นด้วยตนเอง แต่มันอาจเป็นไปโดยอัตโนมัติได้อย่างง่ายดาย

การประสานงานกับผู้ที่ทำสิ่งที่ทำงานค่อนข้างง่ายสำหรับเราเนื่องจากมีเพียง 2 คนในกลุ่มผู้ดูแลระบบของเรา แต่เมื่อเราขยายแผนคือการสร้างตั๋วหลักสำหรับกิจกรรมการบำรุงรักษา & ใช้ตั๋วเด็กที่ได้รับมอบหมายให้แก่ผู้รับผิดชอบในการมอบหมายงาน .


เรื่องประจำวัน (การตรวจสอบบันทึก ฯลฯ ) เป็นอีกเรื่องหนึ่ง: ฉันทำสิ่งเหล่านี้ให้เป็นกระบวนการอัตโนมัติ:

  • InterMapperคอยดูสถานะโดยรวมของเซิร์ฟเวอร์ (การสืบค้น SNMP ที่กำลังมองหาโหลดสูงพื้นที่ดิสก์เหลือน้อย ฯลฯ ) ฟังก์ชันการทำงานของเว็บอินเตอร์เฟสของเราและสิ่งอื่น ๆ ที่อาจบ่งบอกถึงปัญหา
  • Syslog-NGรวบรวมบันทึกจากโฮสต์ของเราและป้อนข้อมูลเหล่านั้นผ่านสคริปต์จำนวนมากซึ่งตรวจสอบความไม่ดีที่เห็นได้ชัด ฉันมองไปที่ท่อนซุงเป็นครั้งคราวเพื่อให้มีสติตรวจสอบสคริปต์ แต่มันไม่ได้กำหนดไว้เป็นประจำ


2

ระบบอัตโนมัติที่ดำเนินการอย่างเหมาะสมนั้นไม่จำเป็นต้องมีสำหรับงานและรายการตรวจสอบทั้งหมด เหตุใดคุณจึงต้องการตรวจสอบสิ่งต่าง ๆ ด้วยตนเองเมื่อคุณมีคอมพิวเตอร์ที่สามารถทำงานได้อย่างมีประสิทธิภาพและประสิทธิผลมากขึ้น?

สิ่งที่ต้องมีการตรวจสอบเป็นระยะจะถูกตรวจสอบโดยระบบการตรวจสอบ ภารกิจประจำจะเป็นไปโดยอัตโนมัติทุกครั้งที่ปฏิบัติได้และส่งการแจ้งเตือนไปยังงานที่ต้องทำด้วยตนเอง เอกสารเป็นเรื่องอื่น แต่ถูกต้องคอมพิวเตอร์ของคุณส่วนใหญ่สามารถสร้างเอกสารของตนเอง

หยุดหาวิธีที่ดีกว่าด้วยตนเองและเริ่มมองหาวิธีอัตโนมัติที่ดีกว่าในการทำงานใด ๆ คอมพิวเตอร์อยู่ที่นั่นเพื่อทำงานให้เราไม่ใช่ให้เราทำงานให้กับพวกเขา


กฎง่ายๆ: ผู้ดูแลระบบควรมีทั้งความสามารถและขี้เกียจเสมอ ความปรารถนาที่จะไม่ทำงานจะนำไปสู่ ​​sysadmins ที่ดีในการใช้ระบบอัตโนมัติที่ดี
voretaq7

ให้ฉันเป็นตัวอย่างเฉพาะ: ฉันต้องตรวจสอบแพตช์ความปลอดภัยสำหรับ Apache แล้วสร้างบิลด์ใหม่และทดสอบเมื่อแพตช์ออกมา ส่วนงานประจำคือการตรวจสอบสำหรับ Apache รุ่นใหม่ ไม่เพียงแค่อัปเดตโดยตรงจากที่เก็บ (หลัก) เพราะมันจะไม่มีโมดูลที่ถูกต้องรวบรวมนอกจากนี้ยังต้องตรวจสอบเพื่อให้แน่ใจว่าการเผยแพร่ได้รับการตรวจสอบแล้ว นั่นทำให้รู้สึกมากขึ้น?
Zak

นอกจากนี้ฉันไม่ต้องการเพียงแค่หมุนแบตช์ล่าสุดของซอฟต์แวร์ใด ๆ จนกว่าบิลด์จะผ่านการควบคุมคุณภาพ QA ส่วนใหญ่เป็นระบบอัตโนมัติ แต่ไม่ใช่ทั้งหมด
Zak

และมีเหตุผลที่ไม่สามารถเขียนสคริปต์ทั้งหมดได้หรือไม่ ตรวจสอบการอัปเดตอัตโนมัติส่งการแจ้งเตือนให้คุณทราบเมื่อมีพร้อมใช้งานตามด้วยคอมไพล์และติดตั้งสคริปต์พร้อมให้คุณทดสอบ ปล่อยให้เครื่องทำงานเป็นกลุ่มและบอกคุณเมื่อคุณต้องการความสนใจ
John Gardeniers

1

สำหรับงานโครงการมันถูกขับเคลื่อนโดยแอพ Project Management (อีเมลและปฏิทินที่รวมเข้ากับความสามารถในการจัดทำเอกสารรายละเอียดงานและกำหนดตารางเวลาสำหรับคนเฉพาะ)

สำหรับการบำรุงรักษาอัปเกรดแก้ไข ฯลฯ เรามีระบบจองตั๋วที่มากหรือน้อยรวมกับกระบวนการจัดการการเปลี่ยนแปลงของเราเพื่อจัดการกับคำขอและกำหนดเวลา

สำหรับงานที่ขับเคลื่อนด้วยภายในอย่างสมบูรณ์และทำงานในรอบยาว (รายไตรมาสรายปี ฯลฯ ):

การแจ้งเตือนให้ทำสิ่งต่าง ๆ เป็นปฏิทิน มีเอกสารประกอบแบบไม่เป็นทางการ / กึ่งทางการ ("wiki") สำหรับกำหนดการทั่วไป

มีบางส่วนของ "วิธีการ" และเอกสารขั้นตอนเกี่ยวกับวิธีดำเนินงานและสามารถเข้าถึงทีมโดยรวมได้ แต่ผู้คนมี "หนังสือดำ" ของผู้ดูแลระบบและบันทึกที่มีบันทึก & สูตรอาหาร


1

ระบบการตรวจสอบสามารถช่วยในสิ่งเหล่านี้:

  • เราจัดทำเอกสารการบำรุงรักษารายเดือนในไฟล์ word word พร้อมช่องทำเครื่องหมาย ในแต่ละเดือนเราบันทึกรายงานลงในโฟลเดอร์บน NAS ของเรา เราตรวจสอบอายุไฟล์ขั้นต่ำของโฟลเดอร์ หากอายุไฟล์ขั้นต่ำมากกว่า 40 วันเราจะได้รับการเตือน

  • ส่วนหนึ่งของการบำรุงรักษาตามปกติของเราคือการรีบูทเซิร์ฟเวอร์และเครื่องใช้ที่เลือกเดือนละครั้ง เราใช้เซ็นเซอร์ "uptime ระบบ" (SNMP / WMI) กับซอฟต์แวร์ตรวจสอบของเราและถ้าเวลาทำงานมากกว่า 40 วันเราจะได้รับการเตือน

  • สำหรับการสำรองข้อมูลเราจะตรวจสอบอายุไฟล์ขั้นต่ำในโฟลเดอร์สำรองของแต่ละเซิร์ฟเวอร์ใน NAS ของเรา หากอายุไฟล์ขั้นต่ำมากกว่า 10 วันเราจะได้รับการเตือน


1

ฉันใช้ Checkpanel ( https://checkpanel.com ) เพื่อจัดการงานบำรุงรักษาที่เกิดขึ้นประจำ มันมีรายการตรวจสอบที่ใช้ซ้ำได้และอินเทอร์เฟซที่ใช้งานง่ายเพื่อบันทึกผลลัพธ์ของการตรวจสอบแต่ละครั้ง

หลังจากตรวจสอบรายการมันไม่เพียง "เสร็จสิ้น" แต่ยังคงพร้อมใช้งานสำหรับการตรวจสอบเพิ่มเติม การตรวจสอบแต่ละครั้งจะถูกบันทึกไว้เพื่อให้คุณสามารถตรวจสอบประวัติของการตรวจสอบที่ผ่านมาทั้งหมดของรายการได้อย่างง่ายดายรวมถึงรายละเอียดเพิ่มเติม (เช่นข้อความแสดงข้อผิดพลาดสำหรับการตรวจสอบที่ล้มเหลว)

คุณสามารถตั้งค่าการเกิดซ้ำสำหรับแต่ละรายการเพื่อให้แน่ใจว่าคุณตรวจสอบอย่างน้อยสัปดาห์ละครั้ง / ทุก 2 วัน / ฯลฯ มีมุมมองแบบรวมของรายการครบกำหนดทั้งหมด หากคุณต้องการคุณยังสามารถรับอีเมลรายวันพร้อมรายการครบกำหนดทั้งหมดได้อีกด้วย

มีเทมเพลตรายการตรวจสอบการบำรุงรักษาเซิร์ฟเวอร์ซึ่งคุณสามารถใช้เป็นพื้นฐานสำหรับรายการตรวจสอบของคุณเอง เทมเพลตอื่น ๆ ได้แก่ รายการตรวจสอบสำหรับเว็บแอปพลิเคชัน, WordPress และอื่น ๆ

การเปิดเผยข้อมูล: ฉันเป็นผู้ก่อตั้ง Checkpanel

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.