เมื่อเขียนของฉันฉันมักจะตกไปเขียนสองสามชุด รายการตรวจสอบที่ทำเสร็จแล้วพร้อมภาคผนวกอีกมากมายเกี่ยวกับสถาปัตยกรรมของระบบรวมถึงสาเหตุที่สิ่งต่าง ๆ ทำในแบบที่พวกเขาเป็นจุดเกาะที่น่าจะเป็นไปได้เมื่อออนไลน์และสมมติฐานการออกแบบที่เป็นนามธรรม ตามด้วยรายการปัญหาที่น่าจะเป็นและการแก้ปัญหาของพวกเขาตามด้วยส่วนที่ยาวขึ้นพร้อมข้อมูลเกี่ยวกับวิธีการทำงานของระบบทำไมมันถึงเป็นเช่นนั้นและข้อมูลอื่น ๆ ที่มีประโยชน์สำหรับการชี้บุคคลในทิศทางที่ถูกต้อง
ในงานสุดท้ายของฉันเราจำเป็นต้องเขียนเอกสารเพื่อให้แม้แต่ผู้ช่วยเหลือระดับ 1 ก็สามารถนำสิ่งต่าง ๆ กลับมาได้ รายการตรวจสอบที่จำเป็นนี้ซึ่งโดยทั่วไปล้าสมัยภายใน 3 เดือนของการเขียน เราขอแนะนำอย่างยิ่งให้เขียนคู่มือการแก้ปัญหาทุกครั้งที่เป็นไปได้ แต่เมื่อต้นไม้ที่อาจเกิดขึ้นได้รับมากกว่าสามสาขาคุณจะไม่สามารถเขียนเอกสารนั้นโดยไม่เป็นนามธรรม
เมื่อออกจากงานล่าสุดของฉันฉันหันไปในคู่มือ 'วิธีการทำงานของฉัน' ในหน้า 100 ก่อนที่ฉันจะจากไป มันมีเนื้อหาที่เป็นนามธรรมปรัชญาการออกแบบรวมถึงประเด็นการรวมเข้าด้วยกัน เนื่องจากฉันถูกเขียนขึ้นสำหรับผู้ดูแลระบบคนอื่นที่กำลังจะมาแทนที่ฉันฉันจึงเล็งไปที่ใครบางคนที่สามารถใช้ความคิดเชิงนามธรรมและทำให้พวกเขากลายเป็นการกระทำที่เป็นรูปธรรม
ห้าปีผ่านไปแล้วและฉันพบว่าความคิดเห็นของฉันเกี่ยวกับเรื่องนี้ได้เปลี่ยนไปบ้าง ทั้งเอกสารเป็นคู่มือและเอกสารเป็นรายการตรวจสอบมีสถานที่ที่มีคุณค่ามากในลำดับชั้นของเอกสารและทั้งสองจะต้องมีการผลิต พวกเขากำหนดเป้าหมายไปยังผู้ชมที่แตกต่างกันมาก
เอกสารเป็นรายการตรวจสอบ
ตลาดเป้าหมายสำหรับเอกสารประเภทนี้คือเพื่อนร่วมงานที่ต้องการวิธีการทำสิ่งต่างๆ พวกเขามาในสองประเภท:
- เพื่อนร่วมงานที่ต้องการรู้วิธีทำสิ่งต่าง ๆ และไม่มีเวลาอ่านคู่มือสิบห้าหน้าและหาขั้นตอนต่าง ๆ สำหรับตนเอง
- ขั้นตอนที่ค่อนข้างซับซ้อนในขั้นตอน แต่จะต้องทำงานเป็นครั้งคราว
ความอดทนเป็นคนขับสำหรับประเภทแรก บางทีเพื่อนร่วมงานของคุณอาจไม่ต้องการรู้ว่าทำไมการแสดงผลจึงต้องมีการส่งผ่าน 90 อักขระ perl regex เพียงเพื่อที่จะได้ปิดตั๋ว รวมคำแถลงอย่างชัดเจน "สำหรับคำอธิบายโดยละเอียดเกี่ยวกับสาเหตุที่เวิร์กโฟลว์นี้มีลักษณะเช่นนี้ให้ไปที่ลิงค์นี้" ในรายการตรวจสอบสำหรับผู้ที่ต้องการทราบสาเหตุ
จุดที่สองสำหรับขั้นตอนที่ไม่ได้ทำงานบ่อย แต่มีข้อผิดพลาด รายการตรวจสอบทำหน้าที่เป็นแผนที่เพื่อหลีกเลี่ยงการแน่นอนบางอย่างเพียง winging มัน หากรายการตรวจสอบถูกเก็บไว้ใน repo เอกสารมันจะไม่ต้องค้นหาอีเมลในเวลาที่ผู้ดูแลระบบเก่าส่ง HOWTO
ในความคิดของฉันรายการตรวจสอบที่ดียังมีเอกสารในส่วนของจุดล้มเหลวที่เป็นไปได้และการตอบสนองต่อความล้มเหลวเหล่านั้น สิ่งนี้สามารถทำให้เอกสารมีขนาดค่อนข้างใหญ่และทำให้เกิด TL การตอบสนอง DR ในเพื่อนร่วมงานดังนั้นฉันจึงพบว่าการทำให้โหมดความล้มเหลวและการตอบสนองลิงก์จากรายการตรวจสอบมากกว่าในหน้านั้นเป็นรายการตรวจสอบที่ไม่ธรรมดา โอบกอด
เอกสารเป็นคู่มือ
ตลาดเป้าหมายสำหรับเอกสารประเภทนี้คือผู้ที่ต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการทำงานของระบบ เอกสารสไตล์ลักษณะสิ่งที่ต้องทำควรได้มาจากเอกสารนี้ แต่โดยทั่วไปฉันเห็นว่าเป็นส่วนเสริมสำหรับเอกสารประกอบรายการตรวจสอบเพื่อสำรองข้อมูลการตัดสินใจในเวิร์กโฟลว์
นี่คือเอกสารที่เรารวมชิ้นส่วนที่เหนียวนุ่มเช่น:
- อธิบายว่าทำไมจึงกำหนดค่าด้วยวิธีนี้
- ส่วนนี้อาจรวมถึงปัญหาที่ไม่ใช่ด้านเทคนิคเช่นการเมืองโดยรอบเกี่ยวกับวิธีการซื้อและติดตั้งสิ่งของทั้งหมด
- อธิบายโหมดความล้มเหลวทั่วไปและการตอบสนองของพวกเขา
- อธิบายข้อตกลงระดับบริการใด ๆ ทั้งที่เป็นลายลักษณ์อักษรและโดยพฤตินัย
- อันที่จริง: "ถ้าสิ่งนี้ล้มเหลวในช่วงสัปดาห์สุดท้ายของการแข่งขันมันเป็นปัญหาที่เกิดขึ้นทุกอย่างถ้าในช่วงพักฤดูร้อนกลับไปนอนและจัดการกับมันในตอนเช้า"
- การกำหนดเป้าหมายการอัพเกรดและการเปลี่ยนโครงสร้างใหม่
- การเมืองอาจแตกต่างออกไปในภายหลังทำไมเราไม่แก้ไขความคิดที่ไม่ดีที่นำมาใช้ในตอนแรก
ซึ่งล้วนเป็นประโยชน์อย่างมากสำหรับการได้รับความเข้าใจที่ครอบคลุมของระบบทั้งหมด คุณไม่จำเป็นต้องมีความเข้าใจอย่างถ่องแท้เพื่อใช้งานระบบอัตโนมัติของมนุษย์อย่างง่ายคุณต้องเข้าใจก่อนว่าทำไมบางอย่างถึงผิดพลาดและมีความคิดว่าจะทำอย่างไร
คุณยังกล่าวถึงเอกสารประกอบการกู้คืนความเสียหายที่จะต้องมีรายการตรวจสอบ
ฉันเข้าใจคุณมีความเห็นอกเห็นใจของฉัน
ใช่เอกสาร DR ต้องเป็นรายการตรวจสอบให้มากที่สุด
ใช่เอกสาร DR มีความทนทานต่อการตรวจสอบมากที่สุดเนื่องจากมีหลายสิ่งที่อาจแตกหักได้
หากรายการตรวจสอบ DR ของคุณดูเหมือนว่า:
- โทรหาดัสตินหรือกะเหรี่ยง
- อธิบายปัญหา
- ยืนกลับ.
คุณมีปัญหา. นั่นไม่ใช่รายการตรวจสอบนั่นคือการยอมรับว่าการกู้คืนระบบนี้มีความซับซ้อนดังนั้นจึงต้องใช้สถาปนิกในการคิดออก บางครั้งนั่นคือทั้งหมดที่คุณทำได้ แต่พยายามหลีกเลี่ยงถ้าเป็นไปได้
เอกสาร DR ที่เป็นเลิศประกอบด้วยรายการตรวจสอบขั้นตอนสำหรับสิ่งต่าง ๆ :
- ขั้นตอนการจัดเรียงเพื่อหาว่ามีอะไรผิดพลาดซึ่งจะช่วยระบุ ...
- ขั้นตอนการกู้คืนสำหรับความล้มเหลวบางกรณี สนับสนุนโดย ...
- สคริปต์การกู้คืนเขียนไว้ล่วงหน้าเพื่อช่วยลดข้อผิดพลาดของมนุษย์ระหว่างการกู้คืน
- เอกสารคู่มือสไตล์เกี่ยวกับกรณีความล้มเหลวสาเหตุที่เกิดขึ้นและสิ่งที่พวกเขาหมายถึง
บางครั้งขั้นตอน Triage เป็นเอกสาร DR ทั้งหมดที่คุณสามารถทำได้สำหรับบางระบบ แต่ถ้ามีหมายความว่าการโทรออก 4am จะเป็นที่เข้าใจได้ง่ายขึ้นและวิศวกรอาวุโสที่ทำการกู้คืนจะสามารถแก้ไขปัญหาที่เกิดขึ้นได้เร็วขึ้น
บางกรณีความล้มเหลวมีขั้นตอนการกู้คืนตรงไปตรง จัดทำเอกสาร ในขณะที่บันทึกเอกสารคุณอาจพบกรณีที่รายการคำสั่งถูกป้อนตามลำดับเฉพาะซึ่งเป็นกรณีการใช้งานที่ยอดเยี่ยมสำหรับการสร้างสคริปต์ มันสามารถเปลี่ยนกระบวนการกู้คืน 96 จุดเป็น 20 จุดหนึ่ง คุณจะไม่มีทางรู้ได้เลยว่าคุณสามารถเขียนสคริปต์อะไรได้จนกว่าคุณจะแมปการดำเนินการตามขั้นตอนการกู้คืนตามการกระทำ
เอกสารประกอบแบบคู่มือสำหรับกรณีความล้มเหลวเป็นสต็อปหลังทิ้งสุดท้ายที่จะใช้เมื่อไม่มีกระบวนการกู้คืนหรือกระบวนการกู้คืนล้มเหลว มันให้คำแนะนำของ google ที่จำเป็นในการหาคนอื่นที่มีปัญหานั้นและสิ่งที่พวกเขาทำเพื่อแก้ไข