ความท้าทายในการปรับใช้เมตริก pre-DevOps


9

TL; DR คุณจะพิสูจน์ได้อย่างไรว่า devops โดยเฉพาะอย่างยิ่งการปรับใช้อัตโนมัติจะปรับปรุงอัตราความล้มเหลวในการเปลี่ยนแปลงได้อย่างไร

เราทุกคนพยายามรวบรวมตัวชี้วัดใน 'ความล้มเหลวในการนำไปใช้งาน' โดยใช้วิธีการปัจจุบัน (ส่วนใหญ่เป็นคู่มือ) น่าเสียดายที่ 'ล้มเหลว' ไม่ค่อยเกิดขึ้นใช่ไหม เนื่องจากเมื่อมีบางอย่างผิดปกติทีมจะรวมตัวกัน (โดยทั่วไปจะมีฮีโร่) เพื่อแก้ไขปัญหา (โดยทั่วไปคือการอนุญาตการตั้งค่าที่ไม่ได้รับ ดังนั้น ... เมื่อเราถามว่าการปรับใช้เป็นอย่างไรคำตอบคือ "ใช้ได้"

แต่เรารู้โดยสัญชาตญาณว่าไม่ดี รายงานสถานะ devops ประจำปี 2560 ระบุว่ามีอัตราการเปลี่ยนแปลงความล้มเหลว 31-45% ในขณะที่ฟังดูมีเหตุผลอย่างถูกต้องพวกเขาจะถูกติดตามเป็นเหตุการณ์หรือไม่ Nah เพราะพวกเขาได้รับการแก้ไขอย่างรวดเร็วโดยปกติในระหว่างการตรวจสอบ เป็นการยากยิ่งกว่าที่จะย้อนกลับการปรับใช้จริง

ดังนั้นจึงต้องใช้วินัยในการรายงานอัตราความล้มเหลวอย่างแม่นยำ เราไม่อยากให้รายงานแบบนั้นเพราะเราต้องการให้สิ่งต่าง ๆ ทำงานและเราทำสิ่งที่จะทำให้มันเกิดขึ้น

ดังนั้นคุณจะพิสูจน์ได้อย่างไรว่า devops โดยเฉพาะอย่างยิ่งการปรับใช้อัตโนมัติจะปรับปรุงอัตราความผิดพลาดที่เปลี่ยนแปลง

(PS พยายามติดแท็กด้วย "# devops-Ability-model")


สิ่งหนึ่งที่อาจเป็นประโยชน์คือดูกรณีศึกษาเป็นตัวอย่าง (นอกเหนือจากการสำรวจที่คุณอ้างอิง)
James Shewey

คำตอบ:


6

เทคนิคที่เราใช้ในอดีตในสถานการณ์ที่คล้ายคลึงกันคือการได้รับ "ความมุ่งมั่นในการจัดการ" ที่กำหนดกฎเหล่านี้ให้กับสมาชิกทุกคนในทีม:

  1. การเข้าถึงเพื่ออัปเดตพื้นที่การปรับใช้เป้าหมาย (เช่นการผลิต) จำกัด เฉพาะระบบอัตโนมัติที่เลือกซึ่งมีหลักฐานการตรวจสอบที่เหมาะสม (= การบันทึก) ของการอัปเดตประเภทใด ๆ ไปยังพื้นที่ที่พวกเขาจัดการ

  2. การอัพเดตด้วยตนเองไปยังพื้นที่การปรับใช้เป้าหมายไม่ว่าด้วยเหตุผลใดก็ตามไม่ได้รับอนุญาตจากสมาชิกทีมทั่วไป (รหัสผู้ใช้) ที่เคยใช้ (อนุญาต) เพื่อทำการอัปเดตเหล่านี้ แต่จะสร้างรหัสผู้ใช้ใหม่ (เพิ่มเติม) ซึ่งจะมีสิทธิ์ที่จำเป็นทั้งหมดในการ (ยัง) ดำเนินการอัปเดตด้วยตนเองดังกล่าวทุกครั้งที่ต้องการ แต่จริงๆแล้วจะสามารถใช้ ID ผู้ใช้ใหม่เหล่านั้น (= ทำการเข้าสู่ระบบด้วยพวกเขา) สมาชิกในทีมที่ต้องการเข้าสู่ระบบด้วย ID ผู้ใช้ใหม่ดังกล่าวจะต้องดำเนินการขั้นตอนพิเศษ "บางอย่าง" เพื่อเข้าถึงรหัสผ่านสำหรับ รหัสผู้ใช้ใหม่ดังกล่าว เป็นการดีที่ขั้นตอนพิเศษนี้เป็นไปโดยอัตโนมัติด้วย (ใช้จินตนาการของคุณเองว่าควรจะเป็นอย่างไร) แต่หากมีสิ่งใดที่ล้มเหลวเพียงแค่ติดต่อ (= อีเมลโทรและอื่น ๆ ) ผู้รักษาประตูของรหัสผ่านที่ต้องการรวมถึง "ปัญหาที่พวกเขามี เพื่อรับการแก้ไข "

  3. การดูแลประตูในสถานที่นั้นไม่ใช่เรื่องง่าย และการต่อต้านส่วนใหญ่จะมาจาก ... สมาชิกในทีม (ด้วยเหตุผลทุกประเภท) ดังนั้นรูปแบบของรหัสผู้ใช้ใหม่เหล่านั้น (เช่นเดียวกับในขั้นตอนก่อนหน้า) คือสมาชิกในทีมแต่ละคนจะได้รับ ID ผู้ใช้เพิ่มเติม (ด้วยรหัสผ่านที่พวกเขาตัดสินใจเอง) แต่ด้วยสตริงเพิ่มเติมที่แนบมากับมัน เข้าสู่ระบบด้วย ID ผู้ใช้ (พิเศษ) หากพวกเขามีเหตุผลที่ดีที่จะทำเช่นนั้น และทุกครั้งที่พวกเขาเข้าสู่ระบบดังกล่าวพวกเขาจะต้องยื่นรายงานบางประเภทเกี่ยวกับ "ปัญหาที่พวกเขาแก้ไข" (คล้ายกับคำถามของคุณ)

ด้วยขั้นตอนเหล่านี้สิ่งที่เหลือให้ทำคือการตรวจสอบรายงาน / เหตุผลเหล่านั้นเป็นระยะ ๆ ว่าเหตุใดจึงต้องใช้ ID ผู้ใช้พิเศษดังกล่าวและถามคำถาม " มีสิ่งใดบ้างที่สามารถทำได้ ลดความจำเป็นในการเข้าสู่ระบบพิเศษเช่นนี้หรือไม่? "

อัปเดต :

อ้างอิงจากความคิดเห็นเพิ่มเติมของคุณด้านล่างคำตอบนี้:

ฉันคิดว่าการเพิ่มอุปสรรคเทียมเพื่อแก้ไขปัญหาการปรับใช้นั้นมีประสิทธิภาพ

จริงมันเพิ่มอุปสรรคพิเศษ แต่ฉันไม่เชื่อว่ามันเป็น "ประดิษฐ์" เพราะนี่คือความรู้ของฉันวิธีเดียวที่จะตระหนักถึงสิ่งที่สมาชิกในทีมเหล่านั้นไม่เช่นนั้นจะไม่เคยบอกคุณด้วยเหตุผลเช่น:

  • งานรักษาความปลอดภัย.
  • สิ่งที่ไม่ดี / การปฏิบัติที่พวกเขาต้องการซ่อนอยู่
  • พลังงานที่พวกเขาไม่ต้องการที่จะหลวม

ขอบคุณสำหรับคำติชม ในขณะที่อาจใช้งานได้ฉันคิดว่าการเพิ่มอุปสรรคเทียมเพื่อแก้ไขปัญหาการปรับใช้นั้นตอบโต้ได้ มันใช้งานหนัก แต่อาจจำเป็นในบางกรณี ฉันชอบการตรวจสอบหลังการปรับใช้ที่จำเป็นเมื่อควันจางไป มันทำลายน้อยลง แต่ต้องมีระดับความมุ่งมั่นของการจัดการในระดับเดียวกัน ฉันแค่อยากรู้ว่าคนอื่นทำสิ่งนี้หรือไม่
John O'Keefe

5

รายงานสถานะ devops ประจำปี 2560 ระบุว่ามีอัตราการเปลี่ยนแปลงความล้มเหลว 31-45% ในขณะที่ฟังดูเหมาะสมอย่างถ่องแท้พวกเขาติดตามว่าเป็นเหตุการณ์หรือไม่ Nah เพราะพวกเขาได้รับการแก้ไขอย่างรวดเร็วโดยปกติในระหว่างการตรวจสอบ

ปัญหาที่ได้รับการแก้ไขอย่างรวดเร็วยังคงเป็นปัญหา หากคุณไม่ได้รายงานสิ่งเหล่านี้เป็นปัญหา

ดังนั้นจึงต้องใช้วินัยในการรายงานอัตราความล้มเหลวอย่างแม่นยำ เราไม่อยากให้รายงานแบบนั้นเพราะเราต้องการให้สิ่งต่าง ๆ ทำงานและเราทำสิ่งที่จะทำให้มันเกิดขึ้น

หากเป้าหมายของคุณคือการทำงานให้สำเร็จคุณต้องซื่อสัตย์ต่อความล้มเหลวเพื่อป้องกันไม่ให้เกิดขึ้นอีกในอนาคต ดูเหมือนว่าทีมที่นี่กำลังโกหก (อาจเป็นตัวของตัวเองแน่นอนเกี่ยวกับการจัดการ) เกี่ยวกับความล้มเหลวเพราะเป้าหมายของพวกเขาคือการทำให้สิ่งต่าง ๆดูเหมือนจะทำงานได้

สิ่งเหล่านี้แตกต่างกัน เช่นใช้เรื่องตลกเก่า ๆ ที่ QA สร้างข้อบกพร่อง - "โค้ดของฉันใช้ได้ดีจนกระทั่ง QA ได้รับการดูแลแล้วจากนั้นพวกเขาก็ทำข้อผิดพลาดเหล่านี้ทั้งหมด!" ข้อบกพร่องอยู่ที่นั่นตลอด แต่นักพัฒนาก็ไม่รู้ของพวกเขา เป้าหมายของทีมปฏิบัติการควรเป็นความน่าเชื่อถือที่แท้จริงและพวกเขาจำเป็นต้องได้รับแรงจูงใจจากผู้บริหารของพวกเขา นั่นหมายความว่าหากพวกเขาทำการตรวจสอบเพิ่มเติมในสถานที่ที่นำไปสู่การค้นพบปัญหาใหม่พวกเขาควรได้รับรางวัลไม่ใช่การลงโทษสำหรับความน่าเชื่อถือที่ลดลงในภายหลัง


TL; DR คุณจะพิสูจน์ได้อย่างไรว่า devops โดยเฉพาะอย่างยิ่งการปรับใช้อัตโนมัติจะปรับปรุงอัตราความล้มเหลวในการเปลี่ยนแปลงได้อย่างไร

หากคุณพยายามกระตุ้นให้เกิดการเปลี่ยนแปลงในองค์กรของคุณคุณไม่ควรพยายามพิสูจน์อะไร แต่ให้หลักฐานว่าองค์กรอื่นพูดถึงการเปลี่ยนผ่านของตนเอง หากคุณกำลังพยายามวัดกระบวนการที่คุณมีอยู่แล้วและปรับการมีอยู่ของพวกเขาต่อไปคุณควรจะติดตามตัวชี้วัดความน่าเชื่อถือมาตรฐานเช่นเวลาเฉลี่ยในการซ่อม (MTTR)

แต่หลักการของการแยกส่วนไม่ได้เป็นเพียงแค่การเพิ่มความน่าเชื่อถือเท่านั้น แม้แต่วิศวกรรมความน่าเชื่อถือของไซต์ไม่ได้เป็นเพียงแค่การเพิ่มความน่าเชื่อถือเท่านั้น คุณต้องการได้ระดับความน่าเชื่อถือที่เหมาะสม - สิ่งที่เป็นประโยชน์ต่อธุรกิจ แต่ไม่เป็นอุปสรรคต่อการพัฒนา และที่นำขึ้นแรงจูงใจที่แท้จริงใน DevOps ซึ่งก็คือการเปลี่ยนแปลง Empower คุณต้องการอนุญาตให้ธุรกิจตอบสนองต่อสิ่งเร้าในตลาดได้เร็วขึ้นซึ่งเกิดขึ้นจากการลดความฝืดของนักพัฒนาการเพิ่มอัตราการปรับใช้กระบวนการอัตโนมัติด้วยตนเอง ฯลฯ ขณะที่อยู่ในขอบเขตความน่าเชื่อถือที่ยอมรับได้ ซึ่งหมายความว่าคุณจำเป็นต้องวัดความน่าเชื่อถือ แต่คุณต้องวัดความเร็วด้วยเพราะเป้าหมายของคุณคือการเพิ่มระดับหลังในขณะที่รักษาความคงที่เดิมไว้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.