สัญญาณเริ่มต้นของดูแลระบบที่ไม่ดี


43

เรากำลังจะได้รับดูแลระบบครั้งแรกของเราเพื่อดูแลเซิร์ฟเวอร์ SQL จำนวนมากซึ่งก่อนหน้านี้ได้รับการดูแลอย่างเชื่องช้าโดยส่วนผสมของนักพัฒนาและฝ่ายสนับสนุนด้านไอที มันเลยเวลานานเกินไปและเราพยายามเกลี้ยกล่อมคนที่สูงกว่าให้ยอมรับหนึ่งปี
ในที่สุดพวกเขาก็ทำ แต่เงินเดือนที่เราสามารถเสนอได้นั้นไม่ได้เป็นแรงบันดาลใจที่จะพูดน้อยที่สุด อย่างไรก็ตามเราได้ขัดขวางอย่างใดอย่างหนึ่ง
สิ่งที่ฉันอยากรู้คือสัญญาณเริ่มต้นที่ควรระวังว่าระบบดูแลระบบใหม่ไม่รู้จริง ๆ ว่าพวกเขากำลังทำอะไรหรือนิสัยที่เป็นอันตรายที่ควรมองหาโดยเน้นเฉพาะใน SQL Server ฉันรู้สึกประหม่าเล็กน้อยที่การล่าสัตว์ต่อรองชั้นใต้ดินของเราอาจไม่ได้ผลดีเกินไปซึ่งเป็นกรณีของบทบาทอื่น ๆ

มีความคิดอะไรมั้ย


5
ครั้งแรกที่ผมอ่านแท็ก SQL เซิร์ฟเวอร์ของคุณหมายความว่า SQL เซิร์ฟเวอร์เป็นหนึ่งในสัญญาณเตือน ...
Mikeage

คำตอบ:


122

เอาส่วนแรกนี้ไปด้วยเม็ดเกลือเพราะมันอาจได้รับอิทธิพลจากการที่ฉันทำงานเป็นผู้รับเหมาเป็นเวลาหลายปี

ลองพิจารณาที่ผู้รับเหมาหากความสามารถในการชำระเงินของคุณเป็นเช่นนั้นซึ่งคุณไม่สามารถดึงดูดคนที่มีความสามารถสูงสุดในการทำงานเต็มเวลา หากคุณจ่ายเงินน้อยเกินไปและขอมากเกินไปคุณจะได้รับพนักงานที่มีทักษะต่ำพนักงานที่มีข้อบกพร่องที่เห็นได้ชัดซึ่งอาจไม่เกี่ยวข้องกับทักษะ (ทักษะความสัมพันธ์ระหว่างบุคคลที่ไม่ดีปัญหาการใช้สารเสพติด ฯลฯ ) หรือคุณ จะจบลงด้วยตำแหน่ง "ประตูหมุน" ที่พนักงานทำงานชั่วขณะหนึ่งและปล่อยให้จ่ายดีกว่า

หาก บริษัท ของคุณถูกแขวนทั้งจ่ายน้อยเกินไปและต้องการใครสักคนในช่วงเวลาที่กำหนดแทนที่จะทำตามหน้าที่ที่กำหนดไว้แสดงว่าคุณอาจตกอยู่ในสถานการณ์ที่สิ้นหวัง เช่นเดียวกันหากงานจะทำให้พนักงานเต็มเวลายุ่งและ บริษัท กำลังวางแผนที่จะจ่ายเงินน้อยเกินไปมันก็สิ้นหวังเช่นกัน คุณจะได้รับสิ่งที่คุณจ่ายไปในระยะยาวไม่ทางใดก็ทางหนึ่ง

ฉันเดาว่าคุณไม่มีความต้องการแบบเต็มเวลาจริง ๆ และ บริษัท อาจใช้จ่ายเงินเดือนตามที่วางแผนไว้หรือน้อยกว่ากับผู้รับเหมาที่จะทำทุกอย่างที่คุณต้องการ

ผู้รับเหมาง่ายกว่าที่จะ "กำจัด" ถ้าความสัมพันธ์คือ "ไม่เหมาะสม" ผู้รับเหมามักจะมีความยืดหยุ่นมากกว่าพนักงานที่ทำงานเต็มเวลา: โลจิสติกงาน (วันหยุดสุดสัปดาห์ช่วงเย็นและอื่น ๆ ) ผู้รับเหมาที่ดีจะปฏิบัติต่อความต้องการของ บริษัท ของคุณด้วยทักษะและความเอาใจใส่ในระดับสูงเพราะพวกเขารู้ว่า บริษัท ของคุณสามารถตัดความสัมพันธ์และมองหาที่อื่นได้ง่ายเพียงใด


สิ่งนี้กำลังจะเกิดขึ้นซ้ำซากจริง ๆ แต่เหนือกว่ารายการอื่น ๆ ด้านล่างให้ความสนใจกับความสามารถของระบบการสื่อสารกับผู้อื่น ทักษะการเขียนและการพูดขั้นพื้นฐานมีความสำคัญและทำสิ่งต่างๆมากมายเพื่อระบุสถานะของกระบวนการทางจิตที่เกิดขึ้น "เบื้องหลัง" งานดูแลระบบควรเกี่ยวข้องกับการสื่อสารกับพนักงานด้านไอทีและพนักงานที่ไม่ใช่ฝ่ายไอทีและความสามารถในการสื่อสารอย่างมีประสิทธิภาพเป็นสิ่งจำเป็น การมีความสามารถในการก่อให้เกิดการเปรียบเทียบและสื่อสารแนวคิดเชิงนามธรรมนั้นเป็นสิ่งที่ดีอย่างมาก "ไอซิ่งบนเค้ก" แต่ถ้า sysadmin ของคุณไม่สามารถเขียนประโยคที่สมบูรณ์หรือพูดความคิดที่สมบูรณ์ได้

มีจุดในคำตอบของคนอื่นที่แหวนจริงสำหรับฉันอีกครั้ง: "ไม่ดี" (ไม่ว่าจะเป็นพนักงานหรือผู้รับเหมา) ฉันเป็นคนที่ช่วย บริษัท ต่างๆในการลดช่องว่างระหว่างการดูแลระบบที่ไม่ดีและจ้างงานทดแทนและฉันได้เห็นสถานการณ์เลวร้ายหลายอย่างเกิดขึ้น (การเป็นคนที่เปลี่ยนรหัสผ่านมองหา "ประตูหลัง" ฯลฯ ในขณะที่ระบบดูแลอยู่ในสำนักงานซีอีโอที่ถูกไล่ออกเป็นงานที่สนุก แต่เครียดด้วย)

ทัศนคติที่น่ารังเกียจ "ไอทีเฉพาะ" บางอย่างที่ฉันเคยเห็น (คำตอบจากบางส่วนของคำตอบโปสเตอร์อื่น ๆ ที่นี่อย่างหน้าไม่อาย) ในสถานการณ์ที่ผิดปกติรวมถึง:

  • ตัดทุกอย่างออกไปและเริ่มต้นใหม่ : มันเป็นสิ่งหนึ่งที่จะระบุสิ่งที่เป็น "ระเบิดเวลาฟ้อง" และดูแลมัน แต่บ่อยครั้งในเรื่องไอทีที่ฉันเจอ ในภาพของพวกเขาและครอบงำมากกว่าลบโครงสร้างพื้นฐานเก่าเพื่อประโยชน์ในการติดตั้งใหม่ เป็นเรื่องหนึ่งที่ต้องทำเรื่องธุรกิจสนับสนุนโดยข้อเท็จจริงและ ROI ที่คาดการณ์ไว้ แต่ฉันเคยเห็นความผิดปกตินี้ว่าเป็นอะไรที่มากกว่าไดรฟ์ส่วนบุคคลที่แข็งแกร่งเพื่อทดแทนระบบเพื่อทดแทน

  • ฉันไม่สามารถบอกคุณได้: เหล่านี้คือผู้ดูแลระบบซึ่งในขณะที่มีส่วนร่วมเป็นเจ้าของที่แข็งแกร่งในการทำงานของพวกเขาไปไกลเกินไปและกลายเป็นความเป็นเจ้าของมากเกินไป, ความลับและหวาดระแวง คอมพิวเตอร์เป็นของธุรกิจไม่ใช่ดูแลระบบ ความล้มเหลวในการจัดทำเอกสารเปิดเผยรหัสผ่านหรือเปิดเกี่ยวกับการทำงานของระบบ (หรือล้มเหลว) ไม่ใช่สัญญาณที่ดี ฉันเคยได้ยิน sysadmins บางคนอ้างถึง "ความปลอดภัย" เนื่องจากเหตุผลที่จะเป็นความลับ แต่ความปลอดภัยโดยความสับสนนั้นไม่ใช่ความปลอดภัย ฉันเคยได้ยินผู้ดูแลระบบที่มีทัศนคติเช่นนี้พูดว่า "ใช่ แต่ถ้าฉันให้รหัสผ่านแก่ผู้อื่นพวกเขาจะทำผิดพลาด" โดยปกติแล้วสิ่งนี้จะมาพร้อมกับคำสั่งที่ถูกปกปิดหรือหวาดกลัวอย่างมากสำหรับการถูกตำหนิหากมีสิ่งผิดปกติเกิดขึ้นหลังจากการเปิดเผย

  • โทษใครบางคน / ทุกคน / คนอื่น ๆ : นี่คือระบบดูแลระบบที่อ้างอิงบุคคลที่สามผู้บุกเบิกหรือผู้ใช้ที่ประสบปัญหาอย่างต่อเนื่อง แน่นอนว่ามีเป็นปัญหาที่เกิดจากปัจจัยเหล่านี้ทั้งหมด แต่รูปแบบของการที่สอดคล้องกันและซ้ำนิ้วชี้เป็นสัญญาณที่ไม่ดี เราทุกคนต้องจัดการกับข้อผิดพลาดของฮาร์ดแวร์ข้อบกพร่องของซอฟต์แวร์และผู้ใช้ที่สร้างปัญหาด้วยตนเอง ความสามารถในการระบุแหล่งที่มาเหล่านี้อย่างใดอย่างหนึ่งเป็นสาเหตุของปัญหาไม่ได้ชี้ไปที่นิ้ว แม้ว่าจะไม่เต็มใจที่จะตรวจสอบปัญหาและระบุสาเหตุที่แท้จริงรวมกับปฏิกิริยาของมือโบกมือและพูดว่า "มันต้องเป็นเพราะเราเตอร์ Windows / Linux / Cisco เราเตอร์ / etc ... " เป็นเรื่องน่ากังวล

  • การเดินทางด้วยพลัง : สิ่งเหล่านี้คือผู้ดูแลระบบที่พอใจและตั้งค่าสิ่งกีดขวางบนถนนสำหรับผู้ใช้เนื่องจากวาระส่วนตัวหรือวาระทางธุรกิจที่รับรู้ อีกประการหนึ่งคือการ จำกัด ผู้ใช้ด้วยเหตุผลทางธุรกิจที่สมเหตุสมผล แม้ว่าจะเป็นอีกหนึ่งการเป็น "ผู้ให้บริการด้านไอที" เพียงเพื่อความคลั่งไคล้ในการควบคุมผู้อื่น ผมเคยเห็นความผิดปกตินี้โดยเฉพาะการขยายเข้าจริงๆสิ่งที่น่ารังเกียจเช่น "อีสะกดรอยตาม" ของพนักงานโดยการอ่านอีเมลของพวกเขาดำเนินการซ่อนเร้นจับหน้าจอ / ครั้ง, ฟังโทรศัพท์และเพียงโดยทั่วไปเป็นคน "น่าขนลุก" กับคนอื่น ๆ

  • นโยบายใช้ไม่ได้กับฉัน : บ่อยครั้งที่รวมกับทัศนคติ "พลังการเดินทาง" เหล่านี้คือผู้ดูแลระบบที่ปฏิเสธที่จะอยู่ภายใต้นโยบายไอทีที่พวกเขาเองบังคับใช้หรือกำหนด ในขณะที่สามารถเป็นพิษเป็นภัยและไม่เป็นอันตรายฉันได้เห็นสาเหตุนี้สถานการณ์ที่น่ารังเกียจเช่นการดำเนินคดีทางเพศคุกคาม (ข่มขู่ดูแลระบบและแสดงเนื้อหาที่ไม่เหมาะสมในการทำงาน) Sysadmins อยู่ในตำแหน่งที่เชื่อถือได้และจำเป็นต้องรักษาทัศนคติของความเป็นมืออาชีพ ส่วนหนึ่งของทัศนคตินั้นหมายถึงการเล่นตามกฎเดียวกันและรับผิดชอบเหมือนคนอื่น ๆ เพียงเพราะเรามีความสามารถในการทำกิจกรรม "ปิดการบันทึก" ด้วยสิทธิ์การเข้าถึงและสิทธิ์ที่ยกระดับของเราไม่ได้หมายความว่าเราควรทำ

  • ไม่สามารถยอมรับความอ่อนแอได้: คนที่แข็งแรงต้องพูดว่า "ฉันไม่รู้คำตอบของสิ่งนั้น แต่ฉันหามันเจอคุณ" ทุกคนมีช่องว่างในความรู้และประสบการณ์ ความผิดปกตินี้มักส่งผลให้เกิดสถานการณ์ที่ดูแลระบบสิ้นสุดลงอย่างมากมายเหนือศีรษะ สิ่งสำคัญคือการใช้ความเสี่ยงที่คำนวณได้ในการพัฒนาอาชีพและอาจกล่าวได้ว่าการเติบโตส่วนบุคคลที่ดีเกิดขึ้นเมื่อผู้คน "กัดมากกว่าที่พวกเขาสามารถเคี้ยว" และประสบความสำเร็จ ในทางกลับกันค่าใช้จ่ายที่ดี (หรือความล้มเหลวทันที) สำหรับธุรกิจสามารถเกิดขึ้นได้ง่ายเมื่อดูแลระบบตัดสินใจที่จะจัดการกับปัญหาที่สำคัญเช่นการกู้คืนระบบหรือความปลอดภัยด้านไอทีและล้มเหลวเนื่องจากขาดความสามารถ ผู้จัดการที่ไม่อนุญาตให้พนักงานเข้าถึงทรัพยากร / การฝึกอบรม / การสนับสนุน / บุคคลที่สามอย่างไม่สมเหตุสมผลอาจช่วยสร้างวัฒนธรรมประเภทนี้ได้

  • นี่คือของเล่นของฉัน: นี่คือระบบดูแลระบบที่ปฏิบัติต่อโครงสร้างพื้นฐานไอทีของธุรกิจเป็นของเล่นที่น่าตื่นเต้น เป็นสิ่งหนึ่งที่จะระบุเทคโนโลยีที่น่าสนใจโดยเฉพาะที่เกิดขึ้นเพื่อตอบสนองความต้องการทางธุรกิจได้ดี แต่ก็เป็นอีกเรื่องหนึ่งที่มีอิทธิพลต่อธุรกิจที่จะใช้จ่ายเงินกับเทคโนโลยีเพื่อจุดประสงค์ที่ไม่ได้ระบุว่าเป็นสิ่งที่สนุกกับการเล่น ฉันเคยเห็นสถานการณ์ที่ผู้ดูแลระบบเริ่มหลงใหลในเทคโนโลยีที่กำหนดและตัดสินใจที่จะนำเทคโนโลยีนั้นมาใช้เพื่อแก้ปัญหาไม่ใช่เพราะมันเหมาะกับความต้องการทางธุรกิจ แต่เป็นเพราะมันเป็นสิ่งที่พวกเขาต้องการเล่นด้วย ฉันได้เห็นสิ่งนี้เกิดขึ้นทุกสิ่ง: ไฟเบอร์ออปติกการจำลองเสมือนเกียร์ SAN เครือข่ายไร้สาย ฯลฯ ฝ่ายบริหารควรเก็บไว้ในที่ตรวจสอบให้มากที่สุด

  • ฉันทำแบบนี้มาตลอด: นี่คือดูแลระบบที่ตายไปแล้วในหนทางของพวกเขา โดยปกติแล้วฉันได้พบสิ่งนี้บวกกับทัศนคติของ "ฉันไม่ต้องการเรียนรู้เกี่ยวกับสิ่งใหม่" เช่นกัน สาขาของเรากำลังเปลี่ยนแปลง งานบางอย่างที่เราทำเมื่อ 10 ปีที่แล้วเป็นงานอัตโนมัติในวันนี้และบางงานก็ยังคงเป็น "งานเก่าเหมือนเดิม" ทุกอย่างเกี่ยวกับอุตสาหกรรมของเรากำลังได้รับการแก้ไขปรับปรุงและฟื้นฟูอยู่เสมอ แนวทางปฏิบัติที่ดีที่สุดเปลี่ยนไปช้ากว่า แต่ก็เปลี่ยนไปเช่นกัน มันไม่มีเหตุผลที่จะคาดหวังว่าระบบการดูแลระบบทุกอันจะต้องติดตามเทคโนโลยีที่ทันสมัย ​​แต่ก็ไม่สามารถยอมรับได้สำหรับผู้ดูแลระบบที่จะละเหี่ยเทคโนโลยีเก่าแก่หลายปี หากธุรกิจมีความกังวลเพิ่มขึ้นการดำเนินงานด้านไอทีควรเป็นสิ่งที่มองไปข้างหน้า (เห็นได้ชัดว่ามีความสมดุลที่นี่เช่นกัน

  • ไม่เข้าใจธุรกิจ : ธุรกิจ "ทำไอที" เพราะมันช่วยในการทำธุรกิจได้อย่างมีประสิทธิภาพ การใช้งานไอทีอื่น ๆ ในธุรกิจนั้นเป็นการต่อต้าน บ่อยครั้งที่ฉันเห็นผู้ดูแลระบบซึ่งไม่ทราบแนวคิดพื้นฐานของการบัญชีและธุรกิจ (รายรับน้อยกว่าค่าใช้จ่ายเท่ากับกำไร ฯลฯ ) ฉันไม่เคยคาดหวังว่าผู้ดูแลระบบจะเป็นผู้เชี่ยวชาญด้านการบัญชี แต่ฉันคาดหวังให้พวกเขาเข้าใจวิธีการพื้นฐานที่ธุรกิจต้องเสียค่าใช้จ่ายเพื่อจุดประสงค์ในการทำกำไร ในช่วงเศรษฐกิจตกต่ำโดยเฉพาะอย่างยิ่งมันเป็นเรื่องดีที่ได้ดูแลระบบของคุณให้เข้าใจว่าเงินนั้นมาจากไหนและเหตุใดธุรกิจจึงทำการตัดสินใจที่เกี่ยวข้องกับที่ที่เงินไป ดูแลระบบที่เชื่อว่าไอทีนั้นแตกต่างจากส่วน "ธุรกิจ" ของธุรกิจไม่ใช่สินทรัพย์

  • ไม่มีความต้องการความต่อเนื่อง : ในวัฒนธรรมการทำงานในปัจจุบันควรสันนิษฐานว่าเราทุกคนจะทำงานให้กับนายจ้างที่หลากหลาย งานของเราในวันนี้ไม่ใช่สถิติจะเป็นงานของเราตลอดไป ดูแลระบบที่ดีควรเตรียมเอกสารไม่ใช่เพราะ "พวกเขาอาจโดนรถบัส" แต่เพราะท้ายที่สุดแล้วพวกเขาก็ต้องการมันแทน ความไม่เต็มใจที่จะเตรียมเอกสารเนื่องจากการรับรู้ "ความปลอดภัยในการทำงาน" ของคนที่ไม่มีความปรารถนาในการเคลื่อนย้ายขึ้น ฉันไม่ได้ทำงานให้นายจ้างคนเดียวอีกต่อไป แต่ถ้าฉันทำฉันจะวางแผนสิ่งที่ฉันกำลังจะทำต่อไปและจัดทำเอกสารให้ทันสมัยเพื่อการเปลี่ยนของฉันจะมีเวลาที่ดีขึ้น (เช่นเดียวกับฉัน ชอบจากรุ่นก่อนหน้าในงานต่อไป)


38
มันยากที่จะอ่านสิ่งนี้ ทุกจุดที่คุณทำนั้นถูกต้องและแต่ละคนก็บังคับให้ฉันประเมินตนเอง
Nic

จุดที่ดีมาก ปัญหาบางอย่างนั้นติดเชื้อเช่นกัน แม้ว่า "ผู้ดูแลระบบที่ไม่ดี" ในที่สุดก็ย้ายหรือย้ายหรือสูญเสียความน่าเชื่อถือของพวกเขานิ้วชี้และ "วิพากษ์วิจารณ์ทุกอย่าง" คำวิจารณ์ได้เหมือนวัชพืชหยั่งรากในใจของการจัดการและใครก็ตามที่เหลืออยู่ในทีม ชนิดคล้ายกับ "พูด 2 ครั้งและต้องเป็นจริง" ซินโดรม
damorg

1
Evan ... คุณต้องการบล็อก ... ไม่เป็นไรฉันเพิ่งสมัครสมาชิกฟีดผู้ใช้ของคุณ
โจเซฟ Kern

3
@ นิค: การเขียนมันทำขึ้นมาเพื่อการประเมินตนเองเช่นกัน การมีทัศนคติเหล่านี้เพียงเล็กน้อยก็ไม่ได้เลวร้ายนักตราบใดที่มันยังคงมีการตรวจสอบและเหมาะสมกับสถานการณ์ ฉันนำเสนอ "ใบหน้า" ที่แตกต่างกันเล็กน้อยให้กับลูกค้าผู้รับเหมาของฉันแต่ละคนและเป็นที่น่าสนใจที่จะเห็นว่าฉันปรับแต่งทัศนคติของฉันอย่างไรขึ้นอยู่กับความต้องการของลูกค้าและการเปลี่ยนแปลงที่เกี่ยวข้องกับการโต้ตอบกับผู้ติดต่อของฉัน ไม่ว่าในกรณีใดฉันจะพยายาม "ลงเล่นกลาง" จริง ๆ และฉันพยายามที่จะไม่ล้มลงในหมวดใดหมวดหนึ่งเหล่านี้
Evan Anderson

1
@ โจเซฟ: ฉันพบว่ามันเป็นไปไม่ได้ที่จะติดตามบล็อก ฉันมักจะสูญเสียความคิดหัวข้อและฉันดูเหมือนจะใช้วิธีที่นานเกินไปที่จะเขียนอะไรสำหรับรูปแบบที่ เมื่อ Server Fault ให้แรงบันดาลใจฉันมีความสุขที่จะทำงานที่ปาก (แป้นพิมพ์?) นานเกินไป การโต้ตอบกับ Server Fault เป็นเรื่องสนุกมากขึ้นที่ฉันคิดว่าฉันเคยได้รับจากบล็อกด้วย
Evan Anderson

12

ความใจกว้าง คุณต้องการที่จะเห็นสิ่งที่เขาทำและวิธีการที่เขาทำมัน

ฉันจะบอกว่าอาการอันดับหนึ่งของซากรถไฟที่กำลังดำเนินอยู่คือถ้าผู้ชายล็อคทุกสิ่งและห้ามไม่ให้คนอื่นเข้าถึงระบบได้

เขาอาจให้คำเตือนที่เกี่ยวข้องกับ "ความปลอดภัย" ทุกประเภทเกี่ยวกับการอนุญาตให้ผู้อื่นมีการเข้าถึงและบัญชีและการรูทเครื่องบนเครื่องอื่น ๆ แต่บ่อยครั้งที่เป็น Smokescreen สำหรับคนที่ต้องการดูสิ่งสำคัญและทำให้ขยะของคุณเป็นรอง ง่ายต่อการจัดการการเข้าถึงในลักษณะที่อนุญาตการเข้าถึง แต่รักษาความปลอดภัยและความรับผิดชอบของระบบ

คนแปลกหน้าจะทำงานได้ดีขึ้นเมื่อพวกเขารู้ว่าจะมีคนอื่นเห็น ...


7
ในทางกลับกันบุคคลนี้ควรแสดงความกังวลเกี่ยวกับความปลอดภัยความมั่นคงและอื่น ๆ โดย sysadmins ธรรมชาติเป็นระบบที่พวกเขาจัดการ การมีจุดยืนด้านความปลอดภัยที่แข็งแกร่งและแสดงแนวโน้มที่แข็งแกร่งในการเป็นเจ้าของไม่ควรเป็นสาเหตุของการเตือนภัยเว้นแต่ว่าจะเป็นอุปสรรคต่อการทำงานวัฒนธรรมหรือเป้าหมายของ บริษัท
joeqwerty

1
ความปลอดภัยนั้นหมายถึงจุดจบไม่ใช่จุดจบในตัวของมันเอง ความปลอดภัยเป็นสิ่งจำเป็นในการรักษาความน่าเชื่อถือความเสถียรและความสามารถในการตรวจสอบของระบบ เวลาที่คุณใช้ล็อคระบบเพื่อให้มีเพียง suid binary หนึ่งระบบเท่านั้นที่สามารถใช้สร้างระบบอัตโนมัติได้ สำหรับหลาย ๆ คนความปลอดภัยเป็นเกมที่เล่นสนุก แต่เกมดังกล่าวไม่ได้เป็นที่สนใจของผู้ประกอบการส่วนใหญ่ นอกจากนี้หลายคนล็อคลงระบบจะไม่รวมสายตาที่จะตรวจสอบการทำงานของผู้ดูแลระบบและว่าเมื่อสิ่งที่มันสามารถไปปิดทางรถไฟ ...
คริส

3
Meh ผู้ดูแลระบบใหม่อาจมอบหมายให้เซิร์ฟเวอร์ของคุณเป็นไปตามข้อกำหนดบางประการหรืออื่น ๆ ขั้นตอนแรกที่ดีหลังจากทำความเข้าใจกับระบบอย่างละเอียดแล้วอาจเป็นการล็อคผู้พัฒนาไม่ให้ใช้ระบบการผลิตที่พวกเขาคุ้นเคยกับการเข้าถึง ตราบใดที่คนอื่นยังคงสามารถเข้าถึงได้ (เช่นฝ่ายไอทีและฝ่ายพัฒนาซอฟต์แวร์) ซึ่งเป็น IMO ที่ถูกต้อง
Kyle Hodgson

คริสคุณเพิ่งอธิบายบรรพบุรุษของฉันที่เพิ่งผ่านไปสี่เดือนก่อนที่ บริษัท จะตื่นขึ้นมาหาเขา ฉันใช้เวลาหลายเดือนในการค้นหาและแก้ไขทุกสิ่งที่เขาทำ
John Gardeniers

มันน่าประหลาดใจที่จำนวนความเสียหายที่สามารถทำได้ในเวลาเพียงไม่กี่เดือนและใช้เวลานานแค่ไหนในการกำหนดสิ่งต่าง ๆ ให้ถูกต้อง แค่คิดว่า ... บางครั้งผู้ดูแลระบบเช่นนั้นสามารถยึดที่มั่นมานานหลายปี
damorg

11

บางคำตอบที่ยอดเยี่ยมจนถึงตอนนี้; ฉันต้องการเพิ่ม:

กลัวงานหนักและ / หรือสกปรก เราไม่ควรออกไปเชิญคนที่ทำงานหนักและ / หรือสกปรกด้วยตัวเอง แต่เมื่องานที่น่ารังเกียจต้องทำมันเป็นสัญญาณที่ดีถ้าบุคคลนั้นแสดงความเต็มใจที่จะม้วนแขนเสื้อ

ล้มเหลวในการตระหนักว่าเหตุผลที่พวกเขาทำงานของพวกเขาคือเพื่อลูกค้า ในที่สุดนี่คือสิ่งที่มันเป็นเรื่องเกี่ยวกับ; ผู้คนต้องสามารถเข้ามาในห้วงแห่งความทรงจำแต่ละครั้งเข้าสู่ระบบและรับสิ่งของได้ ผู้ดูแลระบบที่ไม่เก็บสิ่งนี้ไว้ในใจของพวกเขาล้มเหลวในการทำงาน

ปล่อยให้ตัวเองออกไปติดต่อกับผู้คน เป็นเรื่องง่ายที่จะเข้าใจว่าคุณอยู่ในหอคอยงาช้างและไม่จำเป็นต้องจัดการกับผู้ใช้หรือรับสาย ผู้ใช้เป็นแหล่งข้อมูลที่สำคัญและมีความสำคัญต่อการตอบรับและโอกาสในการเรียนรู้ว่าสิ่งที่คุณวางไว้ใช้งานได้ดีหรือไม่ การจัดการใช้เวลาทุกเดือนในการทำงานกับฝ่ายช่วยเหลือนั้นยอดเยี่ยม

มีคน "โดยหนังสือ" มากเกินไป ตกลงมีหลายวิธีที่ดีอย่างสมบูรณ์แบบและเป็นเอกสารในการทำสิ่งต่าง ๆ ดังนั้นอันนี้แน่นอนที่สุดไม่ใช่กรณีของสุดขั้วหรืออีกอันหนึ่ง ฉันหมายถึงประเภทของบุคคลที่ยึดติดกับคู่มือ MCSE ของพวกเขาและปฏิบัติต่อทุกสิ่งในนั้นราวกับว่ามันเป็นวิธีที่หนึ่งจริงและเพียงอย่างเดียว

ล้มเหลวในการใช้วิธีการเชิงรุก ผู้ดูแลระบบที่ดีมักจะคาดการณ์แหล่งที่มาของปัญหาและจัดการกับพวกเขาก่อนที่จะกลายเป็นปัญหา ผู้ดูแลระบบที่ไม่ดีจะนั่งลงและตามชายฝั่งพร้อมปล่อยให้สิ่งต่าง ๆ สลายตัวไปรอบ ๆ พวกเขาอย่างช้า ๆ จนกว่าจะถึงวันที่น่ากลัวเมื่อมีบางอย่างพังทลายลงในช่วงเวลาทำการในช่วงเวลาวิกฤติ

เป็นผู้เผยแพร่เทคโนโลยี ฉันหมายถึงประเภทของบุคคลที่จะพยายามบังคับใช้ในระบบปฏิบัติการแอพหรือแพลตฟอร์มโปรดของพวกเขาโดยไม่คำนึงถึง คุณบอกว่าคุณมี SQL Server (ซึ่งหมายความว่าคุณเป็นบ้านของ Windows) ดังนั้นให้มองหาคนที่ยกย่องคุณงามความดีของ Linux หรือ Lotus Domino อย่างต่อเนื่อง

ลืมที่จะครอบคลุมเนื้อหาพื้นฐาน มันเป็นสนามที่ค่อนข้างใหญ่และในการที่จะทำสิ่งที่ซับซ้อนได้อย่างซับซ้อนเราจำเป็นต้องมีพื้นฐานที่ดีในพื้นฐาน คนดีจะถามคุณในทันทีเกี่ยวกับสิ่งต่าง ๆ เช่นกลยุทธ์การสำรองข้อมูลที่เก็บเอกสารกลางของคุณหากคุณมีอิมเมจพีซีมาตรฐานเมื่อครั้งสุดท้ายที่คุณมีการตรวจสอบสุขภาพไฟร์วอลล์ของคุณและอื่น ๆ สิ่งเหล่านี้เป็นสิ่งที่ทำให้คุณฟ้องร้องได้ทุกวันและมีความสำคัญเท่าเทียมกันกับสิ่งอื่นใด


1
ย่อหน้าแรกทำให้ฉันยิ้ม เมื่อฉันมีนายจ้างที่ต้องการให้ฉันดำดิ่งสู่มุมมืดที่เต็มไปด้วยฝุ่นเหล่านั้นเพื่อแทนที่สายเคเบิลเครือข่าย แต่ยังต้องการให้ฉันดูเท่ห์: สวมเน็คไทและแจ็คเก็ต :-)
Anonymous

6

ฉันจะบอกว่าสองสิ่งที่สำคัญที่สุดที่ควรมองหาในระบบดูแลระบบที่ดีคือโครงสร้างในงานของพวกเขาและความกระหายในความรู้ดังนั้นการขาดสิ่งใดสิ่งหนึ่งหรือทั้งสองอย่างนี้จะเป็นสัญญาณเตือนภัยล่วงหน้า

เกือบจะไม่มีใครสามารถเดินในการทำทุกอย่างในวันแรก แต่ถ้าคุณมีเวลาให้พวกเขาหยิบของขึ้นมาอย่ามุ่งเน้นไปที่การขาดทักษะ / ประสบการณ์ที่เฉพาะเจาะจงหากพวกเขาเป็นผู้ดูแลระบบที่ดี จะค้นคว้าบิตที่พวกเขาไม่ทราบภายในไม่กี่นาทีของการเดินเข้าประตูและจะเพิ่มความเร็วขึ้นอย่างรวดเร็ว

พวกเขาควรจะสนใจในสิ่งที่ระบบ / เครื่องมือทดสอบ / อ้างอิงพวกเขามี - นี่จะแสดงให้เห็นว่าพวกเขาต้องการลองสิ่งใหม่ ๆ โดยไม่ต้องเสี่ยงต่อสภาพแวดล้อมการผลิตพวกเขาอาจต้องการชุดนี้มากเกินไป แต่ดีกว่าที่พวกเขาต้องการมากกว่า ไม่มีเลย

โอ้และลองใช้http://jobs.serverfault.com/เพื่อค้นหาคนที่ใช่;)


5

Chopper3 และ damorg ทำคะแนนได้ดีมาก นอกจากนี้ฉันจะเน้นให้เวลาดูแลระบบใหม่เพื่อปรับตัวและรับความสะดวกสบายทั้งในตำแหน่งและ บริษัท มีแง่มุมของมนุษย์ที่จะต้องพิจารณาเพราะโดยทั่วไปแล้วมันเป็น Akward และประสาท wracking เป็น "คนใหม่" พวกเขาจะต้องใช้เวลาในการ "คิดออก" สิ่งที่คุณได้รับวิธีกำหนดค่า ฯลฯ และอื่น ๆ และพวกเขาจะต้องใช้เวลาในการเริ่มรู้สึกสะดวกสบายกับผู้คนและวัฒนธรรมของ บริษัท อย่ารีบประเมินหรือตัดสินเกี่ยวกับทักษะหรือลักษณะบุคลิกภาพที่คุณเห็นในสิ่งเหล่านั้นซึ่งอาจเป็นผลมาจากความกังวลใจ ฯลฯ


4

เอกสารการทำงาน และเอกสารการทำงานบางอย่างเพิ่มเติม

แก้ไข: มันผิด แต่คุณเข้าใจ นั่นคือสิ่งที่ระบบดูแลระบบที่ดีทำเพื่อให้คุณสามารถตรวจสอบงานของเขา / เธอ


4

เมื่อมีปัญหาเกิดขึ้นไม่ว่าจะเป็นในการผลิตหรือสภาพแวดล้อมการทดสอบบุคคลนี้จะตรวจสอบสาเหตุที่แท้จริงหรือคิดว่าเป็นเหตุการณ์ที่เกิดขึ้นครั้งเดียวหรือไม่?

เนื่องจากบุคคลนี้ไม่มีคำตอบทั้งหมดเขาหรือเธอมีทักษะมนุษยสัมพันธ์และความสุภาพเรียบร้อยในการขอความช่วยเหลือจากผู้อื่นหรือไม่

ดังที่@ Chopper3พูดความต้องการความรู้


4

สัญญาณเริ่มต้นของดูแลระบบที่ไม่ดี ....

  1. พักในห้องเซิร์ฟเวอร์
  2. ออกจากห้องเซิร์ฟเวอร์โดยบอกว่า 'ได้โปรดบอกฉันว่าเรามีการสำรองข้อมูลที่ดี!'

จะเพิ่มมากขึ้นตามที่ฉันคิดไว้


@Crankyadmin: ROFL
joeqwerty

1
3. มีชื่อผู้ใช้ที่มีลักษณะนิสัยที่ไม่พึงประสงค์ =)
Wesley

3

ฉันต้องการเพิ่มบางสิ่งมันเป็นประเภทของผู้ดูแลระบบ มักจะรายการระดับและไม่มีประสบการณ์

ฉันเรียกพวกเขาว่าปืนลูกซองอัพเกรด

ทุก ๆ ครั้งในระบบวัฏจักรการอัปเดตที่หยุดทำงานและหลายชั่วโมงหลายวันก็จะหายไป ปืนลูกซองเลื่อนได้หลงอีกครั้ง ดูแลระบบที่ดีควรทราบการพึ่งพาที่จำเป็นสำหรับระบบการผลิตของคุณในการทำงานและไม่ทำลายทุกครั้งที่การอัปเกรดมีศักยภาพในการทำเช่นนี้ ฉันจับหนึ่งครั้งในการแสดงครั้งเดียว

เขาอยู่ในขั้นตอนของการทำการอัพเกรดแบบไม่ต้องใส่ข้อมูลของระบบเดเบียนของเรา aptitude -y dist-upgrade> / dev / null 2> & 1 (มันแย่มากไม่เคยลองเลยมันมักจะบูตไม่ได้อีกแล้ว)

ฉันถามคุณกำลังทำอะไร เขาตอบว่าเปลี่ยนเส้นทางไปที่ / dev / null มันอุดตันหน้าจอ!


+1 สำหรับaptitude -y dist-upgrade > /dev/null 2>&1
Hubert Kario

2

ดังที่ Chopper3 ได้กล่าวถึงหลักฐานของวิธีการที่มีแบบแผนมีระเบียบวินัยและความเต็มใจที่จะเรียนรู้เป็นสัญญาณที่ดี

ในทางกลับกันสัญญาณเริ่มต้นของชุดทักษะที่ไม่ดีหรือ "พอดี" อาจรวมถึงการขาดความอดทนกับคำถามความไม่เต็มใจที่จะอธิบายเหตุผลทางเทคนิคการป้องกันอย่างต่อเนื่องและก้าวร้าวการป้องกันนิ้วที่ไม่สิ้นสุดที่เพื่อนร่วมงานและ / ด้วยเหตุผลนี้ไม่มีเหตุผลที่จะโบยมันให้ตายเป็นวรรคเป็นเวร)

นอกจากนี้ความปรารถนาที่จะ "ฉีกมันออกทั้งหมด" หรือทำซ้ำทุกอย่าง "วิธีที่ถูกต้อง" คือแนวโน้มที่จะรับชม

"ฉันจะทำให้มันเป็นไปได้ด้วยวิธีนี้" เป็นเรื่องปกติ แต่ถ้าไม่มีการประเมินสภาพแวดล้อมในปัจจุบันและจุดอ่อนของมันและแผนการที่สมเหตุสมผลในการแก้ไขปัญหาเหล่านั้นและตอบสนองความต้องการอื่น ๆ ที่อาจมีและการอภิปรายจำนวนมากฉันจะระวัง


2

มีคำตอบที่ยอดเยี่ยมอยู่แล้วดังนั้นฉันจะไม่ทำซ้ำ แต่จะเพิ่มในขณะที่นี่ไม่จำเป็นต้องระบุระบบที่ไม่ดีคนที่ทำงานให้กับถั่วลิสงอาจถูกคาดหวังว่าจะเป็นหรืออย่างน้อยก็กลายเป็นไม่พอใจอย่างรวดเร็ว กับงาน คนคนนั้นจะต้องคิดมากเกี่ยวกับงานต่อไปอย่างหลีกเลี่ยงไม่ได้และจะทำอย่างไรให้ได้งานอย่างที่เขา / เธอมีอยู่ในปัจจุบัน คุณสามารถคาดหวังใครสักคนที่จะมอบทุกอย่างในสถานการณ์แบบนี้ได้จริงหรือไม่? เมื่อคำนึงถึงสิ่งเหล่านี้แล้วโปรดตรวจสอบให้แน่ใจว่าเอกสารนั้นมีความทันสมัย


2

ฟังดูเหมือนฉันเพราะสัญชาตญาณของคุณได้บอกคุณแล้วว่าคุณจ้างไม่ดี & คุณกำลังมองหาหลักฐานที่จะบังคับใช้สัญชาตญาณนั้นอีกครั้ง

นี่คือพฤติกรรมของ SQL Server ที่ไม่ดี IMHO อาจเป็นสัญญาณของ DBA ที่ไม่มีประสบการณ์

  • รีบูทเซิร์ฟเวอร์หรือเริ่มต้นบริการเซิร์ฟเวอร์ sql อีกครั้งเพื่อแก้ไขปัญหา
  • การเพิ่มไฟล์บันทึกการทำธุรกรรมเพิ่มเติมในไดรฟ์ที่แตกต่างกันเนื่องจากบันทึกปัจจุบันหมดพื้นที่ว่างในดิสก์
  • การลดขนาดบันทึกธุรกรรมเป็นส่วนหนึ่งของการบำรุงรักษาตามปกติเพื่อควบคุมขนาดของบันทึก (ไฟล์ข้อมูลที่แย่ยิ่งกว่านั้น)
  • ใช้ตัวเลือกเปิดตารางใน SSMS (คะแนนโบนัสสามเท่าสำหรับใช้กับการผลิต)
  • การพึ่งพา SSMS GUI ทั้งหมดสำหรับการสำรองและกู้คืน
  • ไม่เข้าใจความแตกต่างระหว่างการลงชื่อเข้าใช้เซิร์ฟเวอร์ sql & ผู้ใช้เซิร์ฟเวอร์ sql

"การใช้ SSMS GUI สำหรับการสำรองและคืนค่า" เป็นคำสั่งที่กว้างเกินไป "การพึ่งพา SSMS GUI สำหรับการสำรองและเรียกคืนทั้งหมด" อาจสมจริงมากขึ้น?
เวสลีย์

1
ข้อเสนอแนะข้อสังเกต!
Nick Kavadias

เพื่อให้ห่างไกลสัญญาณที่มีแนวโน้มที่ระมัดระวังแม้ว่าเขาจะไม่ได้มีการทำมาก ๆ อื่น ๆ นอกเหนือจากนั่งในการประชุมและเรียนรู้การติดตั้ง ...
MartW

1

ไม่สามารถจัดลำดับความสำคัญและหลายงาน


1

การจัดการเวลา.

กำหนดเวลากิจกรรมรอบแผนงาน การบำรุงรักษาเป็นที่รู้กันดีต้องเกิดขึ้นในเวลาลง จัดการการสำรองข้อมูล ทดสอบการสำรองข้อมูล / เรียกคืน มีแผนการกู้คืนที่แอ็คทีฟ - ไม่ใช่เรื่องของหาก แต่เมื่อฮาร์ดแวร์จะล้มเหลว สิ่งที่ควรรู้ในการรู้ว่าสิ่งที่แตกหรือหลุดจากมือก่อนที่คุณจะสังเกตเห็น คิดว่านากิโอหรือโซลาร์วินด์เป็นสิ่งจำเป็นในการรู้ว่าระบบยังมีชีวิตอยู่หรือตายไปแล้ว

เอกสาร

ควรทำงานกับระบบตั๋ว วางตั๋วในนามของผู้ใช้ที่ไม่สามารถทำได้เพื่อติดตามปัญหา

ท่าที

เปิดกว้างเพื่อช่วยเหลือธุรกิจ ไม่สามารถเปิดไม่ได้ บอกว่าฉันสามารถทำได้ถ้าคุณให้ทรัพยากรเหล่านี้กับฉัน


0

ดูคำถามที่พวกเขาถาม ดูเหมือนว่าคุณมีระบบที่ซับซ้อนพอสมควร (หลากหลายเซิร์ฟเวอร์ SQL) ดังนั้นหากเป็นฉันสิ่งแรกที่ฉันจะทำคือรบกวนทุกคนและทุกคนที่จะพูดกับฉันเกี่ยวกับสิ่งที่พวกเขาทำทุกคนที่ขึ้นอยู่กับพวกเขาและทำไม และจดบันทึกมากมาย ฉันจะทำสิ่งนี้ในใกล้กับกระดานไวท์บอร์ดให้มากที่สุด

ควรพยายามค้นหาและทดสอบการสำรองข้อมูล หากมีปัญหาเกี่ยวกับประสิทธิภาพการทำงานฉันจะใช้งาน profiler และ perfmon (หรือเครื่องมือที่คล้ายกัน) เพื่อลองค้นหาว่าคิวรีใดก่อให้เกิดคำถามเหล่านั้น ฉันจะตรวจสอบฮาร์ดแวร์เพื่อให้แน่ใจว่าเซิร์ฟเวอร์ SQL จำนวนมากมีมิร์เรอร์ฮาร์ดแวร์อย่างน้อยแต่ละตัว

การตรวจสอบว่ามีระบบการตรวจสอบบางประเภทและนำไปใช้หากไม่มี Nagios และ cacti / rrdtool / mrtg เข้ามาในใจ

เหนือสิ่งอื่นใดถ้าคุณเห็นใครบางคนเริ่มทำการเปลี่ยนแปลงเซิร์ฟเวอร์ SQL ที่แท้จริงของคุณ (ยกเว้นการวัด) ก่อนที่พวกเขาจะมีความเข้าใจอย่างถ่องแท้ ... เอาละนี่มันไม่มีความชำนาญมากกว่าการขาดทักษะ แต่มันจะทำให้ฉันกลัว


0

จะมีความเจ็บปวดเพิ่มขึ้นเช่นเดียวกับเครื่องมือจัดฟันที่เจ็บปวด แต่พวกเขาค่อยๆดึงฟันให้อยู่ในแนวที่ดีและถูกต้อง ผู้ดูแลระบบจะต้องได้รับการตัดสินและจากนั้นจะมีการปรับเปลี่ยนบางอย่างในขณะที่เขาดึงสิ่งต่าง ๆ ในการจัดตำแหน่งที่เหมาะสม

สัญญาณที่ใหญ่ที่สุดของผู้ดูแลที่ดีหรือไม่ดีคือการเปลี่ยนแปลงที่เกิดขึ้น เขามีส่วนร่วมกับผู้ใช้ในการสนทนาเกี่ยวกับสิ่งที่และสิ่งที่ต้องเปลี่ยน? มีเหตุผลที่เขาต้องการล็อคบางคนออกจากระบบโดยเฉพาะหรือไม่? เช่นเดียวกับทุกสิ่งในธุรกิจที่คุณต้องมีเหตุผลและ "ความปลอดภัย" ที่ไม่เป็นจริงไม่ได้ลดทอนลง อะไรคือความเสี่ยงของการปล่อยให้มันเป็น? ทำไมเขาต้องการทำอะไรที่ดีกว่า '

หากผู้ใช้รู้สึกมีส่วนร่วมในกระบวนการและมีโอกาสอธิบายว่าทำไมสิ่งต่าง ๆ เป็นเช่นนั้นและสามารถสำรวจทางเลือกพวกเขาจะมีแนวโน้มที่จะช่วยเหลือและให้ข้อมูลเชิงลึกมากขึ้นว่าเป็นเหตุผลทางประวัติศาสตร์สำหรับสิ่งแปลก ๆ ในระบบ ฉันพบว่าตัวเองให้คำปรึกษาบ่อยครั้งกับคนทางการเงินของเราที่อยู่ที่ บริษัท ของฉันมานานหลายสิบปีเกี่ยวกับสาเหตุที่ heck นั้นเป็นอะไรที่แปลกประหลาด

อันที่จริงเรื่องนี้จะไปในตำแหน่งใด ๆ แม้ด้านนอกของไอที

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.