สิ่งสำคัญที่ต้องค้นหาในศูนย์ข้อมูล


34

ฉันกำลังพยายามสร้างรายการตรวจสอบง่าย ๆ เพื่อกำหนดคุณภาพของดาต้าเซ็นเตอร์ ... ฉันควรมองหาที่ไหนและอะไรและฉันจะทราบได้อย่างไรว่าเจ้าของพูดอะไร (เช่น "UPS ของเรารักษาศูนย์ข้อมูลไว้เป็นเวลา 100 วันโดยไม่ต้อง อำนาจ ") เป็นจริงหรือไม่? สัญญาณทั่วไปหรือศูนย์ข้อมูลดีหรือไม่ดีคืออะไร

คำตอบ:


43

นี่คือรายการคำถามที่ฉันทำเพื่อตัวเองครั้งล่าสุดที่ฉันไปซื้อศูนย์ข้อมูล:

  • อธิบายสิ่งที่ต้องใช้เพื่อให้หัวฉีดดับลงบนอุปกรณ์ของเรา
  • มือจากระยะไกลจะเต็มใจทำอะไร ตัวอย่างเช่นติดตั้งฮาร์ดไดรฟ์หมุนเทป ...
  • มือจากระยะไกลของคุณมีเวลา 24/7/365 เวลารอโดยเฉลี่ยสำหรับพวกเขาที่จะไปที่กรงหลังจากยื่นตั๋ว (ตั๋วเข้าเป็นอย่างไร)?
  • คุณอยู่ในหลายกริด?
  • คุณเพิ่มความเย็นบนพื้นหรือไม่?
  • คุณใช้ดาต้าเซ็นเตอร์กี่ตัวนอกเหนือจากอันนี้
  • ดาต้าเซ็นเตอร์สามารถทำงานด้วยพลังงานสำรองได้นานเท่าใด
  • เราสามารถจัดส่งอุปกรณ์โดยตรงไปยังดาต้าเซ็นเตอร์ได้หรือไม่?
  • มีท่าเรือส่งสินค้าและที่จอดรถฟรีใกล้และมีให้บริการหรือไม่
  • หากเรามีผู้ขายมาที่ดาต้าเซ็นเตอร์เราจำเป็นต้องติดตามพวกเขาหรือไม่?
  • อุณหภูมิและความชื้นสัมพัทธ์มีอะไรบ้าง
  • ISP มีทางเลือกกี่ทาง
  • มีลูกค้ารายใดบ้างที่เคยสูญเสียพลังงานในช่วงระยะเวลาหนึ่งในประวัติศาสตร์ดาต้าเซ็นเตอร์
  • ดาต้าเซ็นเตอร์นี้ใช้งานมานานเท่าไหร่แล้ว?
  • มีการควบคุมการเข้าถึงอะไรบ้างสำหรับทั้งพื้นและอุปกรณ์?

หากคุณเยี่ยมชมหลาย ๆ และถามคำถามเหล่านี้ระหว่างราคาการแสดงผลการเยี่ยมชมของคุณและคำตอบของพวกเขามันอาจจะชัดเจนว่าคุณต้องการ ให้แน่ใจว่าคุณเยี่ยมชมพวกเขาเสมอและเยี่ยมชมจำนวนมาก


2
ทำได้ดี. +1 ถึงคุณ
gWaldo

3
ฉันจะถามเกี่ยวกับการควบคุมการเข้าถึงทั้งพื้นและอุปกรณ์ของคุณ
Scott Pack

รายการที่ยอดเยี่ยม !! ฉันจะเพิ่ม: "คุณเป็นเจ้าของอาคารหรือไม่" นอกจากนี้หากพวกเขามีหัวฉีดน้ำให้เดินออกไป!
JakeRobinson

@JakeRobinson Sprinklers ต้องมีรหัสป้องกันไฟแม้ในศูนย์ข้อมูลในหลาย ๆ ที่ เมื่อคุณเห็นสปริงเกอร์ถามว่าพวกเขาเป็นหัวฉีดสปริงเกอร์แห้งหรือไม่
sysadmin1138

3
@ JakeRobinson DC ใหม่ที่ฉันย้ายเข้ามาในปี 2003 มีทั้ง FM200 และหัวฉีดน้ำ เจ้าหน้าที่ดับเพลิงมีความแน่วแน่ที่จะฉีดน้ำที่นั่น ถ้า FM200 สามารถดับไฟได้ แต่ถ้าไม่ทำเช่นนั้น (UPS ระเบิดออกจะเป็นการสร้างเขื่อนอากาศ FM200 ดังนั้น O2 สามารถเข้าไปได้หลังจากที่ทิ้งขยะ) น้ำจำนวนมากจะช่วยอาคาร ระบบท่อแห้งที่เหมาะสมหมายความว่าหากหัวสปริงเกลอร์ชนกับ DC ไม่ท่วม
sysadmin1138

6

ไคล์ปิดบังมันไว้ค่อนข้างดี แต่นี่เป็นสองประเด็น:

ความปลอดภัยทางกายภาพมีขนาดใหญ่มาก มันควรจะเป็นการกระทำของรัฐสภา (รัฐสภาแทรกสถาบันราชการที่เคลื่อนไหวช้าที่นี่) เพื่อเข้าไปข้างใน

มันควรจะมีการดับไฟของ Halon ไม่ใช่หัวฉีดน้ำ เซิร์ฟเวอร์ไม่ควรชื้น (ข้อบังคับการดับเพลิงท้องถิ่นอาจแทนที่ ... )

ค้นหาผู้จำหน่ายเซิร์ฟเวอร์ที่พวกเขาต้องการ นอกเสียจากว่าจะมีเหตุผลที่เฉพาะเจาะจง (เช่นเรียกใช้ดาต้าเซ็นเตอร์ของ Google) ควรเป็นเซิร์ฟเวอร์ของแบรนด์เนม (Dell, HP, IBM, Sun, Apple ฯลฯ ) หากพวกเขาพูดว่า "กล่องขาว" หรือแบรนด์ที่คุณไม่รู้จักให้เรียกใช้ โปรดทราบว่ามีผู้จำหน่ายเซิร์ฟเวอร์ระดับล่างที่มีชื่อเสียงที่ได้รับความเชื่อถือ (ตัวอย่างเช่น System76) แต่ "สร้างขึ้นเอง" หมายความว่าพวกเขารวมสิ่งต่างๆเข้าด้วยกัน เหมาะสำหรับบ้านของคุณ แต่ไม่ดีสำหรับศูนย์ข้อมูลของคุณ (ไม่รวมการซื้อ HP Proliant DL580 และการติดตั้งสิ่งต่าง ๆ เช่นชุดตัวเลือกหน่วยความจำหรือกรงไดรฟ์)

มีตัวเลือกการเป็นเจ้าของอะไรบ้าง ซื้อผ่านพวกเขา? ซื้อโดยตรงและส่งที่นั่นไหม ลีสซิ่ง? VMs?


4
เห็นด้วยกับการปราบปรามไฟแม้ว่า "Halon" อ่าน "halon / FM200 / Argonite / Inergen / ก๊าซดับเพลิงอื่น ๆ ที่นี่"
MadHatter สนับสนุน Monica

11
สปริงเกอร์จำเป็นต้องใช้รหัสไฟในหลาย ๆ ที่ ฉันพบว่าในปี 2003 ในระหว่างการสร้าง DC ที่ฉันให้ความช่วยเหลือ มันควรจะยิงถ้า FM200 ไม่ดับแหล่งความร้อน มันควรจะเป็นระบบสปริงเกอร์ท่อแห้งสำรองก๊าซเฉื่อย
sysadmin1138

2

ยอดเยี่ยมเช่นเคย Kyle สองสิ่งที่ฉันได้เรียนรู้จากประสบการณ์:

  • ถามว่ามีเครื่องกำเนิดไฟฟ้าสำรองของ UPS หรือไม่หากมีการทดสอบเครื่องกำเนิดไฟฟ้าบ่อยแค่ไหน

  • มีการล็อกและตรวจสอบทางกายภาพใดบ้างที่มีอยู่เพื่อป้องกันไม่ให้ช่างไฟฟ้าฆ่าไฟฟ้า

  • พวกเขามีความรับผิด / การประกันภัยอะไรบ้าง?

  • พวกเขาจะจัดการกับสถานการณ์อย่างไรเมื่อพวกเขาไม่พบ SLA

  • พวกเขาไม่เคยพบ SLA บ่อยแค่ไหน?

  • พวกเขาใช้พลังงานเท่าไรในแต่ละแร็ค / กรง / ฯลฯ (คุณจะถูก จำกัด พลังและต้องการแร็ค / กรงสำหรับพลังงานเสริมหรือไม่?)

  • ขออ้างอิงในอุตสาหกรรมของคุณจะดี

เรื่องตลกที่ไม่ตลกในเวลา:

  1. มีไฟในแวนคูเวอร์ในห้องไฟฟ้าใต้ดิน 4 ช่วงตึกจาก DC ของฉันไฟเอาพลังงานออกมาสำหรับรัศมี 10 บล็อก UPS เปิดไฟค้างไว้จนกว่าชุด Gen จะออนไลน์ Gen-set อยู่ในสถานะออนไลน์ประมาณหนึ่งชั่วโมงก่อนที่จะร้อนเกินไป ยูพีเอสสามารถเปิดไฟต่อได้อีก 30 นาทีหลังจากชุดความปลอดภัยถูกปิด Gen-set เป็นของอาคาร IIRC DC สามารถตำหนิพวกเขาและล้างมือได้

  2. ช่างไฟฟ้าฆ่าพลังไฟฟ้าให้กับชั้นวางแถวสองแถวที่ DC เนื่องจากแผงบางส่วนทำให้เกิดการกระแทกและกระแทกเบรกเกอร์ทั้งหมดที่เปิดอยู่ ฉันเคยได้ยินเกี่ยวกับช่างไฟฟ้าที่ DC อีกคนกำลังจะทำงานบน UPS ไม่ได้ใส่มันลงในโหมดบายพาสและทำให้ DC ทั้งหมดลง


จะแนะนำให้มีชั้นวาง UPS สำหรับกรณีเหล่านั้นหรือไม่สำคัญเนื่องจากการเชื่อมต่อมักจะถูกนำไปใช้กับทุกสิ่งหรือไม่?
AX1

มันคงจะดี ... DC ของเราบอกว่าเราไม่ได้รับอนุญาตให้มี UPS ในชั้นวางของเราพวกเขาให้เหตุผลกับเรา แต่ฉันจำไม่ได้ว่ามันคืออะไร
Clint

อาจจะร้อน ฉันไม่ได้มีประสบการณ์มากกับแร็ค UPS แต่ผู้บริโภคมักจะร้อนขึ้น
AX1

4
@ AX1: UPS ในเดซี่เชนยุ่งกัน พวกเขาคาดหวังคุณสมบัติบางอย่างในปัจจุบันและ UPS อื่น ๆ สามารถกรองสิ่งเหล่านั้นออกได้ เครือข่ายอาจลดลงเมื่อ DC หมดพลังงานดังนั้นแม้ว่าเซิร์ฟเวอร์ของคุณจะหมด แต่เครือข่ายจะไม่ทำงาน
quinnr

อาจเป็นรหัสไฟได้หาก EPO ถูกโจมตีนักผจญเพลิงคาดหวังว่าจะไม่มีพลังชีวิต
Sean Reifschneider

1
  • ฉันจะบอกว่าอาจเป็นหนึ่งในสามของศูนย์ข้อมูลเป็นรายการโฆษณาทางเทคนิค (คุณมี {VESDA สัญญาเติมเชื้อเพลิงใหม่ชิลเลอร์ที่ครอบคลุมโดย UPS, กริดพลังงานหลายรายการ, ใยอาหารที่หลากหลาย)

  • อีกสามคือวิธีที่พวกเขาจัดการกับมันเมื่อสิ่งต่าง ๆ ไม่ถูกต้อง พวกเขากลืนความภาคภูมิใจของพวกเขาตรวจสอบความล้มเหลวและคิดว่าจะทำอย่างไรเพื่อให้แน่ใจว่ามันจะไม่เกิดขึ้นอีกหรือไม่? หรือพวกเขาแค่ทำในสิ่งที่ไม่ได้ผลมาก่อน

  • และอีกสามคือบุคลากร พวกเขาฉลาดใช้งานง่ายและไม่พลิกทุกเดือนหรือไม่?

แต่ที่สำคัญยิ่งกว่า: พวกเขามีพื้นที่ที่คุณต้องการหรือไม่? ที่เดียวที่เราเกือบจะเข้าไปได้ภายใน 2 ปีเราใช้พื้นที่มากกว่าที่พวกเขาว่าง


1

ฉันทำงานในศูนย์ข้อมูลขนาดเล็กใน Silicon Valley ฉันดูแลระบบที่ฝั่งเซิร์ฟเวอร์ที่ได้รับการจัดการของธุรกิจ

สัญญาณไม่ดี:

  • ขาดการตรวจสอบซ้ำซ้อนและการแจ้งเตือนสำหรับพลังงานอุณหภูมิความชื้น
  • ขาดการตรวจสอบอุปกรณ์เครือข่าย colos เซิร์ฟเวอร์และอุปกรณ์อื่น ๆ
  • ถ่วงและไม่ใช้สายสัมพันธ์หรือการจัดการสายเคเบิลอื่น ๆ เพื่อรักษาชั้นวางที่สะอาดและเป็นระเบียบ

สัญญาณที่ดี: - เครื่องกำเนิดไฟฟ้าดีเซลภายในโรงแรมที่มีระบบ failover อัตโนมัติ - ตัวสำรองแบบชิลเลอร์และตัวจัดการอากาศพร้อมกับความล้มเหลวอัตโนมัติ - แบนด์วิดธ์จำนวนมากบนแบ็คโบนหลักของผู้ให้บริการหลัก (AT&T, XO Comm) - ผู้ให้บริการเครือข่ายซ้ำซ้อน การตรวจสอบหน่วยความจำและการวินิจฉัยฮาร์ดแวร์ก่อนการปรับใช้เซิร์ฟเวอร์

เซิร์ฟเวอร์ชื่อแบรนด์นั้นใช้ได้ดี แต่ถ้าพวกเขาแก่แล้วและอยู่ใกล้กับบล็อกหลายครั้งคุณควรตรวจสอบให้แน่ใจว่าพวกเขากำลังผ่านการวินิจฉัยฮาร์ดแวร์ก่อนที่จะใช้งาน

ศูนย์ข้อมูลที่ดีควรมอบเว็บไซต์ที่สามารถตรวจสอบปริมาณการใช้แบนด์วิดท์และเวลาใช้งานของลูกค้าได้ พวกเขาควรตอบคำถามใด ๆ ด้วย ถามยี่ห้อและรุ่นของ UPS ขอให้พวกเขาดูโหลดปัจจุบันของ UPS ด้วยข้อมูลนี้คุณสามารถตรวจสอบได้ว่าสามารถใช้งานได้นานเท่าใด

แต่โดยสุจริต UPS ไม่ควรเป็นข้อกังวลของคุณ UPS ให้เวลาใช้งานสั้น ๆ เท่านั้น (30 นาที) สิ่งที่น่าเป็นห่วงคือถ้า DC มีเครื่องกำเนิดไฟฟ้าสำรอง มันก็คุ้มค่าที่จะถามว่ากริด DC นั้นอยู่ที่ใด ในแง่ของสีน้ำตาลและหมดสติลำดับความสำคัญที่แตกต่างกันจะถูกกำหนดให้กับกริดที่แตกต่างกัน คาดเดาอะไร โรงพยาบาลและสถานีดับเพลิงมีลำดับความสำคัญสูง (ไม่มีการตัดไฟ) หากดาต้าเซ็นเตอร์อยู่ในกริดเดียวกันพลังงานที่รับประกันนั้นจะเชื่อถือได้

ถามพวกเขาเท่าไหร่พลังงานต่อแร็ค ฉันทำงานที่ไหนเราให้แต่ละชั้นมีวงจร 3x 25amp เซิร์ฟเวอร์ 1u ทั่วไปใช้ 1-3 แอมป์


อันที่ฉันอยากไปมี 40amp ต่อชั้น มันต่ำเกินไปหรือเปล่า เกือบครึ่งหนึ่งของสิ่งที่คุณพูด (75amp)
AX1

1
@ AX1, 40A ที่ 110V คือ 4400W; ที่ 230V มันคือ 9200W ยกเว้นว่าจะมีความหนาแน่นสูง (Twin / Twin ^ 2 / Blade) หรือ HPC / GPU นั่นก็คือ PLENTY
Mircea Chirea
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.