เครือข่ายพื้นที่เก็บข้อมูลคืออะไรและมีประโยชน์อย่างไรที่มีมากกว่าโซลูชั่นการจัดเก็บข้อมูลที่แตกต่างกัน?

ฉันเสนอสิ่งนี้เป็นคำถามที่ยอมรับได้เกี่ยวกับเครือข่ายพื้นที่จัดเก็บระดับองค์กร

เครือข่ายพื้นที่จัดเก็บ (SAN) คืออะไรและทำงานอย่างไร
มันแตกต่างจาก Network Attached Storage (NAS) อย่างไร
กรณีการใช้งานเปรียบเทียบกับที่เก็บข้อมูลแบบต่อพ่วงโดยตรง (DAS) คืออะไร
มันจะดีขึ้นหรือแย่ลงในทางใด
ทำไมมันแพงจัง
ฉันควรใช้ (หรือ บริษัท ของฉัน) หรือไม่

storage storage-area-network network-attached-storage

— มัสซิโม
แหล่งที่มา

@Basil: คุณคิดว่าคำถามควรครอบคลุม NASes ด้วยหรือไม่ สิ่งเหล่านี้ต่างจาก SAN (และมีคำถามที่เปรียบเทียบกันอยู่แล้ว: serverfault.com/questions/81723/ … ) ฉันตั้งใจให้อันนี้เป็นเรื่องเกี่ยวกับ SAN โดยเฉพาะ ฉันไม่ได้ลบการแก้ไขของคุณ แต่ฉันขอขอบคุณคำติชมของชุมชนเกี่ยวกับเรื่องนี้

— Massimo

โดยปกติแล้วการให้บริการไฟล์ของฉันเป็นหน้าที่ของอุปกรณ์จัดเก็บข้อมูลส่วนใหญ่ในตลาดซึ่งคนส่วนใหญ่เรียกว่า "SAN"

— บาซิล

ฉันคิดว่าคำถามที่ฉันเชื่อมโยงครอบคลุมเรื่องนี้ค่อนข้างดีและ NASes นั้นง่ายกว่ามาก ๆ (โดยทั่วไปคือไฟล์เซิร์ฟเวอร์) SAN เลิกซับซ้อนกว่าโมดูลาร์และราคาแพงกว่า การขยายขอบเขตของคำถามนี้ไปยังที่เก็บข้อมูลทุกรูปแบบจะทำให้กว้างเกินไป แน่นอนว่านี่เป็นความคิดเห็นของฉัน

— Massimo

ประเด็นของฉันคือทุกโซลูชันสตอเรจที่คุณสามารถใช้ในขณะนี้ได้รวมบริการไฟล์ EMC, HDS, IBM, HP, Netapp (ชัด), Dell คุณไม่สามารถพูดถึง "SAN" (อีกครั้งผู้เรียกชื่อผิดเนื่องจากเป็นสิ่งที่คุณอธิบายว่าเป็นเลเยอร์การเชื่อมต่อ) โดยไม่พูดถึงการให้บริการไฟล์ คุณสามารถกระโดดเข้าห้อง comms ได้ไหม?

— Basil

ฉันชอบวิธีที่เปิดออก ฉันคิดว่ามันจะดีกว่าถ้าให้คำถามนี้เน้นไปที่สิ่งที่ SAN เป็นและพูดถึง NAS ในการผ่าน คำถามเก่านั่นเกี่ยวกับ "ความแตกต่างระหว่าง SAN, NAS, DAS คืออะไร" สามารถอัปเดตได้เล็กน้อยและกลายเป็นคำถามและคำตอบที่ยอมรับได้ด้วยตัวเอง

— Ward - Reinstate Monica

ครั้งแรกของทั้งหมดสำหรับ (กว้าง) เปรียบเทียบ DAS, NAS และ SAN เก็บดูที่นี่

มีความเข้าใจผิดบางประการเกี่ยวกับคำว่า " SAN " ซึ่งหมายถึง " Storage Area Network " และเป็นเช่นนี้อย่างเคร่งครัดพูดถึงเฉพาะโครงสร้างพื้นฐานการสื่อสารที่เชื่อมต่ออุปกรณ์จัดเก็บข้อมูล (อาร์เรย์ดิสก์ไลบรารีเทป ฯลฯ ) และผู้ใช้ที่เก็บข้อมูล (เซิร์ฟเวอร์ ) อย่างไรก็ตามในทางปฏิบัติทั่วไปคำว่า "SAN" ใช้เพื่ออ้างถึงสองสิ่ง:

โครงสร้างพื้นฐานการจัดเก็บข้อมูลที่สมบูรณ์รวมถึงฮาร์ดแวร์และซอฟต์แวร์ทั้งหมดที่เกี่ยวข้องในการให้สิทธิ์การเข้าถึงอุปกรณ์จัดเก็บข้อมูลส่วนกลางจากเซิร์ฟเวอร์หลายเครื่อง การใช้งานนี้แม้ว่าจะไม่ถูกต้องเป็นที่ยอมรับทั่วไปและสิ่งที่คนส่วนใหญ่พูดถึงเมื่อพูดถึง "SAN" ส่วนที่เหลือของคำตอบนี้จะมุ่งเน้นไปที่มันดังนั้นจึงอธิบายทุกองค์ประกอบของโครงสร้างพื้นฐานการจัดเก็บข้อมูลระดับองค์กร
อาร์เรย์หน่วยเก็บข้อมูลเดียว (ดูในภายหลัง); เช่นเดียวกับ "เรามี Brand X SAN พร้อมที่เก็บข้อมูล 20 TB" การใช้งานนี้ไม่ถูกต้องโดยพื้นฐานเพราะไม่ได้คำนึงถึงความหมายที่แท้จริงของ "SAN" และสมมติว่าเป็นอุปกรณ์เก็บข้อมูลบางรูปแบบ

SAN ประกอบด้วยฮาร์ดแวร์ที่แตกต่างกันมาก แต่โดยทั่วไปจะสามารถแบ่งออกเป็นองค์ประกอบต่าง ๆ :

Storage Arrays : นี่คือที่จัดเก็บข้อมูลจริง (และสิ่งที่เรียกว่า "SAN" อย่างผิดพลาดบ่อยครั้ง) พวกเขาประกอบด้วย:
- ดิสก์ทางกายภาพ:แน่นอนเก็บข้อมูล ใช้ดิสก์ระดับองค์กรซึ่งหมายความว่าพวกเขามักจะมีความจุดิสก์ต่อหน่วยต่ำกว่า แต่มีประสิทธิภาพและความน่าเชื่อถือสูงกว่ามาก อีกทั้งยังมีราคาแพงกว่าดิสก์ระดับผู้บริโภค ดิสก์สามารถใช้การเชื่อมต่อและโปรโตคอลที่หลากหลาย ( SATA , SAS , FC , ฯลฯ ) และสื่อเก็บข้อมูลที่แตกต่างกัน ( ดิสก์ Solid-Stateกำลังกลายเป็นเรื่องธรรมดามากขึ้น) ขึ้นอยู่กับการใช้งาน SAN ที่เฉพาะเจาะจง
- Disk Enclosures:นี่คือที่ที่ดิสก์ถูกวาง พวกเขาให้กระแสไฟฟ้าและการเชื่อมต่อข้อมูลกับพวกเขา
- ตัวควบคุมหน่วยเก็บข้อมูล / ตัวประมวลผล:สิ่งเหล่านี้จัดการดิสก์ I / O, RAIDและแคช (คำว่า "คอนโทรลเลอร์" หรือ "ตัวประมวลผล" แตกต่างกันไประหว่างผู้ขาย SAN) อีกครั้งใช้ตัวควบคุมระดับองค์กรดังนั้นจึงมีประสิทธิภาพและความน่าเชื่อถือที่ดีกว่าฮาร์ดแวร์ระดับผู้บริโภค พวกเขาสามารถและมักจะมีการกำหนดค่าในคู่สำหรับความซ้ำซ้อน
- Storage Pools : พูลหน่วยเก็บข้อมูลเป็นพื้นที่เก็บข้อมูลซึ่งประกอบด้วยดิสก์บางส่วน (บ่อยครั้ง) ในการกำหนดค่า RAID มันถูกเรียกว่า "กลุ่ม" เพราะส่วนของมันสามารถจัดสรรปรับขนาดและยกเลิกการจัดสรรตามความต้องการสร้าง LUN
- ตรรกะเบอร์ Unit (LUNs): LUNเป็นก้อนของพื้นที่มาจากสระว่ายน้ำการจัดเก็บข้อมูลซึ่งทำแล้วใช้ได้ ( "นำเสนอ") ไปยังเซิร์ฟเวอร์หนึ่งหรือมากกว่า เซิร์ฟเวอร์นี้ถูกมองว่าเป็นโวลุ่มการเก็บข้อมูลและสามารถจัดรูปแบบโดยใช้ระบบไฟล์ใดก็ได้ที่พวกเขาต้องการ
เทปไลบรารี่:พวกมันสามารถเชื่อมต่อกับ SAN และใช้เทคโนโลยีการสื่อสารเดียวกันทั้งในการเชื่อมต่อกับเซิร์ฟเวอร์และสำหรับการสำรองข้อมูลโดยตรงกับเทป
เครือข่ายการสื่อสาร ( "SAN" เหมาะสม ):นี่คือสิ่งที่ช่วยให้ผู้ใช้หน่วยเก็บข้อมูล (เซิร์ฟเวอร์) เข้าถึงอุปกรณ์เก็บข้อมูล (อาร์เรย์หน่วยเก็บข้อมูลห้องสมุดเทป ฯลฯ ); มันคือการพูดอย่างเคร่งครัดความหมายที่แท้จริงของคำว่า "เครือข่ายพื้นที่จัดเก็บ" และเป็นเพียงส่วนหนึ่งของโครงสร้างพื้นฐานการจัดเก็บข้อมูลที่ควรกำหนดเช่นนี้ มีวิธีแก้ไขมากมายในการเชื่อมต่อเซิร์ฟเวอร์กับอุปกรณ์เก็บข้อมูลที่ใช้ร่วมกัน แต่วิธีที่พบมากที่สุดคือ:
- Fibre Channel :เทคโนโลยีที่ใช้ไฟเบอร์ออปติกในการเชื่อมต่อความเร็วสูงไปยังที่เก็บข้อมูลที่ใช้ร่วมกัน มันมีอะแดปเตอร์บัสโฮสต์สายเคเบิลใยแก้วนำแสงและสวิตช์ FC และสามารถบรรลุความเร็วการถ่ายโอนตั้งแต่ 1 Gbit ถึง 20 Gbit นอกจากนี้ยังสามารถใช้มัลติพา ธ I / Oเพื่อจัดกลุ่มลิงค์ทางกายภาพจำนวนมากเข้าด้วยกันช่วยให้แบนด์วิดธ์และความผิดพลาดที่สูงขึ้น
- iSCSI :การใช้งานโปรโตคอล SCSIผ่านการขนส่ง IP มันทำงานบนฮาร์ดแวร์อีเธอร์เน็ตมาตรฐานซึ่งหมายความว่ามันสามารถบรรลุความเร็วการถ่ายโอนจาก 100 Mbit (โดยทั่วไปไม่ได้ใช้สำหรับ SAN) ถึง 100 Gbit Multipath I / O สามารถใช้งานได้ (แม้ว่าเลเยอร์เครือข่ายพื้นฐานจะแนะนำความซับซ้อนเพิ่มเติมบางอย่าง)
- Fibre Channel over Ethernet (FCoE) :เทคโนโลยีที่อยู่ระหว่าง FC เต็มรูปแบบและ iSCSI ซึ่งใช้ Ethernet เป็นฟิสิคัลเลเยอร์ แต่ FC เป็นโปรโตคอลการขนส่งดังนั้นจึงหลีกเลี่ยงความต้องการเลเยอร์ IP ที่อยู่ตรงกลาง
- InfiniBand :เทคโนโลยีการเชื่อมต่อที่มีประสิทธิภาพสูงใช้งานน้อยและมีราคาค่อนข้างสูง แต่สามารถรับแบนด์วิดธ์ที่น่าประทับใจได้
Host Bus Adapters (HBAs):การ์ดอะแดปเตอร์ที่เซิร์ฟเวอร์ใช้เพื่อเข้าถึงเลเยอร์การเชื่อมต่อ สามารถเป็นอะแดปเตอร์เฉพาะ (เช่นใน FC SAN) หรือการ์ดอีเทอร์เน็ตมาตรฐาน นอกจากนี้ยังมี iSCSI HBAs ซึ่งมีการเชื่อมต่ออีเธอร์เน็ตมาตรฐาน แต่สามารถจัดการกับโปรโตคอล iSCSI ในฮาร์ดแวร์จึงช่วยบรรเทาเซิร์ฟเวอร์ของการโหลดเพิ่มเติมบางอย่าง

SAN มอบความสามารถเพิ่มเติมมากมายผ่านที่จัดเก็บข้อมูลแบบต่อพ่วง (หรือแบ่งปันทางกายภาพ) โดยตรง:

ความทนทานต่อข้อผิดพลาด:ความพร้อมใช้งานสูงมีอยู่แล้วใน SAN ระดับองค์กรและจัดการได้ทุกระดับตั้งแต่อุปกรณ์จ่ายไฟในอาร์เรย์ที่เก็บข้อมูลไปจนถึงการเชื่อมต่อเซิร์ฟเวอร์ ดิสก์มีความน่าเชื่อถือมากขึ้น RAID ถูกใช้เพื่อทนต่อความล้มเหลวของดิสก์เดียว (หรือหลายดิสก์) มีการใช้ตัวควบคุมซ้ำซ้อนและมัลติพา ธ I / O ช่วยให้สามารถเข้าถึงพื้นที่เก็บข้อมูลได้อย่างต่อเนื่องแม้ในกรณีที่เกิดการเชื่อมโยงล้มเหลว
พื้นที่จัดเก็บข้อมูลที่มากขึ้น: SAN สามารถมีอุปกรณ์เก็บข้อมูลขนาดใหญ่จำนวนมากช่วยให้มีพื้นที่เก็บข้อมูลมากขึ้นกว่าสิ่งที่เซิร์ฟเวอร์เดียวทำได้
การจัดการพื้นที่เก็บข้อมูลแบบไดนามิก:ปริมาณการจัดเก็บ (LUN) สามารถสร้างปรับขนาดและทำลายตามความต้องการ; สามารถย้ายจากเซิร์ฟเวอร์หนึ่งไปยังเซิร์ฟเวอร์อื่น การจัดสรรพื้นที่เก็บข้อมูลเพิ่มเติมให้กับเซิร์ฟเวอร์นั้นต้องการเพียงการกำหนดค่าบางอย่างซึ่งต่างจากการซื้อดิสก์และติดตั้ง
ประสิทธิภาพการทำงาน: SAN ที่กำหนดค่าไว้อย่างถูกต้องโดยใช้เทคโนโลยีล่าสุด (แม้ว่าจะมีราคาแพง) สามารถให้ประสิทธิภาพที่น่าประทับใจและได้รับการออกแบบมาจากพื้นฐานเพื่อรองรับการโหลดพร้อมกันจำนวนมากจากเซิร์ฟเวอร์หลายเครื่อง
การจำลองแบบในระดับหน่วยเก็บข้อมูล:สามารถกำหนดค่าอาร์เรย์หน่วยเก็บข้อมูลสอง (หรือมากกว่า) สำหรับการเรพลิเคทแบบซิงโครนัสซึ่งอนุญาตให้มีการเปลี่ยนเส้นทางเซิร์ฟเวอร์ I / O จากที่หนึ่งไปอีกที่หนึ่งอย่างสมบูรณ์
สแน็ปช็อตระดับหน่วยเก็บข้อมูล:อาร์เรย์หน่วยเก็บข้อมูลส่วนใหญ่อนุญาตให้ใช้สแน็ปช็อตของโวลุ่มเดี่ยวและ / หรือพูลหน่วยเก็บข้อมูลทั้งหมด สแน็ปช็อตเหล่านั้นสามารถกู้คืนได้หากจำเป็น
การสำรองข้อมูลระดับการจัดเก็บ: SAN ส่วนใหญ่ยังอนุญาตให้ทำการสำรองข้อมูลโดยตรงจากอาร์เรย์ที่จัดเก็บข้อมูลไปยังไลบรารีเทปที่เชื่อมต่อกับ SAN โดยสมบูรณ์ผ่านเซิร์ฟเวอร์ที่ใช้ข้อมูลจริง มีการใช้เทคนิคต่าง ๆ เพื่อรับรองความถูกต้องของข้อมูลและความสอดคล้อง

จากทุกสิ่งข้างต้นประโยชน์ของการใช้ SAN นั้นชัดเจน แต่สิ่งที่เกี่ยวกับค่าใช้จ่ายในการซื้อและความซับซ้อนของการจัดการ?

SAN เป็นฮาร์ดแวร์ระดับองค์กร (แม้ว่าจะมีกรณีธุรกิจสำหรับ SAN ขนาดเล็กแม้ใน บริษัท ขนาดเล็ก / กลาง); แน่นอนว่าสามารถปรับแต่งได้อย่างมากดังนั้นสามารถมีตั้งแต่ "TB สองเท่าที่มี 1 Gbit iSCSI และความน่าเชื่อถือค่อนข้างสูง" ถึง "หลายร้อย TBs ด้วยความเร็วประสิทธิภาพและความน่าเชื่อถือที่น่าทึ่ง ค่าใช้จ่ายจะแตกต่างกันไป แต่โดยทั่วไปจะสูงกว่า (เช่นเดียวกับ "ต้นทุนรวม" เช่นเดียวกับ "ต้นทุนต่อกิกะไบต์" ของพื้นที่) กว่าโซลูชันอื่น ๆ ไม่มีมาตรฐานการกำหนดราคา แต่ไม่ใช่เรื่องแปลกสำหรับ SAN ขนาดเล็กที่จะมีป้ายราคาในช่วงหลายหมื่น (และแม้กระทั่งหลายแสน) ดอลลาร์

การออกแบบและการใช้งาน SAN (มากยิ่งขึ้นสำหรับระดับสูง) ต้องใช้ทักษะเฉพาะและงานประเภทนี้มักทำโดยคนที่มีความเชี่ยวชาญสูง การดำเนินงานแบบวันต่อวันเช่นการจัดการ LUN นั้นง่ายกว่ามาก แต่ในหลาย ๆ บริษัท การจัดการการจัดเก็บนั้นจัดการโดยบุคคลหรือทีมงานที่ทุ่มเทอยู่แล้ว

โดยไม่คำนึงถึงข้อพิจารณาข้างต้น SANs เป็นโซลูชันหน่วยเก็บข้อมูลที่เลือกซึ่งต้องการความจุสูงความน่าเชื่อถือและประสิทธิภาพ

— มัสซิโม
แหล่งที่มา

โหวต ++ สำหรับคำตอบเชิงลึก

— Simon Catlin

คุณต้องการหรือไม่ ขึ้นอยู่กับ £หรือ $ ต่อ TB สูงกว่า DAS มาก นอกจากนี้การแสดงผลของ DAS ฉันก็กลัวว่า FC / AL และ iSCSI SAN ที่ใช้งานได้ดี (อย่างน้อยก็ในการทดสอบกับ Oracle และ SQL Server DBs) แต่ด้วย DAS คุณจะไม่ได้รับประโยชน์จากความสามารถในการแชร์พื้นที่เก็บข้อมูล (เหมาะสำหรับการทำคลัสเตอร์และ VMWare)

ผู้ค้าหน่วยเก็บข้อมูลจำนวนหนึ่งกำลังย้ายออกจากไฟเบอร์แชนเนลสำหรับการเชื่อมต่อตัวควบคุมโฮสต์ไปยังที่เก็บข้อมูลเพื่อสนับสนุน iSCSI ซึ่งทำงานบนอีเทอร์เน็ต มันเป็นเทพนิยาย Token-Ring vs Ethernet เก่า ๆ อีกครั้ง ด้วยการวิจัยและการลงทุนในอีเธอร์เน็ตที่กว้างขวางในอุตสาหกรรมทำให้ FC ไม่สามารถติดตามได้ สวิตช์อีเธอร์เน็ต 10Gbps นั้นราคาถูกกว่า 8Gbps FC หนึ่งแถมยังสามารถ vLANd หรือแบ่งเป็นส่วน ๆ เพื่อจัดเก็บข้อมูลและที่ไม่ใช่ที่เก็บข้อมูล

อย่างไรก็ตามมีประโยชน์บางอย่างของ SAN:

SAN snapshots (ชี้จุดกู้คืนเวลาสำหรับเซิร์ฟเวอร์หรือการรวบรวมเซิร์ฟเวอร์)
การจำลองแบบในสถานที่และนอกสถานที่ระดับบล็อก (โดยไม่เกี่ยวข้องกับโฮสต์เซิร์ฟเวอร์ดังนั้นไม่จำเป็นต้องมีการจำลองแบบด้วยซอฟต์แวร์)
สำรองข้อมูล SAN โดยตรง - หากระบบสำรองข้อมูลของคุณสามารถเชื่อมต่อและทำงานกับ SAN ได้

หากคุณกำลังพิจารณาที่จะจุ่มนิ้วเท้าลงในน้ำของที่เก็บข้อมูลที่ใช้ร่วมกันให้ดูที่ผลิตภัณฑ์เช่นชุด P4000 ของ HP

— Simon Catlin
แหล่งที่มา