ZFS และ SAN - แนวปฏิบัติที่ดีที่สุด


16

มากที่สุด การอภิปรายของ ZFS แนะนำให้ปิดการทำงานของฮาร์ดแวร์และ ZFS นั้นควรพูดคุยกับดิสก์โดยตรงและจัดการกับ RAID บนโฮสต์ (แทนที่จะเป็นตัวควบคุม RAID)

สิ่งนี้เหมาะสมกับคอมพิวเตอร์ที่มีดิสก์ภายใน 2-16 หรือมากกว่านั้น แต่ในสภาพแวดล้อมที่มี SAN ขนาดใหญ่

ตัวอย่างเช่นองค์กรที่ฉันทำงานมีสิ่งที่ฉันคิดว่าเป็น SAN ที่มีขนาดพอเหมาะที่มีดิสก์เต็ม 2 ชั้นซึ่งเป็นบางสิ่งที่คล้ายกับ 400 แกน ฉันเห็นชั้นวาง SAN ที่หนาแน่นกว่าของเราและการปรับใช้ SAN มีขนาดใหญ่กว่าของเรา

ผู้คนแสดงดิสก์ 100 แผ่นโดยตรงกับเซิร์ฟเวอร์ ZFS ขนาดใหญ่หรือไม่ 300 ดิสก์ 3000 ดิสก์ เครื่องมือการจัดการ SAN ช่วยให้การจัดการอัตโนมัติเป็นไปอย่างอัตโนมัติหรือไม่?

คำตอบ:


5

FWIW ฉันมีประสบการณ์มากถึง92 ดิสก์ใน ZFS พูลเดียวและจนถึงตอนนี้มันใช้งานได้ดี

แต่ถ้าคุณกำลังพูดถึงดิสก์หลายร้อยจริงๆฉันจะพิจารณาแบ่งพาร์ติชันเหล่านั้นออกเป็นพูลจำนวนไม่กี่ตัว (แต่ยังคงมีขนาดใหญ่) ฉันไม่ต้องการที่จะรู้ว่านานแค่ไหนเช่นzpool scrubวิ่งบนดิสก์พูล 3000 (แต่คุณต้องการขัดอย่างสม่ำเสมอ) นอกจากนี้เอาต์พุตของคำสั่งเช่นzpool statusจะไม่สะดวกกับดิสก์จำนวนมากเช่นนี้ เหตุใดจึงใส่ไข่ทั้งหมดลงในตะกร้าเดียว

(หมายเหตุด้านข้างเกี่ยวกับการหักเงิน : สังเกตว่าถึงแม้ว่าจะสามารถควบคุมการลบข้อมูลซ้ำได้ในระดับชุดข้อมูล แต่ก็จะพบข้อมูลซ้ำที่ระดับสระว่ายน้ำนั่นคือคุณอาจได้รับผลลัพธ์ซ้ำซ้อนหากคุณแบ่งพาร์ติชันตามที่แนะนำ ต้องการหน่วยความจำมากขึ้นเพื่อเก็บ hash การหักล้างของพูลยักษ์ตัวเดียวซึ่งอาจไม่พอดีกับ ARC + L2ARC ถ้าพูลนั้นใหญ่เกินไปดังนั้นถ้าคุณใช้ dedup จำนวนหน่วยความจำที่มีอยู่อาจเป็นตัวบ่งชี้ที่ดีสำหรับขนาดพูลที่ใช้ได้จริงสูงสุด .)


1
+1 เห็นด้วย คุณไม่ต้องใส่ดิสก์ทั้งหมดในสระว่ายน้ำขนาดใหญ่มาก
PiL

ฉันคิดว่า ... มีซาน (ที่พบมากที่สุดจาก hp, ibm, emc และอื่น ๆ ) เปิดเผยดิสก์ทั้งหมดลงในกล่องโดยตรงหรือไม่? หรือคุณจะต้อง (เท่าที่ฉันเห็น) สร้าง luns แล้วเชื่อมโยงพวกเขากับเซิร์ฟเวอร์ หรือเมื่อ chris ตั้งใจจะเป็นเหมือน DAS บางอย่าง?
PiL

โปรดทราบว่าฝ่ายสนับสนุนของ Sun / Oracle ขอแนะนำว่าการยกเลิกการสำรองข้อมูลจะถูกปิดการใช้งานแม้ในชุดผลิตภัณฑ์ OpenStorage ของตัวเองเนื่องจากประสิทธิภาพการทำงานค่อนข้างรุนแรง
pfo

3

เราปล่อยให้ SAN ของเราจัดการกับ RAID ทำไมต้องใช้เงินกับแบตเตอรี่ NVRAM ที่ได้รับการสนับสนุนและโปรเซสเซอร์เฉพาะเหล่านั้นจากนั้นจึงลดการทำงานลงบนเซิร์ฟเวอร์ซึ่งซีพียูที่ฉันต้องการทำอย่างอื่นนอกเหนือจาก RAID checksums คืออะไร?


1
ฉันคิดว่าปริศนานี้เรียกว่า "วงล้อแห่งการกลับชาติมาเกิด" ซึ่งมีวัฏจักรคงที่ระหว่างการถ่ายภาระงานไปยังซีพียูเฉพาะด้าน
chris


2

มันเป็นคำถามเก่า แต่เป็นเพียงประเด็นที่เกี่ยวข้องในวันนี้เหมือนเมื่อ 7 ปีที่แล้ว!

เพื่อตอบคำถามแรกฉันไม่ทราบว่าเราจะเรียก "SAN" ที่จะเปิดเผยดิสก์ดิบไปยังเซิร์ฟเวอร์ที่สามารถรัน ZFS ได้ SAN ตามคำจำกัดความนำเสนอที่เก็บข้อมูลแบบบล็อก (LUNs) หรืออาจมีบางอย่างเช่น Filer / FS นำเสนอ NFS หรือ CIFS มี "SANs" บางตัวที่ใช้งาน ZFS ภายในจริง ๆ แต่สิ่งนี้ถูกแยกออกส่วนใหญ่ - ดิสก์ไม่เคยถูกเปิดเผยกับเซิร์ฟเวอร์แทนที่จะเป็นส่วนประกอบ "Filer" ของ SAN แสดงบล็อกหรือระบบไฟล์เครือข่ายไปยังเซิร์ฟเวอร์

อุปกรณ์ที่แสดงดิสก์ดิบ (ผ่าน SAS หรือมีโอกาสน้อยกว่า FC) คือ DAS ในการรัน ZFS โดยทั่วไปคุณจะต้องบอกให้คอนโทรลเลอร์ RAID แสดงดิสก์เป็น JBOD

อย่างไรก็ตามคุณควรใช้ ZFS บน LUN ที่นำเสนอโดย SAN หรือไม่ อาจเป็นไปได้: ZFS vs เช่น EXT4 มีคุณสมบัติพิเศษบางอย่างเช่นการขัดที่ตรวจสอบการตรวจสอบหรือการเรียกใช้ภาพรวม การขัดอาจไม่สามารถรักษาอัตโนมัติในลักษณะเดียวกับที่ทำได้ถ้ามันทำดิสก์ RAID แต่ก็ยังสามารถแจ้งเตือนคุณถึงความเสียหายซึ่งช่วยป้องกันบิตรอท สแน็ปช็อตที่คุณสามารถสร้างได้ตัวอย่างเช่นไฟล์เซิร์ฟเวอร์ Linux SAMBA นั้นเหนือกว่าสิ่งที่คุณสามารถทำกับ EXT ได้อย่างมากมายสิ่งเหล่านี้สามารถปรากฏใน Windows ในฐานะ "เวอร์ชันก่อนหน้า"


1

หากคุณไม่ให้ข้อมูลที่ซ้ำซ้อนของ ZFS เพื่อทำงานร่วมกับ (เช่นมิเรอร์, RAID-Z) คุณจะสูญเสียผลประโยชน์มากมายในการใช้งาน จำนวนดิสก์ที่เกี่ยวข้องจะไม่เปลี่ยนแปลงความจริงนั้น อย่างไรก็ตามไม่ว่าเรื่องนั้นขึ้นอยู่กับสภาพแวดล้อมของคุณหรือไม่ คุณต้องพิจารณาว่าคุณลักษณะการจัดเก็บใดที่คุณต้องการ (การวิเคราะห์ที่ต้องใช้แรงงานจำนวนมาก) จากนั้นไปค้นหาโซลูชันที่มีราคาแพงที่สุด (คุณสามารถจ่ายได้) ที่ตรงกับความต้องการของคุณ นั่นอาจหมายถึงการใช้ ZFS ทุกหนทุกแห่งพร้อมกับอุปกรณ์เก็บข้อมูลพิเศษของ Oracle (บางคนทำเช่นนั้นและมีดิสก์จำนวนมากที่เปิดรับ ZFS โดยไม่มีปัญหาและใช้เครื่องมือของ Oracle ในการจัดการ) อาจหมายถึงการใช้เฉพาะผลิตภัณฑ์ SAN ขององค์กรหรืออาจหมายถึงการใช้ ไฮบริดบางตัว (ในกรณีนี้คุณอาจต้องพัฒนาเครื่องมือและกระบวนการบางอย่างด้วยตัวเองเพื่อจัดการสภาพแวดล้อม) ดอน'

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.