วิธีการแก้ปัญหาการจัดเก็บข้อมูลแบบอัตโนมัติโดยใช้ Linux? (หน่วยความจำ -> SSD -> HDD -> ที่เก็บข้อมูลระยะไกล)


13

เกี่ยวข้องกับคำถามนี้เกี่ยวกับการใช้ SSD สำหรับระบบและ HDD สำหรับข้อมูลยกเว้นฉันต้องการให้ระบบของฉันทำสิ่งนี้โดยอัตโนมัติ ...

เป็นไปได้หรือไม่ที่จะมีที่เก็บข้อมูลหลายชั้นและผลักรายการระหว่างกันโดยอัตโนมัติโดยใช้ซอฟต์แวร์โอเพนซอร์ซฟรีที่ดีกว่า

ฉันรู้ว่าโซลูชันระดับองค์กรที่มีราคาแพงอย่างมหาศาลเช่น EMC SAN-> การเก็บถาวรอัตโนมัติของEMC Centeraแต่ฉันสงสัยว่าการจัดเก็บข้อมูลประเภทนี้เป็นไปได้ที่จะทำโดยอัตโนมัติหรือไม่

มันจะดีถ้ามีหลายเลเยอร์ในเรื่องนี้: หน่วยความจำ -> SSD-> HDD-> HDD หรือเทปที่ช้ากว่าหรือโซลูชันเก็บถาวรอื่น ๆ

มีระบบไฟล์ใดบ้างที่สามารถทำได้โดยอัตโนมัติ? (ZFS, Btrfs, HAMMER หรือไม่)

ตัวแปรUnixใด ๆก็ใช้ได้เพราะฉันสนใจในการทำงานและไม่ว่ามันจะพกพาไปยัง Linux หรือรสชาติอื่น ๆ (BSD ฯลฯ )

คำตอบ:


14

ZFS ใช้เลเยอร์หน่วยเก็บข้อมูลที่เรียกว่าHybrid Storage Pool (HSP) :

  1. Layer: หน่วยความจำ
  2. เลเยอร์: การอ่านแคชที่ใช้ SSD (L2ARC) และแคชการเขียน (บันทึกเจตนาแยกต่างหาก aka slog)
  3. Layer: (ถูก) harddisks

ด้วย HSP มันง่ายที่จะได้รับประโยชน์จากข้อดีของ SSD โดยอัตโนมัติเมื่อเปรียบเทียบกับโซลูชัน harddisk เท่านั้น ระบบที่ใช้ HSP นั้นสามารถทำได้เร็วกว่าและถูกกว่าระบบหลัง ดูลิงค์นี้สำหรับตัวอย่างที่ดีและรายละเอียดเพิ่มเติม

ฉันคิดว่ามีแผนการเกี่ยวกับการจัดการพื้นที่เก็บข้อมูลแบบลำดับชั้น (HSM)สำหรับ ZFS (ดูตัวอย่างโครงการ OpenSolaris การโยกย้ายข้อมูลอัตโนมัติ (ADM) OpenSolaris) แต่ฉันไม่ทราบสถานะปัจจุบัน


นี่เป็นสิ่งที่ฉันคิดเอาไว้ขอบคุณ! (ตอนนี้เพื่อช่วยเหลือในพอร์ตลินุกซ์ ... ;)
เดวิดการ์ดเนอร์

ฉันจะไม่เรียกระดับนี้ แต่เป็นการแคช ในแง่ที่ว่าการแคชหมายถึงการเก็บสำเนาของบล็อกที่ใช้บ่อยการจัดระดับการย้ายข้อมูลไปยังที่เก็บข้อมูลที่ช้าลง / เร็วขึ้น ฉันจะไม่เรียกบันทึกเจตนาใน ZFS แคชการเขียนจริงถ้าฉันเข้าใจอย่างถูกต้อง
mrossi


5

TIER ดูเหมือนจะตอบสนองความต้องการของคุณมันเป็นโมดูลเคอร์เนล linux ที่สามารถสร้างที่เก็บข้อมูลแบบทำเป็นชั้นได้ ดูเหมือนว่าจะเรียนรู้ด้วยตนเองถึงรูปแบบและเพิ่มประสิทธิภาพการจัดวางลงในที่เก็บข้อมูล

http://www.lessfs.com/wordpress/?p=776


เพิ่งเห็นคำถามเก่า ... ขออภัย ^^ '
Dolanor

2
การฟื้นฟูคำถามเก่านั้นดีกว่าการเน่าเปื่อยไปด้วยข้อมูลเก่าและล้าสมัยในคำถามเหล่านั้น!
David Gardner

ฉันกังวลว่าผู้ชายคนนี้ต้องการลดความซ้ำซ้อนเพื่อความจุที่เพิ่มขึ้น (โดยเฉพาะอย่างยิ่งเมื่อ SSD มีขนาดเล็กและไม่น่าเชื่อถือ)
Tobu

ยังกังวลว่าเขาแนะนำการโจมตีเป็นวิธีแก้ปัญหาเมื่อซอฟต์แวร์ทดลองต้องการการสำรองข้อมูลมากที่สุด
Tobu

นี่เป็นข้อเสนอแนะในเชิงบวกเล็กน้อย: permalink.gmane.org/gmane.comp.file-systems.ceph.devel/8316
Tobu

1

ตอบคำถามของฉันด้วยสิ่งที่ฉันเพิ่งพบ:

ฉันเพิ่งอัปเดตเคอร์เนลและดูสิ่งใหม่ ๆ ที่เพิ่มเข้ามาและ ตอนนี้มีตัวเลือก 'CACHEFILES'ซึ่งช่วยให้ระบบไฟล์แคช (โดยปกติระยะไกล) เป็นระบบไฟล์ในระบบ ฉันเดาว่าฉันสามารถใช้สิ่งนี้เพื่อแคชกลไกการเก็บข้อมูลที่ช้ากว่า (HDD) ไปยังหนึ่งที่เร็วกว่า (SSD) อย่างน้อยก็สำหรับลำดับชั้นในระดับหนึ่ง


คุณลองใช้วิธีนี้หรือไม่? มันทำงานอย่างไร
skolima

1
ไม่เป็นไร - ฉันพบว่า CacheFS สำหรับตอนนี้รองรับเฉพาะ NFS และ AFS เท่านั้น
skolima

การใช้ระบบไฟล์เครือข่ายสำหรับสิ่งนี้ไม่ได้เป็นความคิดที่ไม่ดีพวกเขามีแนวโน้มที่จะเติบโตเร็วกว่าชุดแพทช์เคอร์เนล ฉันสงสัยว่า Ceph หรือ DRBD มีโหมดที่มีประโยชน์สำหรับการจัดเก็บข้อมูลแบบฉัตร
Tobu

1

ลิงก์ที่เกี่ยวข้องบางรายการ YMMV

http://code.google.com/p/fscops/ - "Online Hierarchical Storage Manager (OHSM) เป็นความพยายามครั้งแรกสำหรับผู้จัดการเก็บข้อมูลโอเพ่นซอร์สระดับองค์กรซึ่งจะย้ายข้อมูลระหว่างที่เก็บข้อมูลต้นทุนต่ำและต้นทุนต่ำโดยอัตโนมัติ สื่อ. "

http://www.tack.ch/unix/dmapi/ - XFS + DMAPI ภายใต้ Linux

http://jfs.sourceforge.net/ - JFS + DMAPI ภายใต้ Linux


โครงการ OHSM ดูเหมือนน่าสนใจที่จะติดตาม รองรับ ext2 และเคอร์เนล 2.6.30 เท่านั้นในตอนนี้ แต่ฉันคาดหวังว่ามันจะทำงานได้ดีและนี่จะทำให้ระบบไฟล์มีจำนวนมากขึ้น
David Gardner

โครงการนั้นดูเหมือนจะถูกทอดทิ้งกิจกรรมล่าสุดส่วนใหญ่เกิดขึ้นในปี 2009
sendmoreinfo


0

ภาพรวมของ LVM2 คำนึงถึง ... แต่คุณไม่สามารถทำได้มากกว่าเพียงภาพเดียว


0

SAM-QFSเป็นผลิตภัณฑ์ที่มีอยู่ของซันและเปิดตัวเมื่อปีที่แล้ว มันคือ CDDL ดังนั้นคุณสามารถโอนไปยัง * BSD โดยตรงเท่านั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.