ด้วยHadoopและCouchDBทั่วในบล็อกและข่าวที่เกี่ยวข้องว่าหน่วยเก็บข้อมูลที่ทนต่อความผิดพลาด (เอ็นจิ้น) ที่ใช้งานได้จริงคืออะไร
- CouchDB จริง ๆ แล้วไม่มีคุณสมบัติการแจกจ่ายใด ๆ อยู่ภายในความรู้ของฉันกาวเพื่อกระจายรายการโดยอัตโนมัติหรือแม้กระทั่งฐานข้อมูลทั้งหมดจะหายไป
- Hadoop ดูเหมือนจะใช้กันอย่างแพร่หลายมาก - อย่างน้อยมันก็ได้รับการกดดี แต่ก็ยังมีจุดล้มเหลวเพียงจุดเดียว: The NameNode นอกจากนี้มันสามารถติดตั้งได้ผ่าน FUSE เท่านั้นฉันเข้าใจว่า HDFS ไม่ใช่เป้าหมายหลักของ Hadoop
- GlusterFSไม่มีแนวคิดอะไรที่ใช้ร่วมกัน แต่เมื่อเร็ว ๆ นี้ฉันอ่านบทความหลายเรื่องที่ทำให้ฉันเห็นว่ามันไม่เสถียรเท่าไหร่
- ความมันวาวมีจุดของความล้มเหลวเพียงจุดเดียวเนื่องจากมันใช้เซิร์ฟเวอร์เมทาดาทาโดยเฉพาะ
- Cephดูเหมือนจะเป็นผู้เล่นที่เลือก แต่หน้าแรกระบุว่ามันยังอยู่ในช่วงอัลฟา
ดังนั้นคำถามคือระบบไฟล์แบบกระจายมีชุดคุณลักษณะต่อไปนี้ (ไม่มีลำดับเฉพาะ):
- POSIX ได้
- การเพิ่ม / กำจัดโหนดอย่างง่ายดาย
- แนวคิดแบบไม่มีอะไรแชร์
- ทำงานบนฮาร์ดแวร์ราคาถูก (AMD Geode หรือโปรเซสเซอร์ระดับ VIA Eden)
- การพิสูจน์ตัวตน / การอนุญาตในตัว
- ระบบไฟล์เครือข่าย (ฉันต้องการที่จะสามารถติดตั้งพร้อมกันในโฮสต์ที่แตกต่างกัน)
ยินดีที่ได้:
- ไฟล์ที่สามารถเข้าถึงได้ในเครื่อง: ฉันสามารถนำโหนดลง mount พาร์ติชั่นด้วยระบบไฟล์มาตรฐาน (ext3 / xfs / อะไรก็ตาม ... ) และยังคงเข้าถึงไฟล์
ฉันไม่ได้มองหาแอปพลิเคชั่นที่โฮสต์ แต่เป็นสิ่งที่จะทำให้ฉันสามารถบอกว่า 10GB ของกล่องฮาร์ดแวร์ของเราและมีที่เก็บข้อมูลนั้นในเครือข่ายของเราติดตั้งได้ง่ายบนโฮสต์จำนวนมาก