ตรงจากปากม้า :
Hadoop เป็นกรอบสำหรับการใช้งานแอพพลิเคชั่นบนคลัสเตอร์ขนาดใหญ่ที่สร้างขึ้นจากฮาร์ดแวร์สินค้าโภคภัณฑ์ เฟรมเวิร์ก Hadoop ให้แอปพลิเคชั่นทั้งความน่าเชื่อถือและการเคลื่อนไหวข้อมูล Hadoop ใช้กระบวนทัศน์การคำนวณที่ชื่อว่า Map / ย่อซึ่งแอปพลิเคชันจะถูกแบ่งออกเป็นชิ้นส่วนเล็ก ๆ ของงานซึ่งแต่ละอันอาจถูกดำเนินการหรือดำเนินการบนโหนดใด ๆ ในคลัสเตอร์ นอกจากนี้ยังมีระบบไฟล์แบบกระจาย (HDFS) ที่จัดเก็บข้อมูลบนโหนดการคำนวณซึ่งให้แบนด์วิดท์รวมที่สูงมากทั่วทั้งคลัสเตอร์ ทั้ง Map / Reduce และระบบไฟล์แบบกระจายได้รับการออกแบบเพื่อให้ความล้มเหลวของโหนดได้รับการจัดการโดยอัตโนมัติโดยเฟรมเวิร์ก
แผนที่ / ย่อเป็นกระบวนทัศน์การเขียนโปรแกรมที่ได้รับความนิยมจากGoogleซึ่งในงานแบ่งออกเป็นส่วนเล็ก ๆ และแจกจ่ายไปยังโหนดจำนวนมากสำหรับการประมวลผล (แผนที่) และผลลัพธ์จะถูกสรุปในคำตอบสุดท้าย (ลด ) Google และ Yahoo ใช้สิ่งนี้เพื่อเทคโนโลยีเครื่องมือค้นหาของพวกเขาเหนือสิ่งอื่นใด
Hadoop เป็นกรอบทั่วไปสำหรับการใช้รูปแบบการประมวลผลชนิดนี้ สำหรับสาเหตุที่ทำให้มันเตะตูดส่วนใหญ่เป็นเพราะมันมีคุณสมบัติที่เป็นระเบียบเช่นการยอมรับข้อบกพร่องและช่วยให้คุณสามารถนำฮาร์ดแวร์ชนิดใดก็ได้มารวมกันเพื่อทำการประมวลผล อีกทั้งยังปรับขนาดได้ดีมากหากปัญหาของคุณเหมาะกับกระบวนทัศน์
คุณสามารถอ่านทั้งหมดได้ที่เว็บไซต์เว็บไซต์
สำหรับตัวอย่างบางส่วนเปาโลให้ตัวอย่างเล็กน้อย แต่นี่คืออีกสองสามข้อที่คุณสามารถทำได้ซึ่งไม่ใช่เว็บศูนย์กลาง:
- แสดงภาพยนตร์ 3 มิติ ขั้นตอน "แผนที่" กระจายเรขาคณิตสำหรับทุกเฟรมไปยังโหนดอื่นโหนดแสดงผลและเฟรมที่แสดงผลจะรวมกันอีกครั้งในขั้นตอน "ลด"
- การคำนวณพลังงานในระบบในแบบจำลองโมเลกุล แต่ละเฟรมของวิถีระบบจะกระจายไปยังโหนดในขั้นตอน "แผนที่" โหนดคำนวณพลังงานสำหรับแต่ละเฟรม
จากนั้นจะสรุปผลลัพธ์ในขั้นตอน "ลด"
โดยพื้นฐานแล้วตัวแบบนั้นทำงานได้ดีมากสำหรับปัญหาที่สามารถแยกย่อยลงในการคำนวณแบบแยกซึ่งคล้ายกันซึ่งเป็นอิสระอย่างสมบูรณ์และสามารถรวมกันอีกครั้งเพื่อให้ได้ผลลัพธ์สุดท้าย