MapReduce : กรอบการคำนวณแบบกระจายที่ยอมรับความผิดได้ MapReduce ช่วยให้คุณสามารถดำเนินการกับข้อมูลจำนวนมาก - มีงานจำนวนมากใส่เพื่อป้องกันความล้มเหลวเนื่องจากฮาร์ดแวร์ MapReduce เป็นตัวเลือกที่ดีสำหรับการคำนวณผลลัพธ์ได้อย่างรวดเร็วเพราะมันช้า (งาน MapReduce ทั่วไปใช้เวลาในการสั่งนาทีหรือชั่วโมงไม่ใช่ไมโครวินาที)
งาน MapReduce ใช้ไฟล์ (หรือที่เก็บข้อมูลบางอย่าง) เป็นอินพุตและเขียนไฟล์ผลลัพธ์ หากคุณต้องการให้ผลลัพธ์เหล่านี้พร้อมใช้งานกับแอปพลิเคชันคุณจะต้องรับผิดชอบในการวางข้อมูลนี้ในที่ที่สามารถเข้าถึงได้ นี่อาจเป็นไปได้ช้าและจะมีความล่าช้าระหว่างค่าที่คุณสามารถแสดงและค่าที่แสดงถึงระบบของคุณในสถานะปัจจุบัน
ความแตกต่างที่สำคัญในการพิจารณาใช้ MapReduce ในการสร้างระบบแบบเรียลไทม์คือการฝึกฝนแบบจำลองของคุณและการประยุกต์ใช้แบบจำลองของคุณ หากคุณคิดว่าพารามิเตอร์แบบจำลองของคุณไม่เปลี่ยนแปลงอย่างรวดเร็วคุณสามารถปรับให้พอดีกับ MapReduce จากนั้นมีกลไกในการเข้าถึงพารามิเตอร์ก่อนการพอดีเมื่อคุณต้องการใช้แบบจำลองของคุณ
Storm : ระบบการคำนวณแบบเรียลไทม์และสตรีมมิ่ง Storm เป็นเฟรมเวิร์กออนไลน์ความหมายในแง่นี้บริการที่โต้ตอบกับแอ็พพลิเคชันที่รันอยู่ ตรงกันข้ามกับ MapReduce มันจะได้รับข้อมูลขนาดเล็ก (ไม่ใช่ไฟล์ทั้งหมด) เนื่องจากมีการประมวลผลในแอปพลิเคชันของคุณ คุณกำหนด DAG ของการดำเนินการเพื่อดำเนินการกับข้อมูล กรณีการใช้งานทั่วไปและเรียบง่ายสำหรับ Storm คือการติดตามเคาน์เตอร์และการใช้ข้อมูลนั้นเพื่อเติมข้อมูลแดชบอร์ดตามเวลาจริง
สตอร์มไม่มีอะไรเกี่ยวข้องกับข้อมูลของคุณ ที่นี่การสตรีมเป็นอีกวิธีหนึ่งที่จะกล่าวว่าการเก็บข้อมูลที่คุณสนใจและทิ้งส่วนที่เหลือไว้ ในความเป็นจริงคุณอาจมีเลเยอร์คงอยู่ในแอปพลิเคชันของคุณที่ได้บันทึกข้อมูลไปแล้วและนี่เป็นการแยกความกังวลที่ดีและเป็นธรรม
หากคุณต้องการทราบข้อมูลเพิ่มเติม ...
หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับระบบเรียลไทม์ที่เหมาะสมกับพารามิเตอร์ของ MR และใช้โมเดลในแบบที่แตกต่างกันตรงนี้คือสไลด์สำหรับการพูดคุย HBase
กระดาษที่ยอดเยี่ยมที่แต่งงานแบบเรียลไทม์ในการนับและคงอยู่ในวิธีที่น่าสนใจคือGoogle News Personalization: Scalable Online Collaborative Filtering
อีกประการหนึ่งที่น่าสนใจของการแต่งงานและนายพายุSummingBird Summingbird ช่วยให้คุณกำหนดการดำเนินการวิเคราะห์ข้อมูลที่สามารถใช้งานผ่าน Storm หรือ MR