มันขึ้นอยู่กับสิ่งที่คุณพยายามทำสำเร็จและสิ่งที่คุณหมายถึงโดย "Distributed Computing Cluster" ฉันทำสิ่งเดียวกันนี้ครั้งหนึ่งใน Uni โดยใช้เครื่องจักรเก่าและPVMนั่นคือ "Cluster" ในแง่ของเครื่องจักรที่ทำหน้าที่เป็นคอมพิวเตอร์เครื่องเดียวเพื่อทำการประมวลผลแบบขนาน - คิดว่า Beowulf clusters แน่นอนคุณจะต้องมีรหัสที่เขียนขึ้นเพื่อใช้ประโยชน์จากสิ่งนี้
จุดเริ่มต้นที่ดีคือการกำหนดสิ่งที่คุณต้องการเรียนรู้ด้วยโครงการนี้ ฉันขอแนะนำให้อ่านบทความวิกิพีเดียเกี่ยวกับการคำนวณแบบขนานสำหรับการเริ่มแล้วปรับความต้องการของคุณตามสิ่งที่คุณต้องการจะทำ
ระบบการจัดคิวงานง่ายๆ (เช่นคนใช้เกียร์ ) อาจเพียงพอที่จะรับผลลัพธ์ที่ยอดเยี่ยมได้อย่างรวดเร็ว
ปัญหาที่ฉันมีเมื่อสร้างคลัสเตอร์การคำนวณแบบขนานคือฉันไม่ได้ทำอะไรเลยมันแค่นั่งอยู่ตรงนั้น แต่มันเป็นโครงการที่สนุกและฉันเรียนรู้มาไม่น้อย ไม่ว่าในกรณีใดคุณมีแนวโน้มที่จะเรียนรู้ค่อนข้างน้อยและสนุกสนานในเวลาเดียวกันโดยไม่คำนึงถึงสิ่งที่คุณเลือกที่จะใช้
เท่าที่ทางเลือกของการแจกแจงฉันจะไปกับสิ่งที่ฉันรู้สึกสะดวกสบายที่สุดเพราะคุณจะต้องติดตั้งสิ่งต่าง ๆ จากแหล่งที่มา เมื่อคุณสะดวกสบายในการตั้งค่าทุกอย่างแล้วคุณสามารถค้นหาการกระจายที่ปรับให้ตรงกับความต้องการของคุณมากขึ้น แต่การกระจายใด ๆ ที่ควรทำ
ซอฟต์แวร์ใดที่สามารถกำหนดค่าคลัสเตอร์ ขึ้นอยู่กับประเภทของคลัสเตอร์ที่คุณสร้าง
บนกระดานกับ FS แบบกระจาย? อีกครั้งสิ่งนี้ขึ้นอยู่กับข้อกำหนดสำหรับคลัสเตอร์ของคุณ แต่ละโหนดจะส่งผ่านข้อมูลไปมาระหว่างโหนดอื่น ๆ หรือไม่ พวกเขาจะทำงานเป็นทาสกับเจ้านายคนเดียวหรือไม่? พวกเขาจะทำงานอิสระอย่างสมบูรณ์? คำถามเหล่านี้จะเริ่มแจ้งให้คุณเลือก และแน่นอนว่ายังมีการแลกเปลี่ยนอยู่เสมอ
ลิงก์อื่น ๆ ที่อาจพิสูจน์ได้ว่าน่าสนใจ:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/