การสร้างคลัสเตอร์ในคลาวด์ราคาถูกกว่าการสร้างคลัสเตอร์ในห้องทดลองสำหรับการจำลอง MD เมื่อใด


23

คลัสเตอร์การคำนวณ Amazon EC2 มีค่าใช้จ่ายประมาณ$ 800 - $ 1,000 (ขึ้นอยู่กับวัฏจักรหน้าที่) ต่อคอร์ CPU จริงในระยะเวลา 3 ปี ในการซื้อฮาร์ดแวร์รอบสุดท้ายของเราห้องปฏิบัติการของฉันได้รับ 48 คอร์มูลค่าของฮาร์ดแวร์คล้ายกับคลัสเตอร์ของ Amazon ราคาประมาณ $ 300 ต่อแกน

ฉันทำอะไรบางอย่างหายไปหรือเปล่า มีสถานการณ์ใดบ้างไหมที่เหมาะสมที่จะสร้างคลัสเตอร์ในคลาวด์สำหรับงานซีพียูระดับสูงเช่นการจำลองพลวัตของโมเลกุล? หรือฉันมักจะดีกว่าแค่สร้างและเลี้ยงลูกด้วยตนเองที่เครื่องแดงด้วยตัวเอง?

(ฉันควรพูดถึงว่าห้องปฏิบัติการของฉันไม่ได้จ่ายค่าไฟฟ้าในห้องเซิร์ฟเวอร์ของเรา (อย่างน้อยก็ไม่ได้โดยตรง) แต่ถึงแม้จะมีประโยชน์นี้อเมซอนก็ยังมีราคาแพงมาก)


2
สิ่งหนึ่งที่ฉันสามารถบอกคุณได้คือคุณไม่มีค่าใช้จ่ายด้านแรงงานในการดูแลและบำรุงรักษาคลัสเตอร์ ในการตั้งค่าด้านวิชาการใครบางคนจะต้องเป็นผู้ดูแลระบบคลัสเตอร์และทำงานหนักหน่วงเช่นการอัปเดตและอัปเกรดระบบปฏิบัติการการติดตั้งซอฟต์แวร์ใหม่การสนับสนุนด้านเทคนิคเมื่อคลัสเตอร์ล่มและอื่น ๆ งานเหล่านี้ไม่เห็นคุณค่าและขึ้นอยู่กับทักษะของผู้ดูแลระบบอาจต้องใช้เวลานานมาก คลัสเตอร์ EC2 จะลดจำนวนชั่วโมงที่ต้องใช้ในการบำรุงรักษาคลัสเตอร์
Geoff Oxberry

1
เห็นได้ชัดว่าคุณมีฮาร์ดแวร์ราคาถูก ฉันคำนวณค่าใช้จ่ายเป็นเวลา 3 ปีสำหรับคลัสเตอร์ 192 คอร์ในที่ทำงานเดิมของฉันและมันกลายเป็นมากกว่า $ 850 ต่อคอร์ต่อปี ไม่พูดถึงปัญหาทั้งหมดที่เราเคยมีกับระบบพลังงานและการระบายความร้อน ...
Hristo Iliev

@GeoffOxberry คุณสร้างประเด็นที่ดีเกี่ยวกับต้นทุนแรงงาน ในห้องแล็บของฉันฉันเป็นผู้ดูแลระบบดังนั้นฉันจึงไม่คิดถึงสิ่งนั้น น่าผิดหวังอย่างที่บางครั้งมันเป็นงานแห่งความรัก หากฉันมีเงินสดและมีที่อื่นที่จะวางฉันจะทำตามคำแนะนำ (กระจัดกระจาย) ในบล็อกนี้และพยายามสร้างวัตสันของตัวเอง
โทร

@HristoIliev ฉันไม่คิดว่ามันราคาถูก หากคุณเต็มใจที่จะรับกลุ่ม "ที่ใช้งานเบา" จาก Dell คุณสามารถลดค่าใช้จ่ายลงเหลือ ~ $ 200 ต่อคอร์ คุณช่วยบอกฉันเพิ่มเติมเกี่ยวกับฮาร์ดแวร์ในที่ทำงานเดิมของคุณได้ไหม
โทร

1
มันเป็นระบบที่สร้างขึ้นเองด้วยแชสซี Xeon Dual-Socket Xeon 12 คู่ (24 โหนด 48 E5420s) พร้อม RAM 16 GiB ECC ในแต่ละโหนดหนึ่งเครื่อง Nehalem ซ็อกเก็ตเดี่ยวหนึ่งตัวที่มี 2 Tesla M2090s สวิตช์ InfiniBand 24 พอร์ตหนึ่งตัว ไฟล์เซิร์ฟเวอร์ที่มีดิสก์ 4 ตัว UPS 10 kVA สองเครื่องเครื่องปรับอากาศสองตัว เราได้รับมาเป็นระยะ ๆ ตลอดระยะเวลาโครงการสามปี ไม่ใช่จำนวนที่ยิ่งใหญ่ที่สุด แต่ยังมีมูลค่ารวมประมาณ 100k ยูโร (ราคาทางวิชาการที่ดีที่สุดในบัลแกเรีย)
Hristo Iliev

คำตอบ:


15

ข้อได้เปรียบหลักในความคิดของฉันในการใช้ทรัพยากรบนคลาวด์คือความยืดหยุ่นเช่นหากคุณมีปริมาณงานที่ผันผวนคุณจะจ่ายเฉพาะสิ่งที่คุณต้องการ

หากนี่ไม่ใช่กรณีในใบสมัครของคุณนั่นคือคุณรู้ว่าคุณจะมีปริมาณงานที่ต้องทำเชิงปริมาณและคงที่คุณอาจต้องสร้างคลัสเตอร์ของคุณเอง ในคลาวด์คุณจ่ายเพื่อความยืดหยุ่นและหากคุณไม่ต้องการความยืดหยุ่นคุณจะต้องจ่ายเงินสำหรับบางสิ่งที่คุณไม่ต้องการ

หากภาระงานของคุณมีความยืดหยุ่น แต่ค่อนข้างเข้มข้นและอาศัยคุณสมบัติฮาร์ดแวร์บางอย่าง (ดูคำตอบของ aeismail) คุณอาจต้องการลองแชร์คลัสเตอร์กับคนอื่น ๆ ในมหาวิทยาลัยของคุณเพื่อตัดรอบการใช้งาน มหาวิทยาลัยเก่าของฉันดำเนินการคลัสเตอร์แบบแบ่งใช้ที่มี "รูปแบบผู้ถือหุ้น" ซึ่งทุกกลุ่มรับประกันว่าส่วนแบ่งของพลังการคำนวณตามสัดส่วนการลงทุนของพวกเขาในฮาร์ดแวร์และรอบที่ไม่ได้ใช้งานสามารถนำไปใช้ได้ทุกคน ปัญหาเดียวคือการรวมศูนย์การบริหารคลัสเตอร์


3
จุดสำคัญคือการ 'เชิงปริมาณและคงที่' โดยปกติปริมาณงานจะแตกต่างกันอย่างมีนัยสำคัญและเป็นไปได้ค่อนข้างที่จะต่ำกว่าที่จะทำให้ค่าใช้จ่ายสูงกว่า $ 300 / แกน นอกจากนี้ในการตั้งค่าการคำนวณแบบคลาวด์มันง่ายต่อการขยายขนาดอินสแตนซ์เพิ่มเติมหากจำเป็นชั่วคราว (สัปดาห์ก่อนการประชุม?)
Phil H

1
+1 สำหรับสิ่งนี้ การใช้กลุ่มของฉันเริ่มจาก 0 ถึงกรณีของ "คุณทำอะไร!" ฉันไม่สามารถจ่ายให้คนที่สองได้เมื่อใดก็ตามที่ฉันต้องการ
Fomite

7

มีบางอย่างที่ต้องกังวลเมื่อทำการคำนวณแบบคลาวด์ด้วย MD ตัวอย่างเช่นคุณต้องกังวลเกี่ยวกับรูปแบบทางกายภาพของโปรเซสเซอร์ในเซิร์ฟเวอร์ฟาร์มที่งานเหล่านี้จะทำงาน เหตุผลก็คือขึ้นอยู่กับขนาดของแบบจำลองของคุณและชนิดของการคำนวณที่คุณใช้ (ตัวอย่างเช่นระบบที่มี electrostatics) คุณอาจต้องพึ่งพา FFT อย่างมากและผลักอิเล็กตรอนไปยังโปรเซสเซอร์ที่แตกต่างกันในคลัสเตอร์ขนาดยักษ์ อาจกลายเป็นส่วนที่ใช้เวลานานในการคำนวณรวม

นอกจากนี้สำหรับบางสิ่งบางอย่างที่เน้นข้อมูลเป็น MD คุณจะต้องแน่ใจว่าคุณมีการอัปโหลดและดาวน์โหลดการเชื่อมต่อไปยังเซิร์ฟเวอร์อย่างรวดเร็วรวมถึงข้อ จำกัด ที่สมเหตุสมผลในการจัดเก็บข้อมูล ไม่เช่นนั้นการประหยัดต้นทุนจำนวนมากอาจทำให้สูญเสียประสิทธิภาพและค่าใช้จ่ายในการจัดเก็บ

สำหรับสิ่งที่คุ้มค่าสถาบันของเราเพิ่งซื้อประมาณ 240 คอร์สำหรับกลุ่มในพื้นที่ของเราในราคาต่ำกว่า 500 ยูโรต่อแกน ค่าใช้จ่ายนั้นรวมถึงการโฮสต์และการบริหารรวมถึงบริการในมหาวิทยาลัยของเราเป็นเวลาสี่ปี บนพื้นฐานรายปีที่ดูเหมือนว่าราคาถูกขัน ฉันคิดว่าอาจเป็นสิ่งที่ดีที่สุดของทั้งสองโลก - การเข้าถึงในท้องถิ่น แต่ได้รับการดูแลอย่างมืออาชีพโดยไม่จำเป็นต้องมีทีมไอทีของเราเอง


5

ฉันไม่มีประสบการณ์โดยตรงกับบริการคลาวด์เช่น EC2 ของ Amazon แต่ค่าใช้จ่ายจริงต่อคอร์มีแนวโน้มมากกว่าที่คุณอ้างถึง: มันเป็นค่าใช้จ่ายในการซื้อครั้งแรก, ไฟฟ้า, การระบายความร้อน, พื้นที่ในอาคาร, ฮาร์ดแวร์ทดแทน บวกกับค่าใช้จ่ายในการจัดการ: ตั้งค่าระบบปฏิบัติการและบริการคลัสเตอร์ทำให้ระบบปฏิบัติการทันสมัยแก้ไขปัญหาคิว ฯลฯ ฉันจะไม่แปลกใจเลยถ้าผลรวมทั้งหมดนี้เป็นสองเท่าของค่าใช้จ่ายในการซื้อครั้งแรก แน่นอนว่าคุณจะได้รับความยืดหยุ่น

สำหรับฉันแล้วโมเดลจะลดลง: ถ้าคุณมีคลัสเตอร์ขนาดใหญ่จริง ๆ (1,000 คอร์หรือมากกว่านั้น) จากนั้นคุณสามารถชดเชยเวลาทำงานซ่อมและดูแลระบบได้เพราะมีงานมากพอที่จะทำให้งานยุ่ง หากคุณมีกลุ่มเล็ก ๆ ที่ไม่คุ้มค่าที่จะมีคนที่ทุ่มเททำมันก็เป็นไปได้ที่คุณจะทำให้ใครบางคนทำมันด้วยงานแรกที่ต้องทำวิทยาศาสตร์และในกรณีนี้เวลาของเขาคนนี้จะถูกใช้ในงานธุรการระดับต่ำ นี่คือที่บริการตามความต้องการเช่นเซิร์ฟเวอร์เมฆส่องแสง


ที่ห้องแล็บของฉันไฟฟ้าการทำความเย็นและพื้นที่สำหรับกลุ่มของเราทั้งหมดได้รับค่าใช้จ่ายจากการตัดมหาวิทยาลัยของเรานำเงินทุนค่าสิ่งอำนวยความสะดวกของเราออกไป การตัดนี้เหมือนกันไม่ว่าเราจะเรียกใช้คลัสเตอร์หรือไม่ก็ตาม คุณรู้หรือไม่ว่ามีสถานการณ์ที่คล้ายกันในมหาวิทยาลัยส่วนใหญ่หรือห้องปฏิบัติการส่วนใหญ่ค้างจ่ายเงินเพื่อทำความเย็นและอื่น ๆ โดยตรงจากกระเป๋า?
โทร

1
ฉันเชื่อว่าห้องปฏิบัติการส่วนใหญ่มีการจัดการแบบเดียวกับคุณ แต่มันผิดที่จะเพิกเฉยต่อค่าใช้จ่ายเหล่านี้ บางคนจะต้องแบกรับถึงแม้ว่ามันจะไม่ใช่คุณเป็นการส่วนตัว อาจเป็นการดีที่จะขอให้แผนก / มหาวิทยาลัยแบ่งปันส่วนแบ่งค่าใช้จ่ายทางอ้อมให้คุณถ้าคุณตกลงที่จะสร้างกลุ่มของคุณในระบบคลาวด์แทนการใช้ในวิทยาเขต
Wolfgang Bangerth

4

ในฐานะที่เป็นส่วนเสริมของคำตอบที่ยอดเยี่ยมบางข้อมีปัจจัยอีกข้อที่ควรพิจารณา:

  • โดยไม่คำนึงถึงค่าใช้จ่ายคุณจะจ่ายอย่างไร

ฉันพบจำนวนเงินช่วยเหลือที่ไม่สำคัญไม่ว่าในกรณีใดก็ตามจะต้องจ่ายค่าใช้จ่ายด้านฮาร์ดแวร์ แต่จะจ่ายสำหรับเวลาในการคำนวณในบางสิ่งเช่น EC2 ดังนั้นภายใต้สถานการณ์การระดมทุนบางอย่างในขณะที่คุณอาจจะสามารถระดมทุนคลัสเตอร์ "testbed" ขนาดเล็กที่มีเงินทุนที่ไม่มีโครงสร้างหรือแพ็คเกจเริ่มต้นของห้องปฏิบัติการสำหรับโครงการขนาดใหญ่มันอาจเป็นวิธีเดียวที่จะได้รับเงินทุนในการคำนวณ

พิจารณา NIH:

บริการ ADP / คอมพิวเตอร์: บริการที่คุณรวมไว้ที่นี่ควรเป็นการวิจัยบริการคอมพิวเตอร์เฉพาะเช่นการจองเวลาประมวลผลบนซูเปอร์คอมพิวเตอร์หรือรับซอฟต์แวร์พิเศษเพื่อช่วยในการเรียกใช้สถิติของคุณ ส่วนนี้ไม่ควรรวมคอมพิวเตอร์เดสก์ท็อปมาตรฐานของคุณแล็ปท็อปหรือการสนับสนุนเทคโนโลยีมาตรฐานที่สถาบันของคุณให้ไว้ ค่าใช้จ่ายประเภทนั้นควรมาจากค่าใช้จ่าย F & A

ในขณะที่เป็นไปได้ที่จะวางเครื่องคลัสเตอร์ลงภายใต้หัวข้ออุปกรณ์ $ 5,000 และคุณสามารถสร้างข้อโต้แย้งที่ดีได้ฉันพบผู้ตรวจสอบทั้งสองคนที่ใจร้ายเกี่ยวกับเรื่องนี้และมหาวิทยาลัยที่ลังเลเกี่ยวกับค่าใช้จ่ายในการดูแลรักษา ระบบ.

เงินช่วยเหลือบางอย่างเข้มงวดยิ่งขึ้น หนึ่งทุนที่ฉันได้อ่านมีดังนี้:

เงินทุนอาจไม่สามารถใช้กับฮาร์ดแวร์คอมพิวเตอร์

บ่อยครั้งที่ง่ายที่จะได้รับคลัสเตอร์ที่จ่ายโดยค่าใช้จ่ายโดยตรงหากใช้ EC2 หรือหนึ่งในอะนาล็อกมากกว่าการซื้อฮาร์ดแวร์โดยเฉพาะอย่างยิ่งหากองค์กรของคุณตระหนี่กับต้นทุนทางอ้อม นี่อาจไม่ใช่กรณีของคุณ แต่เป็นกรณีสำหรับบางคน


ฉันคิดว่านั่นไม่ใช่ข้อโต้แย้งที่ดี ฉันคุ้นเคยกับระบบการระดมทุนในสหรัฐอเมริกาเท่านั้น แต่ถ้าคุณใส่เงินจำนวนหนึ่งลงในหมวดหมู่ "อุปกรณ์" คุณสามารถใช้มันเพื่อซื้อคลัสเตอร์ แน่นอนถ้าหมวดหมู่นั้นว่างคุณก็ขอเงินดอลลาร์ผิด อุปกรณ์มีข้อได้เปรียบที่ดีหากว่ามันเป็นอุปกรณ์ชิ้นเดียวที่สูงกว่าราคาซื้อ 5 พันเหรียญคุณไม่ต้องจ่ายค่าใช้จ่ายเลย (อย่างน้อยก็ที่มหาวิทยาลัยของเรา)
Wolfgang Bangerth

@ WolfgangBangerth ดูการแก้ไขของฉันสำหรับรายละเอียด - การวางไว้ใต้หมวดหมู่ "อุปกรณ์" อาจไม่ได้รับอนุญาต
Fomite

ใช่ถ้าเป็นเงื่อนไขก็ไม่มีอะไรที่คุณสามารถทำได้ แต่ฉันพบว่าหากคุณมีกรณีที่ดีว่าทำไมคุณถึงขอเงินค่าอุปกรณ์ในการให้สิทธิ์ผู้ตรวจสอบมักจะไปกับมัน - โดยปกติแล้วจะไม่ได้เป็นส่วนใหญ่ของผลรวมโดยรวม แน่นอนว่าถ้าเงินที่ไม่ได้รับงบประมาณในการเริ่มต้นมีอะไรที่คุณสามารถทำได้หลังจากความจริง
Wolfgang Bangerth

0

พระเจ้ามีคำตอบมากมายอยู่แล้ว ฉันแค่ต้องการเพิ่มจุดเล็ก ๆ สองจุด

1. ) ฉันรู้ว่า IBM กำลังเสนอสิ่งที่คล้ายกัน ดังนั้นขึ้นอยู่กับใบสมัครของคุณมันอาจจะคุ้มค่าที่จะเปรียบเทียบข้อเสนอที่แตกต่างกัน ไม่เพียง แต่เกี่ยวกับค่าใช้จ่าย แต่ยังรวมถึงอุปกรณ์

2. ) แน่นอนห้องปฏิบัติการส่วนใหญ่มีขนาดเล็กเกินไปที่จะลงทุนในคลัสเตอร์ของตนเอง ดังนั้นคำถามคือว่ามันเป็นไปไม่ได้ที่จะรวบรวมหลายแล็บด้วยกันและลงทุนในคลัสเตอร์ที่แชร์ระหว่างแล็บที่แตกต่างกัน สิ่งนี้มีนอกเหนือจากผลที่ได้จากการแบ่งปันต้นทุนที่ชัดเจนรวมถึงข้อดีของการกระจายโหลดที่สม่ำเสมอยิ่งขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.