ฉันมีรายชื่อ บริษัท เล็ก ๆ ที่ให้บริการแพลตฟอร์มสำหรับการรันสคริปต์ R, python หรืออ็อกเทฟบนคลัสเตอร์ที่สร้างขึ้นบน amazon EC2 มีชื่ออื่นที่ฉันควรเพิ่มหรือไม่
ฉันมีรายชื่อ บริษัท เล็ก ๆ ที่ให้บริการแพลตฟอร์มสำหรับการรันสคริปต์ R, python หรืออ็อกเทฟบนคลัสเตอร์ที่สร้างขึ้นบน amazon EC2 มีชื่ออื่นที่ฉันควรเพิ่มหรือไม่
คำตอบ:
ฉันไม่ได้ใช้ บริษัท เหล่านี้ แต่นี่เป็นเพียงตัวเลือกบางส่วน อย่างไรก็ตามการตั้งค่าบน EC2 นั้นง่ายมาก อย่างน้อยหลังจากที่คุณมึนงงศีรษะของคุณโดยการต่อสู้กับผนังอย่างหนักและเพียงพอ นอกจากนี้ยังเพิ่มเกณฑ์ความเจ็บปวดของคุณ เด็ก ๆ วันนี้มีมันง่ายขึ้นมาก เมื่อฉันเริ่มต้นเรากำลังทำการคำนวณแบบหมอก: เราไม่ได้เป็นหมอกที่ดีที่สุดในสิ่งที่เรากำลังคำนวณ
รำลึกถึง ... เครื่องมือและทรัพยากรมีอยู่เพื่อข้ามผู้ขายเหล่านี้และเริ่มต้นด้วยตัวคุณเอง JD Long มีด้วยsegue
ทำให้ง่ายต่อการเริ่มใช้ R บน EMR
เกี่ยวกับ Python botoเป็นชุดโปรแกรมที่ช่วยให้สามารถใช้งาน Python ได้อย่างง่ายดายบน EC2 นอกจากนี้ยังเป็นเรื่องง่ายที่จะทำให้ Python ทำงานบนAppEngine ของ Googleหากคุณต้องการพิจารณาทางเลือก EC2 ถ้าคุณรู้จัก Python คุณไม่จำเป็นต้องจ้าง บริษัท เพื่อทำการยกให้คุณเว้นแต่คุณจะไม่คุ้นเคยกับการปรับขนาดการจัดเรียงการปรับสมดุลภาระการโหลด ฯลฯ ในระดับความคิด ในทางกลับกันหากคุณพิจารณาการใช้จ่ายเงินจำนวนมากในบริการดังกล่าวเป็นความคิดที่ดีที่จะทำความคุ้นเคยกับวิธีทำให้โค้ดของคุณมีประสิทธิภาพ
สำหรับ Octave บนคลาวด์ฉันไม่รู้ว่ามีอะไรอยู่นอกเหนือจากสาม บริษัท นี้ Monkey Analytics เคยเสนอให้ แต่ดูเหมือนว่าพวกเขาจะหายไป ฉันจะแนะนำให้หลีกเลี่ยง Octave และให้ความสำคัญกับ Python หรือ R
ทรัพยากรสำหรับการทำมันง่ายที่จะได้รับการตั้งขึ้นเป็นStarCluster อีกครั้งไม่มีประสบการณ์กับพวกเขา แต่นั่นอาจเป็นเส้นทางที่เป็นประโยชน์
ในความซื่อสัตย์ทุกอย่าง Ubuntu (หรือ Windows) และ EC2 นั้นไม่ยากที่จะเรียนรู้ ฉันจะไม่แนะนำ Windows สำหรับ R เนื่องจากไม่มีความรักในหมู่นักพัฒนา R และ Windows (หมายเหตุ: เท่าที่ฉันสามารถบอกได้ว่าไม่มีบริการคลาวด์ Mac OS X ที่ร้ายแรง) เมื่อคุณมีเดสก์ท็อประยะไกลคุณก็อยู่ในธุรกิจ เรียนรู้วิธีการปรับสเกลเป็นขั้นตอนต่อไป
อัปเดต 1: บริการการจัดการระบบคลาวด์อื่น ๆ ที่กว้างกว่า ได้แก่ RighstScale และ Scalr
อัปเดต 2: ฉันต้องการเน้นว่าการเรียนรู้เพื่อตั้งค่าอินสแตนซ์และกลุ่มของคุณในคลาวด์สำหรับตัวคุณเองเป็นสิ่งสำคัญ ท่ามกลางประโยชน์ของการทำงานบนมือ:
gputools
)มีประโยชน์ในการใช้ผู้ให้บริการที่มีการจัดการเช่นเส้นโค้งการเรียนรู้ที่สั้นกว่าอาจสนับสนุนการแบ่งปันทรัพยากรระหว่างกลุ่มได้ดีขึ้นและอาจจะเป็น Gizmos ที่ดี แต่ฉันไม่สามารถพูดถึงประโยชน์ที่ได้เมื่อเริ่มใช้ EC2 ก่อนสิ่งเหล่านี้ มาสู่ตลาด
นอกจากนี้ยังมีPiCloudสำหรับการเรียกใช้โค้ด Python แบบขนานบน EC2
จากหน้าผลิตภัณฑ์ของพวกเขา:
PiCloud เป็นแพลตฟอร์มการประมวลผลแบบคลาวด์ที่รวมเข้ากับภาษา Python Programming Language ช่วยให้คุณสามารถใช้ประโยชน์จากพลังการคำนวณของ Amazon Web Services โดยไม่ต้องจัดการดูแลรักษาหรือกำหนดค่าเซิร์ฟเวอร์เสมือน
PiCloud รวมเข้ากับฐานรหัสที่มีอยู่ของคุณอย่างราบรื่นผ่านทางห้องสมุด Python, คลาวด์ ในการลดการเรียกใช้ฟังก์ชั่นไปยังเซิร์ฟเวอร์ของเราสิ่งที่คุณต้องทำคือส่งผ่านฟังก์ชั่นที่คุณต้องการลงในห้องสมุดเมฆ PiCloud จะเรียกใช้ฟังก์ชันในคลัสเตอร์ที่มีประสิทธิภาพสูง ในขณะที่คุณใช้งานฟังก์ชั่นได้มากขึ้นคลัสเตอร์ของเราจะปรับขนาดอัตโนมัติเพื่อตอบสนองความต้องการในการคำนวณของคุณ การเดินทางบนคลาวด์ไม่เคยง่ายขนาดนี้มาก่อน!
คุณเคยลองCloudStatมาก่อนหรือไม่ แตกต่างจากระบบคลาวด์อื่น CloudStat มีความหมายสำหรับผู้ใช้ภาษา R เท่านั้น ไม่มีการตั้งค่าเพิ่มเติม คุณสามารถเข้าสู่ระบบและใช้ RAM สูงถึง 7.5 Gb ได้ฟรี
อย่างไรก็ตามด้วยบัญชีฟรีการวิเคราะห์ของคุณจะถูกดูและใช้งานโดยสาธารณะ ตัวเลือกคือจ่าย $ 5 ต่อเดือนเพื่อให้การวิเคราะห์ของคุณเป็นส่วนตัว
แพลตฟอร์มคลาวด์คอมพิวติ้งหนึ่งที่ฉันสามารถแนะนำได้คือBackboneซึ่งมอบประสิทธิภาพการทำงานที่ปลอดภัยซึ่งเสริมสร้างแพลตฟอร์มคลาวด์คอมพิวติ้ง