แพลตฟอร์มการประมวลผลแบบคลาวด์สำหรับการเรียนรู้ของเครื่อง [ปิด]


36

ฉันมีรายชื่อ บริษัท เล็ก ๆ ที่ให้บริการแพลตฟอร์มสำหรับการรันสคริปต์ R, python หรืออ็อกเทฟบนคลัสเตอร์ที่สร้างขึ้นบน amazon EC2 มีชื่ออื่นที่ฉันควรเพิ่มหรือไม่

  1. Cloudnumbers
  2. Opani
  3. crdata


คุณสามารถค้นหาตัวเลือกเพิ่มเติมในโพสต์บล็อกนี้: blog.uruit.com/getting-started-with-machine-learning-2
Regiane Folter

คำตอบ:


15

ฉันไม่ได้ใช้ บริษัท เหล่านี้ แต่นี่เป็นเพียงตัวเลือกบางส่วน อย่างไรก็ตามการตั้งค่าบน EC2 นั้นง่ายมาก อย่างน้อยหลังจากที่คุณมึนงงศีรษะของคุณโดยการต่อสู้กับผนังอย่างหนักและเพียงพอ นอกจากนี้ยังเพิ่มเกณฑ์ความเจ็บปวดของคุณ เด็ก ๆ วันนี้มีมันง่ายขึ้นมาก เมื่อฉันเริ่มต้นเรากำลังทำการคำนวณแบบหมอก: เราไม่ได้เป็นหมอกที่ดีที่สุดในสิ่งที่เรากำลังคำนวณ

รำลึกถึง ... เครื่องมือและทรัพยากรมีอยู่เพื่อข้ามผู้ขายเหล่านี้และเริ่มต้นด้วยตัวคุณเอง JD Long มีด้วยsegueทำให้ง่ายต่อการเริ่มใช้ R บน EMR

เกี่ยวกับ Python botoเป็นชุดโปรแกรมที่ช่วยให้สามารถใช้งาน Python ได้อย่างง่ายดายบน EC2 นอกจากนี้ยังเป็นเรื่องง่ายที่จะทำให้ Python ทำงานบนAppEngine ของ Googleหากคุณต้องการพิจารณาทางเลือก EC2 ถ้าคุณรู้จัก Python คุณไม่จำเป็นต้องจ้าง บริษัท เพื่อทำการยกให้คุณเว้นแต่คุณจะไม่คุ้นเคยกับการปรับขนาดการจัดเรียงการปรับสมดุลภาระการโหลด ฯลฯ ในระดับความคิด ในทางกลับกันหากคุณพิจารณาการใช้จ่ายเงินจำนวนมากในบริการดังกล่าวเป็นความคิดที่ดีที่จะทำความคุ้นเคยกับวิธีทำให้โค้ดของคุณมีประสิทธิภาพ

สำหรับ Octave บนคลาวด์ฉันไม่รู้ว่ามีอะไรอยู่นอกเหนือจากสาม บริษัท นี้ Monkey Analytics เคยเสนอให้ แต่ดูเหมือนว่าพวกเขาจะหายไป ฉันจะแนะนำให้หลีกเลี่ยง Octave และให้ความสำคัญกับ Python หรือ R

ทรัพยากรสำหรับการทำมันง่ายที่จะได้รับการตั้งขึ้นเป็นStarCluster อีกครั้งไม่มีประสบการณ์กับพวกเขา แต่นั่นอาจเป็นเส้นทางที่เป็นประโยชน์

ในความซื่อสัตย์ทุกอย่าง Ubuntu (หรือ Windows) และ EC2 นั้นไม่ยากที่จะเรียนรู้ ฉันจะไม่แนะนำ Windows สำหรับ R เนื่องจากไม่มีความรักในหมู่นักพัฒนา R และ Windows (หมายเหตุ: เท่าที่ฉันสามารถบอกได้ว่าไม่มีบริการคลาวด์ Mac OS X ที่ร้ายแรง) เมื่อคุณมีเดสก์ท็อประยะไกลคุณก็อยู่ในธุรกิจ เรียนรู้วิธีการปรับสเกลเป็นขั้นตอนต่อไป


อัปเดต 1: บริการการจัดการระบบคลาวด์อื่น ๆ ที่กว้างกว่า ได้แก่ RighstScale และ Scalr

อัปเดต 2: ฉันต้องการเน้นว่าการเรียนรู้เพื่อตั้งค่าอินสแตนซ์และกลุ่มของคุณในคลาวด์สำหรับตัวคุณเองเป็นสิ่งสำคัญ ท่ามกลางประโยชน์ของการทำงานบนมือ:

  • เรียนรู้วิธีการจัดการทรัพยากรแบบผสมผสาน (อินสแตนซ์หลายตัว, อินสแตนซ์หลายประเภท, HDs จำนวนมาก, โซนความพร้อมใช้งานหรือภูมิภาคที่แตกต่างกัน, เครื่องมือตรวจสอบที่หลากหลายและอื่น ๆ )
  • คนจรจัดที่มี GPU หากคุณต้องการ (ตรวจสอบgputools)
  • คุณสามารถอัพเดตหรือย้อนกลับแพ็คเกจที่คุณเลือกได้ง่ายขึ้น
  • คุณอาจได้รับค่าใช้จ่ายที่ต่ำกว่ามากโดยใช้อินสแตนซ์แบบจุดหรืออินสแตนซ์ที่จองไว้
  • คุณสามารถลอง R GUIs หรือ IDE ที่แตกต่างกันซึ่งอาจไม่ใช่ตัวเลือกสำหรับผู้ขายคลาวด์

มีประโยชน์ในการใช้ผู้ให้บริการที่มีการจัดการเช่นเส้นโค้งการเรียนรู้ที่สั้นกว่าอาจสนับสนุนการแบ่งปันทรัพยากรระหว่างกลุ่มได้ดีขึ้นและอาจจะเป็น Gizmos ที่ดี แต่ฉันไม่สามารถพูดถึงประโยชน์ที่ได้เมื่อเริ่มใช้ EC2 ก่อนสิ่งเหล่านี้ มาสู่ตลาด


5

นอกจากนี้ยังมีPiCloudสำหรับการเรียกใช้โค้ด Python แบบขนานบน EC2

จากหน้าผลิตภัณฑ์ของพวกเขา:

PiCloud เป็นแพลตฟอร์มการประมวลผลแบบคลาวด์ที่รวมเข้ากับภาษา Python Programming Language ช่วยให้คุณสามารถใช้ประโยชน์จากพลังการคำนวณของ Amazon Web Services โดยไม่ต้องจัดการดูแลรักษาหรือกำหนดค่าเซิร์ฟเวอร์เสมือน

PiCloud รวมเข้ากับฐานรหัสที่มีอยู่ของคุณอย่างราบรื่นผ่านทางห้องสมุด Python, คลาวด์ ในการลดการเรียกใช้ฟังก์ชั่นไปยังเซิร์ฟเวอร์ของเราสิ่งที่คุณต้องทำคือส่งผ่านฟังก์ชั่นที่คุณต้องการลงในห้องสมุดเมฆ PiCloud จะเรียกใช้ฟังก์ชันในคลัสเตอร์ที่มีประสิทธิภาพสูง ในขณะที่คุณใช้งานฟังก์ชั่นได้มากขึ้นคลัสเตอร์ของเราจะปรับขนาดอัตโนมัติเพื่อตอบสนองความต้องการในการคำนวณของคุณ การเดินทางบนคลาวด์ไม่เคยง่ายขนาดนี้มาก่อน!


ฉันค่อนข้างชอบ PiCloud - ฉันพบว่าพวกเขาง่ายต่อการเริ่มต้นและใช้งาน
Fomite

3

คุณเคยลองCloudStatมาก่อนหรือไม่ แตกต่างจากระบบคลาวด์อื่น CloudStat มีความหมายสำหรับผู้ใช้ภาษา R เท่านั้น ไม่มีการตั้งค่าเพิ่มเติม คุณสามารถเข้าสู่ระบบและใช้ RAM สูงถึง 7.5 Gb ได้ฟรี

อย่างไรก็ตามด้วยบัญชีฟรีการวิเคราะห์ของคุณจะถูกดูและใช้งานโดยสาธารณะ ตัวเลือกคือจ่าย $ 5 ต่อเดือนเพื่อให้การวิเคราะห์ของคุณเป็นส่วนตัว


0

แพลตฟอร์มคลาวด์คอมพิวติ้งหนึ่งที่ฉันสามารถแนะนำได้คือBackboneซึ่งมอบประสิทธิภาพการทำงานที่ปลอดภัยซึ่งเสริมสร้างแพลตฟอร์มคลาวด์คอมพิวติ้ง


พวกเขามีข้อเสนอเฉพาะสำหรับ R หรือไม่ ฉันไม่ได้มองหาผู้ให้บริการคลาวด์ทั่วไปฉันกำลังมองหาผู้ให้บริการเซิร์ฟเวอร์ R (ที่ดีกว่า RStudio) ที่กำหนดค่าไว้ล่วงหน้า
ซัค

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.