จากคนที่จัดการกับกลุ่มของตัวเอง (เช่นไม่ได้ใช้ / จ่ายเงินสำหรับ Amazon Autoscale, Rightscale, Scalr, ฯลฯ ) คุณจัดการกับอินสแตนซ์ของคุณบน EC2 และการจัดการความล้มเหลวได้อย่างไร (เช่น) ฉันสงสัยว่าคนส่วนใหญ่เพิ่งจบการเขียนสคริปต์ของตนเองที่โหลดกับ EC2 API อย่างที่ฉันสงสัย
นั่นเป็นวิธีการของเรา: ใช้ Python Boto ในการตรวจสอบ / เริ่มต้น daemon ใหม่ที่ทำงานนอกสถานที่และรับฟัง UDP Keep-alives จากอินสแตนซ์ของเรา เมื่อล้มเหลวเราถ่ายภาพจำนวนลงทะเบียนเริ่มต้นอินสแตนซ์ใหม่ลบโวลุ่มเก่าและอื่น ๆ
บ่อยครั้งที่เมื่อแฮ็คสคริปต์ของเราฉันคิดว่าจะต้องมีเครื่องมือโอเพนซอร์สบางอย่างที่จัดการกับปัญหาเหล่านี้แล้วและไม่มีข้อ จำกัด ของ (พูด) Scalr แต่ฉันกลับมาจาก Google เสมอ มือเปล่า (สิ่งต่าง ๆ เช่น Scalr นั้นค่อนข้าง จำกัด ในชุด / รุ่น / การกำหนดค่าของซอฟต์แวร์ที่สนับสนุนและมีวิธีที่ยุ่งยากและ IMO ในการจัดการการตั้งค่าเหล่านี้)
นอกจากนี้ระบบนิเวศ Linux-HA / Pacemaker (Heartbeat, ldirectord ฯลฯ ) เสียงเหมือนมันไม่เหมาะจริงๆสำหรับ EC2 (แต่ฉันก็พบสิ่งนี้ - แม้ว่าฉันไม่แน่ใจว่านี่เป็นทางออกที่มีคุณภาพสูงจริงๆ)