Re: คิดว่าวิธีการของคุณในการวัดความพร้อมใช้งานแล้วทำงานร่วมกับลูกค้าของคุณในการตั้งค่าเป้าหมายที่มีความหมาย
หากคุณใช้งานเว็บไซต์ขนาดใหญ่สถานะการออนไลน์ไม่เป็นประโยชน์เลย หากคุณลดการค้นหาเป็นเวลา 10 นาทีเมื่อลูกค้าของคุณต้องการพวกเขามากที่สุด (ปริมาณการใช้งานสูงสุด) อาจเป็นอันตรายต่อธุรกิจมากกว่าการหยุดทำงานเป็นเวลาหนึ่งชั่วโมงในเวลาตี 3 ของวันอาทิตย์
บางครั้ง บริษัท เว็บขนาดใหญ่วัดความพร้อมใช้งานหรือความน่าเชื่อถือโดยใช้เมตริกต่อไปนี้:
- เปอร์เซ็นต์ของการสืบค้นที่ตอบสำเร็จโดยไม่มีข้อผิดพลาดฝั่งเซิร์ฟเวอร์ (HTTP 500s)
- เปอร์เซ็นต์ของข้อความค้นหาที่ตอบด้านล่างเวลาตอบสนองเป้าหมายที่แน่นอน
- ข้อความค้นหาที่ลดลงควรนับรวมกับสถิติของคุณ (ดูด้านล่าง)
ไม่ควรวัดความพร้อมใช้งานด้วยโพรบตัวอย่างซึ่งเป็นสิ่งที่องค์กรภายนอกเช่น pingdom และ pingability สามารถรายงานได้ อย่าวางใจในสิ่งนั้นเพียงลำพัง หากคุณต้องการที่จะทำมันถูกต้องทุกคำเดียวควรนับ วัดความพร้อมใช้งานของคุณโดยดูจากความสำเร็จที่แท้จริงและรับรู้ของคุณ
วิธีที่มีประสิทธิภาพมากที่สุดคือการรวบรวมบันทึกหรือสถิติจากตัวโหลดบาลานซ์ของคุณและคำนวณความพร้อมใช้งานตามตัวชี้วัดด้านบน
เปอร์เซ็นต์ของข้อความค้นหาที่ลดลงควรนับรวมกับสถิติของคุณด้วย มันสามารถถูกนำมาใช้ในที่ฝากข้อมูลเดียวกันกับข้อผิดพลาดฝั่งเซิร์ฟเวอร์ หากมีปัญหากับเครือข่ายหรือโครงสร้างพื้นฐานอื่น ๆ เช่น DNS หรือโหลด balancers คุณสามารถใช้คณิตศาสตร์ที่เรียบง่ายที่จะประเมินว่าหลายคำสั่งที่คุณหายไป หากคุณคาดหวังการสืบค้น X สำหรับวันดังกล่าวในสัปดาห์นั้น แต่คุณได้รับ X-1000 คุณอาจลดการค้นหา 1,000 ครั้ง พล็อตปริมาณการใช้งานของคุณลงในแบบสอบถามต่อนาที (หรือวินาที) กราฟ หากช่องว่างปรากฏขึ้นแสดงว่าคุณทำแบบสอบถามหาย ใช้รูปทรงเรขาคณิตพื้นฐานเพื่อวัดพื้นที่ของช่องว่างเหล่านั้นซึ่งจะให้จำนวนการสืบค้นที่ลดลงทั้งหมด
อภิปรายวิธีการนี้กับลูกค้าของคุณและอธิบายถึงประโยชน์ของมัน ตั้งค่าพื้นฐานโดยการวัดความพร้อมใช้งานในปัจจุบัน จะกลายเป็นที่ชัดเจนสำหรับพวกเขาว่า 100% เป็นเป้าหมายที่เป็นไปไม่ได้
จากนั้นคุณสามารถเซ็นสัญญาตามการปรับปรุงพื้นฐาน สมมติว่าหากพวกเขาประสบความพร้อมใช้งาน 95% คุณสามารถสัญญาว่าจะปรับปรุงสถานการณ์สิบเท่าด้วยการไปถึง 98.5%
หมายเหตุ: มีข้อเสียสำหรับวิธีการวัดความพร้อมใช้งานนี้ ก่อนอื่นให้รวบรวมบันทึกประมวลผลและสร้างรายงานด้วยตัวคุณเองอาจไม่น่าสนใจเว้นแต่คุณจะใช้เครื่องมือที่มีอยู่แล้วทำ ประการที่สองข้อบกพร่องของแอปพลิเคชันอาจส่งผลต่อความพร้อมใช้งานของคุณ หากแอปพลิเคชันมีคุณภาพต่ำแอปจะแสดงข้อผิดพลาดเพิ่มเติม วิธีแก้ไขปัญหานี้คือพิจารณาเฉพาะ 500s ที่สร้างขึ้นโดย load-balancer แทนการมาจากแอ็พพลิเคชัน
สิ่งที่อาจจะได้รับบิตซับซ้อนด้วยวิธีนี้ แต่มันเป็นหนึ่งในขั้นตอนที่เกินวัดเพียงคุณuptime เซิร์ฟเวอร์