ดูเหมือนว่าระเบียน A หลายรายการที่ชี้ไปยังโดเมนเดียวกันนั้นเกือบจะถูกนำไปใช้เพื่อนำ DNS Round Robin มาใช้เป็นเทคนิคการปรับสมดุลภาระราคาถูก
คำเตือนปกติสำหรับ DNS RR คือมันไม่ดีสำหรับความพร้อมใช้งานสูง เมื่อ 1 IP ล่มลูกค้าจะยังคงใช้งานต่อไปอีกหลายนาที
โหลดบาลานเซอร์มักแนะนำให้เป็นตัวเลือกที่ดีกว่า
การอ้างสิทธิ์ทั้งสองนั้นไม่เป็นความจริงโดยสมบูรณ์:
เมื่อปริมาณการใช้งานเป็น HTTP เบราว์เซอร์ HTML ส่วนใหญ่จะสามารถลองระเบียน A ถัดไปโดยอัตโนมัติหากรายการก่อนหน้าไม่ทำงานโดยไม่ต้องค้นหา DNS ใหม่ อ่านที่นี่บทที่ 3.1และที่นี่
เมื่อศูนย์ข้อมูลหลายแห่งมีส่วนเกี่ยวข้อง DNS RR เป็นตัวเลือกเดียวในการกระจายปริมาณการใช้งานทั่วทั้งศูนย์
ดังนั้นจริงหรือที่ศูนย์ข้อมูลหลายแห่งและทราฟฟิก HTTP การใช้ DNS RR เป็นวิธีเดียวที่จะรับประกันความล้มเหลวได้ทันทีเมื่อศูนย์ข้อมูลแห่งใดแห่งหนึ่งล่ม
ขอบคุณ
วาเลนติโน่
แก้ไข:
- นอกหลักสูตรแต่ละศูนย์ข้อมูลจะมี Load Balancer ในพื้นที่พร้อมด้วย hot spare
- มันตกลงที่จะเสียสละความสัมพันธ์เซสชันสำหรับความล้มเหลวทันที
- AFAIK วิธีเดียวที่ DNS จะแนะนำศูนย์ข้อมูลแทนอีกวิธีหนึ่งคือการตอบกลับด้วยเฉพาะ IP (หรือ IP) ที่เชื่อมโยงกับศูนย์ข้อมูลนั้น หากศูนย์ข้อมูลไม่สามารถเข้าถึงได้ IP เหล่านั้นทั้งหมดจะไม่สามารถเข้าถึงได้ ซึ่งหมายความว่าแม้ว่าเบราว์เซอร์ HTML สมาร์ทสามารถลองบันทึก A อื่นได้ทันทีความพยายามทั้งหมดจะล้มเหลวจนกว่ารายการแคชในเครื่องจะหมดอายุและการค้นหา DNS ใหม่เสร็จสิ้นการดึงข้อมูล IP ที่ใช้งานได้ใหม่ (ฉันถือว่า DNS แนะนำให้ ศูนย์ข้อมูลใหม่เมื่อล้มเหลว) ดังนั้น "สมาร์ท DNS" จึงไม่สามารถรับประกันความล้มเหลวได้ทันที
- ในทางกลับกัน DNS round-robin อนุญาตให้ทำได้ เมื่อศูนย์ข้อมูลหนึ่งล้มเหลวเบราว์เซอร์ HTML อัจฉริยะ (ส่วนใหญ่) จะลองบันทึก A ที่เก็บไว้ในแคชใหม่ทันทีที่กระโดดไปยังศูนย์ข้อมูลอื่น (ที่ใช้งานได้) ดังนั้น DNS round-robin ไม่รับรองความสัมพันธ์ของเซสชันหรือ RTT ที่ต่ำที่สุด แต่ดูเหมือนจะเป็นวิธีเดียวที่จะรับประกันความล้มเหลวได้ทันทีเมื่อไคลเอนต์เป็นเบราว์เซอร์ HTML ที่ "ฉลาด"
แก้ไข 2:
- บางคนแนะนำ TCP Anycast เป็นวิธีการแก้ปัญหาที่ชัดเจน ในบทความนี้ (บทที่ 6) อธิบายว่า Anycast fail-over เกี่ยวข้องกับการบรรจบกันของ BGP ด้วยเหตุนี้ Anycast จึงสามารถใช้เวลาตั้งแต่ 15 นาทีถึง 20 วินาทีเพื่อให้เสร็จสมบูรณ์ เป็นไปได้ 20 วินาทีบนเครือข่ายที่ทอพอโลยีถูกปรับให้เหมาะสมสำหรับสิ่งนี้ อาจเป็นเพียงผู้ให้บริการ CDN เท่านั้นที่สามารถให้สิทธิ์การดูแลระบบที่ล้มเหลวได้อย่างรวดเร็ว
แก้ไข 3: *
- ฉันค้นหา DNS และ traceroutes (บางทีผู้เชี่ยวชาญบางคนสามารถตรวจสอบอีกครั้ง) และ:
- CDN เดียวที่ใช้ TCP Anycast ดูเหมือนว่าจะเป็น CacheFly ตัวดำเนินการอื่นเช่นเครือข่าย CDN และ BitGravity ใช้ CacheFly ดูเหมือนว่าขอบของพวกเขาไม่สามารถใช้เป็นพร็อกซีย้อนกลับ ดังนั้นจึงไม่สามารถใช้เพื่อมอบการเฟลโอเวอร์ทันที
- Akamai และ LimeLight ดูเหมือนว่าจะใช้ DNS ที่รับรู้ทางภูมิศาสตร์ แต่! พวกเขากลับมาหลายระเบียน A จาก traceroutes ดูเหมือนว่า IP ที่ส่งคืนอยู่ในศูนย์ข้อมูลเดียวกัน ดังนั้นฉันจึงสับสนกับวิธีที่พวกเขาสามารถเสนอ SLA ได้ 100% เมื่อศูนย์ข้อมูลแห่งหนึ่งล่ม