เราพร้อมที่จะทำการอัปเกรดจำนวนมากบนเซิร์ฟเวอร์ SQL ของเราและกำลังสังเกตเห็นพฤติกรรมที่ผิดปกติบางอย่างกับกลุ่มความพร้อมใช้งานแบบกระจายที่ฉันพยายามแก้ไขก่อนที่จะดำเนินการต่อ
เดือนที่แล้วฉันอัปเกรดเซิร์ฟเวอร์รองระยะไกลจาก SQL Server 2016 เป็น SQL Server 2017 เซิร์ฟเวอร์นี้เป็นส่วนหนึ่งของกลุ่มความพร้อมใช้งานแบบกระจาย (DAG)และกลุ่มความพร้อมใช้งานแยกต่างหาก(AG)หลายกลุ่ม เมื่อเราอัปเกรดเซิร์ฟเวอร์นี้เราไม่ทราบว่าจะเข้าสู่สถานะที่อ่านไม่ได้ดังนั้นในช่วงเดือนที่ผ่านมาเราได้พึ่งพาเซิร์ฟเวอร์หลักเพียงอย่างเดียว
เป็นส่วนหนึ่งของการอัปเกรดที่จะเกิดขึ้นฉันใช้CU 4 patch กับเซิร์ฟเวอร์และทำการบูทใหม่ เมื่อเซิร์ฟเวอร์กลับมาออนไลน์อีกครั้งรองที่เพิ่งได้รับการปรับปรุงแสดงให้เห็นว่า DAGs / AG ทั้งหมดซิงค์กันโดยไม่มีปัญหาใด ๆ
อย่างไรก็ตามตัวละครหลักกำลังแสดงเรื่องราวที่แตกต่างกันมาก มีรายงานว่า
- AG แยกต่างหากกำลังซิงค์โดยไม่มีปัญหาใด ๆ
- แต่ DABs ความได้ในไม่ Synchronzing / ไม่ดีต่อสุขภาพของรัฐ
หลังจากตื่นตระหนกในตอนแรกฉันพยายามทำสิ่งต่าง ๆ ต่อไปนี้เพื่อให้สิ่งต่าง ๆ ซิงโครไนซ์อีกครั้งใน DAG:
- จากหลักฉันหยุดและกลับมาเคลื่อนไหวข้อมูลต่อ สิ่งนี้ไม่ได้เริ่มซิงค์ข้อมูล
- ในครั้งที่สอง (อันที่ฉันเพิ่งแก้ไข) ฉันรัน
ALTER DATABASE [<database] SET HADR RESUME;
- ซึ่งรันโดยไม่มีข้อผิดพลาด แต่ไม่ได้ซิงค์ต่อ
ความพยายามครั้งล่าสุดของฉันในการซิงค์ข้อมูลอีกครั้งคือการเข้าสู่ระบบรองและเริ่มบริการ SQL Server ด้วยตนเอง การรีสตาร์ทบริการด้วยตนเองดูเหมือนจะสุดขีดเพราะฉันคาดว่าเซิร์ฟเวอร์ที่รีบูตจะเพียงพอแล้ว
มีใครพบปัญหานี้หรือไม่ที่ DAG ไม่เริ่มซิงค์กับอุปกรณ์รองหลังจากรีบูตหรือไม่ ถ้าเป็นเช่นนั้นจะแก้ไขได้อย่างไร?
ฉันตรวจสอบทั้งบันทึกข้อผิดพลาดของ SQL Server และตัวแสดงเหตุการณ์บนเซิร์ฟเวอร์รองไม่มีอะไรผิดปกติที่ฉันเห็น