ฉันสังเกตเห็นพฤติกรรมแปลก ๆ ในคลัสเตอร์ HA แบบ 2 เซิร์ฟเวอร์และฉันหวังว่าจะมีคนยืนยันความสงสัยของฉันหรืออาจมีคำอธิบายอื่น ๆ ... นี่คือการตั้งค่าของฉัน:
- การติดตั้ง SQL 2012 SP1 แบบ 2 เซิร์ฟเวอร์
- SQL AlwaysOn HA เปิดใช้งานสำหรับฐานข้อมูลไม่กี่แห่ง
- ซีพียูคือ 2.4GHz, 4 คอร์
- RAM คือ 34 GB (เป็นอินสแตนซ์ AWS ดังนั้นจึงเป็นเลขคี่)
- การใช้ทรัพยากรค่อนข้างต่ำ - เซิร์ฟเวอร์แต่ละเครื่องมีหน่วยความจำไม่เกิน 14+ GB และ SQL ไม่ได้ต่อยอดกับจำนวนหน่วยความจำที่ใช้
- เวลาในการเข้าถึงดิสก์นั้นดี - ไม่ค่อยเกิน 15ms / อ่านหรือเขียน
- ฐานข้อมูลไม่ใหญ่ - 1 GB, 1.5 GB, 7.5 GB
- กระบวนการเซิร์ฟเวอร์ SQL ใช้ไบต์ส่วนตัว 16 GB, ชุดการทำงาน 15 GB
โดยรวมแล้วไม่มีการบันทึกปัญหาทรัพยากร ตอนนี้สำหรับส่วนที่แปลก SQL ไม่ได้ถูกรีสตาร์ท (กระบวนการทำงานเกือบ 6 เดือน) แต่ดูเหมือนว่าทุกๆ ~ 50 วันตัวนับอายุการใช้งาน Page Life Expectancy จะลดลงไปที่ (เกือบ) 0 จนถึงจุดนั้นมันปีนขึ้นอย่างต่อเนื่องไม่มีหยด นี่คือกราฟที่สมบูรณ์แบบ:
เมื่อฉันดูข้อมูลตัวนับ (ฉันไม่มีจำนวนที่แน่นอนเพียงแค่การรวมรายชั่วโมง) ดูเหมือนว่าค่าตัวนับ PLE สูงถึงประมาณ 4,295,000 วินาที (ประมาณ 50 วัน) ทุกครั้ง (อย่างน้อยทุกครั้งที่ฉันมีข้อมูล)
ทฤษฎีบ้าของฉันคือหมายเลข PLE ถูกจัดเป็นมิลลิวินาทีเหมือน int long long ที่ไม่ได้ลงชื่อ (ซึ่งมีขีด จำกัด 4,294,967,295) และเวลา 49.71 วันจะรีเซ็ตทั้งโดยการออกแบบหรือเนื่องจากข้อบกพร่อง สิ่งนี้จะอธิบายพฤติกรรมของเซิร์ฟเวอร์ทั้งสองและรูปแบบที่เหมือนกัน หรืออาจเป็นสิ่งที่แตกต่างอย่างสิ้นเชิงและฉันก็ไม่ได้รู้สึกอะไร :)
มีใครเห็นอะไรแบบนั้นหรืออธิบายพฤติกรรมนี้ได้บ้าง
ป.ล. ฉันเห็นโพสต์นี้แต่กรณีของฉันแตกต่างกันเล็กน้อย
PPS นี่คือการโพสต์ใหม่ - ฉันโพสต์ไว้ที่นี่แต่เดิมได้รับคำแนะนำว่าผู้ชมที่นี่เหมาะสมกว่า
ขอบคุณ!