ฟัง IOCP ที่ไม่ให้ผล


11

ไม่มีใครรู้ว่าสิ่งที่ "ฟัง IOCP ฟังไม่" หมายถึงอะไร?

บนเซิร์ฟเวอร์ SQL ของเราเพิ่งมีการตรวจสอบจุดบกพร่อง:

=====================================================================                                            
       BugCheck Dump                                                                                             
=====================================================================                                            

This file is generated by Microsoft SQL Server                                                                   
version 9.00.5292.00                                                                                             
upon detection of fatal unexpected error. Please return this file,                                               
the query or program that produced the bugcheck, the database and                                                
the error log, and any other pertinent information with a Service Request.                                       


Computer type is AT/AT COMPATIBLE.                                                                               
Bios Version is DELL   - 1                                                                                       
Phoenix ROM BIOS PLUS Version 1.10 1.5.2                                                                         
Current time is 23:01:04 09/07/12.                                                                               
48 Unknown CPU 9., 2 Mhz processor (s).                                                                          
Windows NT 6.1 Build 7601 CSD Service Pack 1.                                                                    

Memory                               
MemoryLoad = 81%                     
Total Physical = 524278 MB           
Available Physical = 97549 MB        
Total Page File = 524276 MB          
Available Page File = 94472 MB       
Total Virtual = 8388607 MB           
Available Virtual = 7846765 MB       
**Dump thread - spid = 0, PSS = 0x0000000000000000, EC = 0x0000000000000000                                      
***Stack Dump being sent to C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\LOG\SQLDump0008.txt              
* *******************************************************************************                                
*                                                                                                                
* BEGIN STACK DUMP:                                                                                              
*   09/07/12 23:01:04 spid 0                                                                                     
*                                                                                                                
* Non-yielding IOCP Listener                                                                                     
*                                                                                                                
* *******************************************************************************             </pre>                   


SQLDump0008.log contains:

<pre>
 No user action is required.
2012-09-07 18:30:11.28 spid782     Recovery of any in-doubt distributed transactions involving Microsoft Distributed Transaction Coordinator (MS DTC) has completed. This is an informational message only. No user action is required.
2012-09-07 20:58:54.53 spid196     The alert for 'average delay' has been raised. The current value of '509' surpasses the threshold '100'.
2012-09-07 20:59:24.74 spid477     The alert for 'average delay' has been raised. The current value of '299' surpasses the threshold '100'.
2012-09-07 21:44:06.53 spid23s     Database mirroring is inactive for database 'ToDoLists'. This is an informational message only. No user action is required.
2012-09-07 21:44:06.59 spid456     The alert for 'average delay' has been raised. The current value of '518' surpasses the threshold '100'.
2012-09-07 21:44:57.98 spid425     Error: 18056, Severity: 20, State: 27.
2012-09-07 21:44:57.98 spid425     The client was unable to reuse a session with SPID 425, which had been reset for connection pooling. This error may have been caused by an earlier operation failing. Check the error logs for failed operations immediately before this error message.
2012-09-07 21:44:57.98 spid808     Error: 18056, Severity: 20, State: 27.
2012-09-07 21:44:57.98 spid808     The client was unable to reuse a session with SPID 808, which had been reset for connection pooling. This error may have been caused by an earlier operation failing. Check the error logs for failed operations immediately before this error message.
2012-09-07 21:44:58.01 spid155     Error: 18056, Severity: 20, State: 27.
2012-09-07 21:44:58.01 spid155     The client was unable to reuse a session with SPID 155, which had been reset for connection pooling. This error may have been caused by an earlier operation failing. Check the error logs for failed operations immediately before this error message.
2012-09-07 21:44:58.03 spid486     Task (Worker 0x00000001B93B21C0) was forced to yield 2 times: 
2012-09-07 21:44:58.04 spid65s     Database mirroring is inactive for database 'Tracking'. This is an informational message only. No user action is required.
2012-09-07 21:44:58.06 spid486     Task (Worker 0x0000000CB9B341C0) was forced to yield 8 times: 
2012-09-07 21:44:58.09 spid486     Task (Worker 0x0000000655A9E1C0) was forced to yield 3 times: 
2012-09-07 21:44:58.10 spid486     Task (Worker 0x00000006C03BE1C0) was forced to yield 8 times: 
2012-09-07 21:44:58.11 spid65s     Error: 1404, Severity: 16, State: 6.
2012-09-07 21:44:58.11 spid65s     The command failed because the database mirror is busy. Reissue the command later.
2012-09-07 21:44:58.11 spid486     Task (Worker 0x0000000C819D01C0) was forced to yield 2 times: 
2012-09-07 21:44:58.49 spid140     The alert for 'average delay' has been raised. The current value of '191' surpasses the threshold '100'.
2012-09-07 21:45:00.66 spid46s     SQL Server has encountered 6 occurrence(s) of cachestore flush for the 'Object Plans' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 21:45:17.25 spid83s     SQL Server has encountered 6 occurrence(s) of cachestore flush for the 'SQL Plans' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 21:45:17.25 spid54s     SQL Server has encountered 6 occurrence(s) of cachestore flush for the 'Bound Trees' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 21:45:17.28 spid45s     The mirrored database "Tracking" is changing roles from "PRINCIPAL" to "MIRROR" due to Role Syncronization.
2012-09-07 21:45:17.61 spid46s     Bypassing recovery for database 'Tracking' because it is marked as a mirror database, which cannot be recovered. This is an informational message only. No user action is required.
2012-09-07 21:45:29.21 spid45s     Database mirroring is active with database 'Tracking' as the mirror copy. This is an informational message only. No user action is required.
2012-09-07 21:50:56.94 spid196s    SQL Server has encountered 5 occurrence(s) of cachestore flush for the 'Object Plans' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 21:50:57.14 spid196s    SQL Server has encountered 5 occurrence(s) of cachestore flush for the 'SQL Plans' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 21:50:57.14 spid196s    SQL Server has encountered 5 occurrence(s) of cachestore flush for the 'Bound Trees' cachestore (part of plan cache) due to some database maintenance or reconfigure operations.
2012-09-07 23:00:09.42 spid438     Error: 18056, Severity: 20, State: 27.
2012-09-07 23:00:09.42 spid438     The client was unable to reuse a session with SPID 438, which had been reset for connection pooling. This error may have been caused by an earlier operation failing. Check the error logs for failed operations immediately before this error message.
2012-09-07 23:01:04.26 Server      Using 'dbghelp.dll' version '4.0.5'
2012-09-07 23:01:04.29 Server      **Dump thread - spid = 0, PSS = 0x0000000000000000, EC = 0x0000000000000000
2012-09-07 23:01:04.29 Server      ***Stack Dump being sent to C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\LOG\SQLDump0008.txt
2012-09-07 23:01:04.29 Server      * *******************************************************************************
2012-09-07 23:01:04.29 Server      *
2012-09-07 23:01:04.29 Server      * BEGIN STACK DUMP:
2012-09-07 23:01:04.29 Server      *   09/07/12 23:01:04 spid 0
2012-09-07 23:01:04.29 Server      *
2012-09-07 23:01:04.29 Server      * Non-yielding IOCP Listener
2012-09-07 23:01:04.29 Server      *
2012-09-07 23:01:04.29 Server      * *******************************************************************************
2012-09-07 23:01:04.29 Server      * -------------------------------------------------------------------------------
2012-09-07 23:01:04.29 Server      * Short Stack Dump
2012-09-07 23:01:04.33 spid73      The alert for 'average delay' has been raised. The current value of '304' surpasses the threshold '100'.
2012-09-07 23:01:04.34 Server      Stack Signature for the dump is 0x00000000000002E8

ข้อความแจ้งเตือนสำหรับ 'ความล่าช้าเฉลี่ย' เกี่ยวข้องกับการทำมิเรอร์ฐานข้อมูลและเป็นการแจ้งเตือนที่เพิ่มขึ้นเมื่อเวลาที่ใช้ในการส่งข้อมูลไปเกินเวลาที่กำหนด is_event_loggedคอลัมน์เป็น 0 สำหรับ 'ล่าช้าเฉลี่ยการแจ้งเตือน

คุณสามารถเห็นผลลัพธ์จากsys.configurationsที่สิ่งที่ทำให้เซสชันการมิเรอร์หมดเวลาแล้วเกิดความล้มเหลวได้ .

คำตอบ:


9

IOCP เป็นพอร์ต I / O ที่สมบูรณ์ ผู้ฟัง IOCP ที่ไม่ให้ผลตอบแทนหมายความว่าเธรดที่จัดการกับรูทีนการทำให้เสร็จสมบูรณ์ของ IO ใช้เวลา looooong (ค่อนข้าง) ในการทำบางสิ่งบางอย่างและ SQLOS ถึงแม้ว่ามันอาจจะติด / แขวน / อะไรก็ตาม

เซิร์ฟเวอร์ Sql ทำ ASYNC IO มากมาย วิธีการทำงานคือเมื่อมันส่งคำขอ IO ไปยังระบบปฏิบัติการมันบอกว่า "ทำ IO นี้แบบอะซิงโครนัสนี่คือตัวชี้ฟังก์ชั่นที่จะเรียกเมื่อทำเสร็จแล้ว"

ฟังก์ชั่นที่ได้รับการเรียกเป็นฟังฟังความสมบูรณ์ของ IO

พิจารณาการอ่านหน้าจากดิสก์ เธรดที่รันการเลือกจำเป็นต้องอ่านหน้าที่ไม่ได้อยู่ในหน่วยความจำ ใช้ PAGEIOLATCH ออก async IO ไปยัง windows เพื่ออ่านหน้าและเข้าสู่โหมดสลีป

เมื่อระบบปฏิบัติการเสร็จสิ้น IO ก็จะเรียกใช้ฟังก์ชั่น IOCP ซึ่งตั้งค่าสถานะ IO ว่า "เสร็จสิ้น" หลังจากนั้นไม่นานเธรด sql จะเสร็จสิ้นควอนตัม 4 มิลลิวินาทีและตรวจสอบ IO เพื่อจัดการ มันตั้งค่าสถานะตามที่ทำและส่งสัญญาณเธรดที่ออกให้ตื่น การเลือกเธรด SELECT ถูกกำหนดเวลาเผยแพร่ PAGEIOLATCH และอายุการใช้งานเป็นสิ่งที่ดี

ตอนนี้ปริมาณงานที่ IOCP จะแตกต่างกันไปขึ้นอยู่กับประเภทของ IO ที่เกี่ยวข้อง ฉันเชื่อว่าด้วย DB Mirroring จะทำงานได้มากกว่าที่คิดหากเพียงแค่อ่านหน้าลงในบัฟเฟอร์พูล

หากคุณเป็นโปรแกรมเมอร์ที่ทำงานกับเซิร์ฟเวอร์ sql และคุณต้องการเพิ่มประสิทธิภาพของรหัสมิเรอร์ DB คุณอาจถูกล่อลวงให้ทำงานเพิ่มเติมในเส้นทางโค้ดการทำมิเรอร์ IOCP เทียบกับเส้นทางของเธรดรหัสระบบ SQLOS

หรือบางที IOCP จำเป็นต้องคัดลอกข้อมูลลงในบัฟเฟอร์การมิร์เรอร์ที่มีขนาดคงที่และมันจะวนเป็นวงกลมจนกว่าจะเสร็จสิ้น

หรืออาจเกิดขึ้น <> และฟังก์ชั่น IOCP ดูเหมือนว่า "ติดอยู่"

ฉันจะไม่กังวลเกี่ยวกับสิ่งนี้หากมันเกิดขึ้นในช่วงที่ระบบล้มเหลวและมีกิจกรรมการบันทึกจำนวนมากเกิดขึ้น หากเกิดขึ้นอย่างสม่ำเสมอก็อาจต้องทำการตรวจสอบเพิ่มเติม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.