ดัชนีค้นหาต้นทุนผู้ประกอบการ


9

สำหรับแบบสอบถามฐานข้อมูลตัวอย่างAdventureWorksด้านล่าง:

SELECT 
    P.ProductID, 
    CA.TransactionID
FROM Production.Product AS P
CROSS APPLY
(
    SELECT TOP (1)
        TH.TransactionID
    FROM Production.TransactionHistory AS TH
    WHERE
        TH.ProductID = P.ProductID
    ORDER BY 
        TH.TransactionID DESC
) AS CA;

แผนการดำเนินการแสดงค่าใช้จ่ายของผู้ให้บริการโดยประมาณ0.0850383 (93%) สำหรับดัชนีค้นหา :

วางแผน

ค่าใช้จ่ายนั้นไม่ขึ้นอยู่กับรูปแบบการประมาณเชิงการใช้งาน

ไม่ได้เป็นการเพิ่มต้นทุน CPU โดยประมาณและค่าใช้จ่ายI / O โดยประมาณอย่างง่าย ทั้งที่มันเป็นค่าใช้จ่ายสำหรับหนึ่งในการดำเนินการของดัชนีแสวงหาคูณด้วยจำนวนโดยประมาณของการประหารชีวิต

หมายเลขค่าใช้จ่ายนี้มาถึงอย่างไร

คำตอบ:


10

ตรรกะการได้มาซึ่งต้นทุนแบบเต็มนั้นซับซ้อน แต่สำหรับกรณีที่ค่อนข้างง่ายในคำถาม:

ปัจจัยการผลิต

  1. จำนวนครั้งที่ผู้ปฏิบัติการดำเนินการ
    นี่คือจำนวนการดำเนินการโดยประมาณ : 504

  2. cardinality (จำนวนแถว) ในดัชนีTableCardinalityทรัพย์สินของดัชนีแสวงหาผู้ประกอบการให้นี้: 113443

  3. จำนวนหน้าข้อมูลในดัชนี: 201
    จำนวนนี้สามารถรับได้หลายวิธีตัวอย่างเช่นจากsys.allocation_units:

    SELECT 
        AU.data_pages
    FROM sys.allocation_units AS AU
    JOIN sys.partitions AS P
        ON P.hobt_id = AU.container_id
    WHERE
        AU.[type_desc] = N'IN_ROW_DATA'
        AND P.[object_id] = OBJECT_ID(N'Production.TransactionHistory', N'U')
        AND P.index_id = 
            INDEXPROPERTY(P.[object_id], N'IX_TransactionHistory_ProductID', 'IndexID');
  4. ความหนาแน่น (1 / ค่าที่แตกต่าง ) ของดัชนี: 0.002267574
    ซึ่งมีอยู่ในเวกเตอร์ความหนาแน่นของสถิติดัชนี:

    DBCC SHOW_STATISTICS 
    (
        N'Production.TransactionHistory', 
        N'IX_TransactionHistory_ProductID'
    ) 
    WITH DENSITY_VECTOR;

    ความหนาแน่น

การคำนวณ

-- Input numbers
DECLARE
    @Executions float = 504,
    @Density float = 0.002267574,
    @IndexDataPages float = 201,
    @Cardinality float = 113443;

-- SQL Server cost model constants
DECLARE
    @SeqIO float = 0.000740740740741,
    @RandomIO float = 0.003125,
    @CPUbase float = 0.000157,
    @CPUrow float = 0.0000011;

-- Computation
DECLARE
    @IndexPages float = CEILING(@IndexDataPages * @Density),
    @Rows float = @Cardinality * @Density,
    @Rebinds float = @Executions - 1e0;

DECLARE
    @CPU float = @CPUbase + (@Rows * @CPUrow),
    @IO float = @RandomIO + (@SeqIO * (@IndexPages - 1e0)),
    -- sample with replacement
    @PSWR float = @IndexDataPages * (1e0 - POWER(1e0 - (1e0 / @IndexDataPages), @Rebinds));

-- Cost components (no rewinds)
DECLARE
    @InitialCost float = @RandomIO + @CPUbase + @CPUrow,
    @RebindCPU float = @Rebinds * (1e0 * @CPUbase + @CPUrow),
    @RebindIO float = (1e0 / @Rows) * ((@PSWR - 1e0) * @IO);

-- Result
SELECT 
    OpCost = @InitialCost + @RebindCPU + @RebindIO;

DB <> ซอ

ผลลัพธ์


เยี่ยมมากมันเป็นเรื่องดีที่ได้ทราบว่าค่าใช้จ่ายโดยประมาณนั้นมาจากไหนตัวแปรใดบ้างที่ส่งผลกระทบต่อมันและสัดส่วนใด นี่เป็นกลไกสำหรับ SQL Server ทุกรุ่นหรือไม่ อาจมีการเปลี่ยนแปลงเล็กน้อยในค่าคงที่?
EzLo

2
แง่มุมของการคิดต้นทุนนี้ไม่ได้เปลี่ยนไปตั้งแต่ปี 2005 เท่าที่ฉันทราบ
พอลไวท์ 9
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.