วิธีการเขียนแบบสอบถามที่ค้นหาการอ้างอิงแบบวงกลมทั้งหมดเมื่อตารางอ้างอิงตัวเอง?


26

ฉันมีสคีมาต่อไปนี้ (เปลี่ยนชื่อ) ซึ่งฉันไม่สามารถเปลี่ยนแปลงได้:

CREATE TABLE MyTable (
    Id INT NOT NULL PRIMARY KEY,
    ParentId INT NOT NULL
);

ALTER TABLE MyTable ADD FOREIGN KEY (ParentId) REFERENCES MyTable(Id);

นั่นคือแต่ละระเบียนเป็นลูกของบันทึกอื่น หากเร็กคอร์ดของParentIdเท่ากับIdเร็กคอร์ดนั้นจะถือว่าเป็นโหนดรูท

ฉันต้องการเรียกใช้แบบสอบถามซึ่งจะค้นหาการอ้างอิงแบบวงกลมทั้งหมด ตัวอย่างเช่นกับข้อมูล

INSERT INTO MyTable (Id, ParentId) VALUES
    (0, 0),
    (1, 0),
    (2, 4),
    (3, 2),
    (4, 3);

แบบสอบถามควรกลับมา

Id | Cycle
2  | 2 < 4 < 3 < 2
3  | 3 < 2 < 4 < 3
4  | 4 < 3 < 2 < 4

ฉันเขียนแบบสอบถามต่อไปนี้สำหรับ SQL Server 2008 R2 และฉันสงสัยว่าแบบสอบถามนี้สามารถปรับปรุงได้หรือไม่:

IF OBJECT_ID(N'tempdb..#Results') IS NOT NULL DROP TABLE #Results;
CREATE TABLE #Results (Id INT, HasParentalCycle BIT, Cycle VARCHAR(MAX));

DECLARE @i INT,
    @j INT,
    @flag BIT,
    @isRoot BIT,
    @ids VARCHAR(MAX);

DECLARE MyCursor CURSOR FAST_FORWARD FOR
    SELECT Id
    FROM MyTable;

OPEN MyCursor;
FETCH NEXT FROM MyCursor INTO @i;
WHILE @@FETCH_STATUS = 0
BEGIN
    IF OBJECT_ID(N'tempdb..#Parents') IS NOT NULL DROP TABLE #Parents;
    CREATE TABLE #Parents (Id INT);

    SET @ids = NULL;
    SET @isRoot = 0;
    SET @flag = 0;
    SET @j = @i;
    INSERT INTO #Parents (Id) VALUES (@j);

    WHILE (1=1)
    BEGIN
        SELECT
            @j = ParentId,
            @isRoot = CASE WHEN ParentId = Id THEN 1 ELSE 0 END
        FROM MyTable
        WHERE Id = @j;

        IF (@isRoot = 1)
        BEGIN
            SET @flag = 0;
            BREAK;
        END        

        IF EXISTS (SELECT 1 FROM #Parents WHERE Id = @j)
        BEGIN
            INSERT INTO #Parents (Id) VALUES (@j);
            SET @flag = 1;
            SELECT @ids = COALESCE(@ids + ' < ', '') + CAST(Id AS VARCHAR) FROM #Parents;
            BREAK;
        END
        ELSE
        BEGIN
            INSERT INTO #Parents (Id) VALUES (@j);
        END        
    END

    INSERT INTO #Results (Id, HasParentalCycle, Cycle) VALUES (@i, @flag, @ids);

    FETCH NEXT FROM MyCursor INTO @i;
END
CLOSE MyCursor;
DEALLOCATE MyCursor;

SELECT Id, Cycle
FROM #Results
WHERE HasParentalCycle = 1;

0 > 0ไม่ควรได้รับการพิจารณารอบ?
ypercubeᵀᴹ

1
ไม่ 0 เป็นโหนดรูทเนื่องจากมันParentIdเท่ากับIdดังนั้นจึงไม่ใช่รอบสำหรับสถานการณ์นี้
cubetwo1729

คำตอบ:


30

สิ่งนี้เรียกใช้ CTE แบบเรียกซ้ำ:

WITH FindRoot AS
(
    SELECT Id,ParentId, CAST(Id AS NVARCHAR(MAX)) Path
    FROM dbo.MyTable

    UNION ALL

    SELECT C.Id, P.ParentId, C.Path + N' > ' + CAST(P.Id AS NVARCHAR(MAX))
    FROM dbo.MyTable P
    JOIN FindRoot C
    ON C.ParentId = P.Id AND P.ParentId <> P.Id AND C.ParentId <> C.Id
 )
SELECT *
FROM FindRoot R
WHERE R.Id = R.ParentId 
  AND R.ParentId <> 0;

ดูการทำงานที่นี่: SQL Fiddle


ปรับปรุง:

เพิ่มระยะทางเพื่อให้สามารถแยกวงจรของตัวเองได้ทั้งหมด (ดูความคิดเห็นของ ypercube):

WITH FindRoot AS
(
    SELECT Id,ParentId, CAST(Id AS NVARCHAR(MAX)) Path, 0 Distance
    FROM dbo.MyTable

    UNION ALL

    SELECT C.Id, P.ParentId, C.Path + N' > ' + CAST(P.Id AS NVARCHAR(MAX)), C.Distance + 1
    FROM dbo.MyTable P
    JOIN FindRoot C
    ON C.ParentId = P.Id AND P.ParentId <> P.Id AND C.ParentId <> C.Id
 )
SELECT *
FROM FindRoot R
WHERE R.Id = R.ParentId 
  AND R.ParentId <> 0
  AND R.Distance > 0;

ซอ Fiddle

คุณควรใช้อันไหนขึ้นอยู่กับความต้องการของคุณ


สิ่งนี้ควรได้รับการแก้ไข ขณะนี้ก็ยังแสดงให้เห็น 1 รอบเช่นตราบใดที่มันไม่ได้6 > 6 0 > 0
ypercubeᵀᴹ

ฉันเข้าใจ OP ว่ามีเพียงวงจรตัวเองของโหนดรูทจริงเท่านั้นที่จะถูกยกเว้น อย่างไรก็ตามคุณสามารถเพิ่มความต้องการนั้นได้อย่างง่ายดายโดยการตรวจสอบว่า R.Path เช่น '%>%' ในขั้นสุดท้ายตรงที่ข้อใด หรือคุณสามารถเพิ่มคอลัมน์จำนวนรอบความยาวภายใน CTE แบบเรียกซ้ำ
เซบาสเตียนมีน

2
คุณสามารถเพิ่มWHERE Id <> ParentIdในส่วนแรกของ CTE
ypercubeᵀᴹ

AND C.ParentId <> C.Idไม่พอ. มันนำไปสู่เส้นทางเป็นวงกลมอีกต่อไป ( A->B, B->C, C->B) Aคุณยังจะได้รับการเรียกซ้ำไม่มีที่สิ้นสุดสำหรับการสร้างเส้นทางเริ่มต้นใน คุณจะต้องตรวจสอบเส้นทางทั้งหมด
Bergi

2
SELECT RC.CONSTRAINT_NAME FK_Name
, KF.TABLE_SCHEMA FK_Schema
, KF.TABLE_NAME FK_Table
, KF.COLUMN_NAME FK_Column
, RC.UNIQUE_CONSTRAINT_NAME PK_Name
, KP.TABLE_SCHEMA PK_Schema
, KP.TABLE_NAME PK_Table
, KP.COLUMN_NAME PK_Column
, RC.MATCH_OPTION MatchOption
, RC.UPDATE_RULE UpdateRule
, RC.DELETE_RULE DeleteRule
FROM INFORMATION_SCHEMA.REFERENTIAL_CONSTRAINTS RC
JOIN INFORMATION_SCHEMA.KEY_COLUMN_USAGE KF ON RC.CONSTRAINT_NAME = KF.CONSTRAINT_NAME
JOIN INFORMATION_SCHEMA.KEY_COLUMN_USAGE KP ON RC.UNIQUE_CONSTRAINT_NAME = KP.CONSTRAINT_NAME
WHERE KF.TABLE_NAME = KP.TABLE_NAME

1
แล้วมันใช้งานอย่างไร? มันมักจะเป็นคำอธิบายที่ทำให้คำตอบที่ดี โพสต์รหัสเท่านั้นจะขมวดคิ้วที่นี่ (ปกติอย่างน้อย)
dezso

2
ดูเหมือนว่าจะตอบคำถามที่คล้ายกัน แต่แตกต่างกัน
ypercubeᵀᴹ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.