ฟิลด์ SQL SELECT WHERE มีคำ


562

ฉันต้องการตัวเลือกที่จะให้ผลลัพธ์เช่นนี้:

SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'

และฉันต้องการผลลัพธ์ทั้งหมดนั่นคือรวมถึงสตริงที่มี 'word2 word3 word1' หรือ 'word1 word3 word2' หรือการรวมกันของทั้งสาม

คำทุกคำต้องเป็นผลลัพธ์

คำตอบ:


843

ค่อนข้างช้า แต่วิธีการทำงานเพื่อรวมคำใด ๆ :

SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
   OR column1 LIKE '%word2%'
   OR column1 LIKE '%word3%'

หากคุณต้องการทุกคำที่จะนำเสนอให้ใช้สิ่งนี้:

SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
  AND column1 LIKE '%word2%'
  AND column1 LIKE '%word3%'

ถ้าคุณต้องการบางสิ่งที่เร็วกว่าคุณต้องค้นหาข้อความทั้งหมดและนี่เป็นสิ่งที่เฉพาะเจาะจงมากสำหรับฐานข้อมูลแต่ละประเภท


3
+ 1 ผมเห็นมันช้า แต่ก็สามารถลดลงได้ด้วยการจัดทำดัชนีที่ดี
Preet สงฆ์

12
@PreetSangha การทำดัชนีเมื่อคุณค้นหา LIKE ที่เริ่มต้นด้วย wild card? โปรดแสดงให้ฉันดู!
Popnoodles

1
ใน PostgreSQL 9.1 และใหม่กว่าคุณสามารถสร้างดัชนี trigram ซึ่งสามารถทำดัชนีการค้นหาดังกล่าวได้
mvp

2
@AquaAlex: word3 word2 word1คำสั่งของคุณจะล้มเหลวถ้ามีข้อความ
mvp

3
ข้อเสียอีกอย่างของวิธีการนี้: '% word%' จะพบ 'words', 'crosswordpuzzle' และ 'sword' (เช่นเดียวกับตัวอย่าง) ฉันต้องทำ column1 LIKE 'คำว่า' หรือ column1 LIKE 'คำ%' หรือ column1 LIKE '% word' หรือ column1 LIKE 'คำว่า' เพื่อหาคำที่ตรงกัน - และมันจะยังคงล้มเหลวสำหรับรายการที่คำไม่ตรง คั่นด้วยช่องว่าง
BlaM

81

โปรดทราบว่าหากคุณใช้LIKEเพื่อกำหนดว่าสตริงเป็นสตริงย่อยของสตริงอื่นคุณต้องหลีกเลี่ยงอักขระที่จับคู่รูปแบบในสตริงการค้นหาของคุณ

หากภาษา SQL ของคุณรองรับCHARINDEXจะง่ายกว่ามากที่จะใช้แทน:

SELECT * FROM MyTable
WHERE CHARINDEX('word1', Column1) > 0
  AND CHARINDEX('word2', Column1) > 0
  AND CHARINDEX('word3', Column1) > 0

นอกจากนี้โปรดทราบว่าสิ่งนี้และวิธีการในคำตอบที่ยอมรับนั้นครอบคลุมเฉพาะการจับคู่สตริงย่อยมากกว่าการจับคู่คำ ตัวอย่างเช่นสตริง'word1word2word3'จะยังคงตรงกัน


1
ดูเหมือนจะง่ายกว่านี้หากคำค้นหาของคุณเป็นตัวแปรแทนที่จะต้องเพิ่มตัวอักษร '%' ก่อนค้นหา
ShaneBlake

4
ในเซิร์ฟเวอร์และเครื่องมือ Microsoft SQL เราควรใช้InStr()แทนCHARINDEX
23W

6
@ 23W ไม่มี InStr ใน MS SQL
Romano Zumbé

19

ฟังก์ชัน

 CREATE FUNCTION [dbo].[fnSplit] ( @sep CHAR(1), @str VARCHAR(512) )
 RETURNS TABLE AS
 RETURN (
           WITH Pieces(pn, start, stop) AS (
           SELECT 1, 1, CHARINDEX(@sep, @str)
           UNION ALL
           SELECT pn + 1, stop + 1, CHARINDEX(@sep, @str, stop + 1)
           FROM Pieces
           WHERE stop > 0
      )

      SELECT
           pn AS Id,
           SUBSTRING(@str, start, CASE WHEN stop > 0 THEN stop - start ELSE 512 END) AS Data
      FROM
           Pieces
 )

สอบถาม

 DECLARE @FilterTable TABLE (Data VARCHAR(512))

 INSERT INTO @FilterTable (Data)
 SELECT DISTINCT S.Data
 FROM fnSplit(' ', 'word1 word2 word3') S -- Contains words

 SELECT DISTINCT
      T.*
 FROM
      MyTable T
      INNER JOIN @FilterTable F1 ON T.Column1 LIKE '%' + F1.Data + '%'
      LEFT JOIN @FilterTable F2 ON T.Column1 NOT LIKE '%' + F2.Data + '%'
 WHERE
      F2.Data IS NULL

2
Exellent! จะเริ่มเรียนรู้เกี่ยวกับฟังก์ชันนี้ได้อย่างไร ชิ้นคืออะไร และคุณสามารถบอกฉัน pseudocode เกี่ยวกับบรรทัดนี้ได้ไหม SUBSTRING (@str เริ่มต้นกรณีที่หยุด> 0 หยุดแล้ว - เริ่ม ELSE 512 END) AS Data
Khaneddy2013

2
การย้ายครั้งนี้ไม่น่าเชื่อฉันเป็นคนที่มีความสุขมาก :( _______________________________________________________________________________________ เข้าร่วมภายใน (@FilterTable F1 บน T.Column1 ชอบ '%' + F1.Data + '%' ซ้ายเข้าร่วม (@FilterTable F2 บน T.Column1 ไม่เหมือนกับ '%' + F2.Data + '%'
Ahmad Alkaraki

13

แทนที่จะSELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'เพิ่มและระหว่างคำเหล่านั้นเช่น:

SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 And word2 And word3'

ดูรายละเอียดได้ที่นี่ https://msdn.microsoft.com/en-us/library/ms187787.aspx

UPDATE

สำหรับการเลือกวลีให้ใช้เครื่องหมายคำพูดคู่เช่น:

SELECT * FROM MyTable WHERE Column1 CONTAINS '"Phrase one" And word2 And "Phrase Two"'

psคุณต้องเปิดใช้งานการค้นหาข้อความแบบเต็มบนโต๊ะก่อนใช้คำหลักที่มี สำหรับรายละเอียดเพิ่มเติมดูที่นี่ https://docs.microsoft.com/en-us/sql/relational-databases/search/get-started-with-full-text-search


8
SELECT * FROM MyTable WHERE 
Column1 LIKE '%word1%'
AND Column1 LIKE '%word2%'
AND Column1 LIKE  '%word3%'

เปลี่ยนORเป็นANDยึดตามการแก้ไขคำถาม


ฉันต้องการคำทั้งหมดที่จะอยู่ในผลในการรวมกันใด ๆ
Mario M

4

หากคุณกำลังใช้Oracle Databaseแล้วคุณสามารถบรรลุนี้โดยมีแบบสอบถาม มีแบบสอบถามจะเร็วกว่าเช่นแบบสอบถาม

หากคุณต้องการทุกคำ

SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 and word2 and word3', 1) > 0

หากคุณต้องการคำใด ๆ

SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 or word2 or word3', 1) > 0

มีดัชนีความต้องการของประเภทCONTEXTในคอลัมน์ของคุณ

CREATE INDEX SEARCH_IDX ON MyTable(Column) INDEXTYPE IS CTXSYS.CONTEXT

1
@downvoters ความคิดเห็นที่ชื่นชมบอกสิ่งที่ผิดกับคำตอบ แบบสอบถามเดียวกันนี้กำลังทำงานในการแก้ปัญหาองค์กรของเรามากกว่า 1000 ครั้งต่อวันโดยไม่มีปัญหาใด ๆ :)
mirmdasif

2
OP ไม่ได้ระบุว่าจะใช้ฐานข้อมูลใดและทุกคนคิดว่านั่นคือ SQL Server แต่เนื่องจากคุณได้ระบุ Oracle ไว้ในคำตอบของคุณฉันไม่เข้าใจผู้ลงคะแนน
EAmez

4

หากคุณเพียงต้องการหาคู่ที่ตรงกัน

SELECT * FROM MyTable WHERE INSTR('word1 word2 word3',Column1)<>0

เซิร์ฟเวอร์ SQL:

CHARINDEX(Column1, 'word1 word2 word3', 1)<>0

เพื่อให้ได้การแข่งขันที่แน่นอน ตัวอย่าง(';a;ab;ac;',';b;')จะไม่ได้รับการจับคู่

SELECT * FROM MyTable WHERE INSTR(';word1;word2;word3;',';'||Column1||';')<>0

1
'INSTR' ไม่ใช่ชื่อฟังก์ชันในตัวที่รู้จัก ใน SQL Server ของฉัน
Durgesh Pandey

0

ลองใช้ "tesarus search" ในดัชนีข้อความแบบเต็มใน MS SQL Server สิ่งนี้ดีกว่าการใช้ "%" ในการค้นหาถ้าคุณมีบันทึกนับล้าน เทสซามีปริมาณการใช้หน่วยความจำน้อยกว่าอย่างอื่น ลองค้นหาฟังก์ชั่นนี้ :)


0

วิธีที่ดีที่สุดคือการสร้างดัชนีข้อความแบบเต็มในคอลัมน์ในตารางและใช้ประกอบด้วยแทน LIKE

SELECT * FROM MyTable WHERE 
contains(Column1 , N'word1' )
AND contains(Column1 , N'word2' )
AND contains(Column1 , N'word3' )

0

ทำไมไม่ใช้ "ใน" แทน?

Select *
from table
where columnname in (word1, word2, word3)

2
เพราะมันไม่ทำงาน คุณลองมันจริงหรือ
mvp

2
ฉันเชื่อว่าสิ่งนี้จะคืนการแข่งขันที่แน่นอนเท่านั้น
Murray

1
ฉันเข้าใจผิดด้วยคำถามต้นฉบับ: พวกเขาไม่ต้องการค้นหาคู่ที่ตรงกัน แต่คำที่เป็นส่วนหนึ่งของสตริงที่ใหญ่กว่า สำหรับกรณี "การจับคู่แบบตรงทั้งหมด" ที่ง่ายขึ้นงานนี้จัดให้มีคำอยู่ระหว่างเครื่องหมายคำพูดเดี่ยว (cf. SQLfiddle )
sc28

0

หนึ่งในวิธีที่ง่ายที่สุดในการบรรลุสิ่งที่กล่าวถึงในคำถามคือการใช้CONTAINSกับ NEAR หรือ '~' ตัวอย่างเช่นข้อความค้นหาต่อไปนี้จะให้คอลัมน์ทั้งหมดที่มีเฉพาะ word1, word2 และ word3

SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 NEAR word2 NEAR word3')

SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 ~ word2 ~ word3')

นอกจากนี้ CONTAINSTABLE จะส่งคืนอันดับของเอกสารแต่ละรายการตามระยะห่างของ "word1", "word2" และ "word3" ตัวอย่างเช่นหากเอกสารมีประโยค "The word1 คือ word2 และ word3" การจัดอันดับจะสูงเนื่องจากคำนั้นอยู่ใกล้กันมากกว่าเอกสารอื่น

อีกสิ่งหนึ่งที่ฉันต้องการเพิ่มคือเรายังสามารถใช้ proximity_term เพื่อค้นหาคอลัมน์ที่คำอยู่ภายในระยะทางที่เฉพาะเจาะจงระหว่างพวกเขาภายในวลีคอลัมน์


0

สิ่งนี้ควรทำด้วยความช่วยเหลือของ sql server ค้นหาข้อความเต็มถ้าใช้ อย่างไรก็ตามหากคุณไม่สามารถทำงานกับฐานข้อมูลของคุณได้ด้วยเหตุผลบางประการนี่คือโซลูชันที่เน้นประสิทธิภาพ: -

-- table to search in
CREATE TABLE dbo.myTable
    (
    myTableId int NOT NULL IDENTITY (1, 1),
    code varchar(200) NOT NULL, 
    description varchar(200) NOT NULL -- this column contains the values we are going to search in 
    )  ON [PRIMARY]
GO

-- function to split space separated search string into individual words
CREATE FUNCTION [dbo].[fnSplit] (@StringInput nvarchar(max),
@Delimiter nvarchar(1))
RETURNS @OutputTable TABLE (
  id nvarchar(1000)
)
AS
BEGIN
  DECLARE @String nvarchar(100);

  WHILE LEN(@StringInput) > 0
  BEGIN
    SET @String = LEFT(@StringInput, ISNULL(NULLIF(CHARINDEX(@Delimiter, @StringInput) - 1, -1),
    LEN(@StringInput)));
    SET @StringInput = SUBSTRING(@StringInput, ISNULL(NULLIF(CHARINDEX
    (
    @Delimiter, @StringInput
    ),
    0
    ), LEN
    (
    @StringInput)
    )
    + 1, LEN(@StringInput));

    INSERT INTO @OutputTable (id)
      VALUES (@String);
  END;

  RETURN;
END;
GO

-- this is the search script which can be optionally converted to a stored procedure /function


declare @search varchar(max) = 'infection upper acute genito'; -- enter your search string here
-- the searched string above should give rows containing the following
-- infection in upper side with acute genitointestinal tract
-- acute infection in upper teeth
-- acute genitointestinal pain

if (len(trim(@search)) = 0) -- if search string is empty, just return records ordered alphabetically
begin
 select 1 as Priority ,myTableid, code, Description from myTable order by Description 
 return;
end

declare @splitTable Table(
wordRank int Identity(1,1), -- individual words are assinged priority order (in order of occurence/position)
word varchar(200)
)
declare @nonWordTable Table( -- table to trim out auxiliary verbs, prepositions etc. from the search
id varchar(200)
)

insert into @nonWordTable values
('of'),
('with'),
('at'),
('in'),
('for'),
('on'),
('by'),
('like'),
('up'),
('off'),
('near'),
('is'),
('are'),
(','),
(':'),
(';')

insert into @splitTable
select id from dbo.fnSplit(@search,' '); -- this function gives you a table with rows containing all the space separated words of the search like in this e.g., the output will be -
--  id
-------------
-- infection
-- upper
-- acute
-- genito

delete s from @splitTable s join @nonWordTable n  on s.word = n.id; -- trimming out non-words here
declare @countOfSearchStrings int = (select count(word) from @splitTable);  -- count of space separated words for search
declare @highestPriority int = POWER(@countOfSearchStrings,3);

with plainMatches as
(
select myTableid, @highestPriority as Priority from myTable where Description like @search  -- exact matches have highest priority
union                                      
select myTableid, @highestPriority-1 as Priority from myTable where Description like  @search + '%'  -- then with something at the end
union                                      
select myTableid, @highestPriority-2 as Priority from myTable where Description like '%' + @search -- then with something at the beginning
union                                      
select myTableid, @highestPriority-3 as Priority from myTable where Description like '%' + @search + '%' -- then if the word falls somewhere in between
),
splitWordMatches as( -- give each searched word a rank based on its position in the searched string
                     -- and calculate its char index in the field to search
select myTable.myTableid, (@countOfSearchStrings - s.wordRank) as Priority, s.word,
wordIndex = CHARINDEX(s.word, myTable.Description)  from myTable join @splitTable s on myTable.Description like '%'+ s.word + '%'
-- and not exists(select myTableid from plainMatches p where p.myTableId = myTable.myTableId) -- need not look into myTables that have already been found in plainmatches as they are highest ranked
                                                                              -- this one takes a long time though, so commenting it, will have no impact on the result
),
matchingRowsWithAllWords as (
 select myTableid, count(myTableid) as myTableCount from splitWordMatches group by(myTableid) having count(myTableid) = @countOfSearchStrings
)
, -- trim off the CTE here if you don't care about the ordering of words to be considered for priority
wordIndexRatings as( -- reverse the char indexes retrived above so that words occuring earlier have higher weightage
                     -- and then normalize them to sequential values
select s.myTableid, Priority, word, ROW_NUMBER() over (partition by s.myTableid order by wordindex desc) as comparativeWordIndex 
from splitWordMatches s join matchingRowsWithAllWords m on s.myTableId = m.myTableId
)
,
wordIndexSequenceRatings as ( -- need to do this to ensure that if the same set of words from search string is found in two rows,
                              -- their sequence in the field value is taken into account for higher priority
    select w.myTableid, w.word, (w.Priority + w.comparativeWordIndex + coalesce(sequncedPriority ,0)) as Priority
    from wordIndexRatings w left join 
    (
     select w1.myTableid, w1.priority, w1.word, w1.comparativeWordIndex, count(w1.myTableid) as sequncedPriority
     from wordIndexRatings w1 join wordIndexRatings w2 on w1.myTableId = w2.myTableId and w1.Priority > w2.Priority and w1.comparativeWordIndex>w2.comparativeWordIndex
     group by w1.myTableid, w1.priority,w1.word, w1.comparativeWordIndex
    ) 
    sequencedPriority on w.myTableId = sequencedPriority.myTableId and w.Priority = sequencedPriority.Priority
),
prioritizedSplitWordMatches as ( -- this calculates the cumulative priority for a field value
select  w1.myTableId, sum(w1.Priority) as OverallPriority from wordIndexSequenceRatings w1 join wordIndexSequenceRatings w2 on w1.myTableId =  w2.myTableId 
where w1.word <> w2.word group by w1.myTableid 
),
completeSet as (
select myTableid, priority from plainMatches -- get plain matches which should be highest ranked
union
select myTableid, OverallPriority as priority from prioritizedSplitWordMatches -- get ranked split word matches (which are ordered based on word rank in search string and sequence)
),
maximizedCompleteSet as( -- set the priority of a field value = maximum priority for that field value
select myTableid, max(priority) as Priority  from completeSet group by myTableId
)
select priority, myTable.myTableid , code, Description from maximizedCompleteSet m join myTable  on m.myTableId = myTable.myTableId 
order by Priority desc, Description -- order by priority desc to get highest rated items on top
--offset 0 rows fetch next 50 rows only -- optional paging

-2
SELECT * FROM MyTable WHERE Column1 Like "*word*"

นี่จะแสดงระเบียนทั้งหมดที่column1มีค่าบางส่วนwordอยู่


-2
DECLARE @SearchStr nvarchar(100)
SET @SearchStr = ' '



CREATE TABLE #Results (ColumnName nvarchar(370), ColumnValue nvarchar(3630))

SET NOCOUNT ON

DECLARE @TableName nvarchar(256), @ColumnName nvarchar(128), @SearchStr2 nvarchar(110)
SET  @TableName = ''
SET @SearchStr2 = QUOTENAME('%' + @SearchStr + '%','''')

WHILE @TableName IS NOT NULL

BEGIN
    SET @ColumnName = ''
    SET @TableName = 
    (
        SELECT MIN(QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME))
        FROM     INFORMATION_SCHEMA.TABLES
        WHERE         TABLE_TYPE = 'BASE TABLE'
            AND    QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME) > @TableName
            AND    OBJECTPROPERTY(
                    OBJECT_ID(
                        QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME)
                         ), 'IsMSShipped'
                           ) = 0
    )

    WHILE (@TableName IS NOT NULL) AND (@ColumnName IS NOT NULL)

    BEGIN
        SET @ColumnName =
        (
            SELECT MIN(QUOTENAME(COLUMN_NAME))
            FROM     INFORMATION_SCHEMA.COLUMNS
            WHERE         TABLE_SCHEMA    = PARSENAME(@TableName, 2)
                AND    TABLE_NAME    = PARSENAME(@TableName, 1)
                AND    DATA_TYPE IN ('char', 'varchar', 'nchar', 'nvarchar', 'int', 'decimal')
                AND    QUOTENAME(COLUMN_NAME) > @ColumnName
        )

        IF @ColumnName IS NOT NULL

        BEGIN
            INSERT INTO #Results
            EXEC
            (
                'SELECT ''' + @TableName + '.' + @ColumnName + ''', LEFT(' + @ColumnName + ', 3630) FROM ' + @TableName + ' (NOLOCK) ' +
                ' WHERE ' + @ColumnName + ' LIKE ' + @SearchStr2
            )
        END
    END   
END

SELECT ColumnName, ColumnValue FROM #Results

DROP TABLE #Results

2
ขอขอบคุณสำหรับข้อมูลโค้ดนี้ซึ่งอาจให้ความช่วยเหลือแบบ จำกัด และทันที คำอธิบายที่เหมาะสมมากจะเพิ่มมูลค่าในระยะยาวด้วยการแสดงเหตุผลนี้เป็นทางออกที่ดีในการแก้ไขปัญหาและจะทำให้มันมีประโยชน์มากขึ้นให้กับผู้อ่านในอนาคตกับอื่น ๆ คำถามที่คล้ายกัน โปรดแก้ไขคำตอบของคุณเพื่อเพิ่มคำอธิบายรวมถึงข้อสมมติฐานที่คุณทำ
Mogsdad

-5
select * from table where name regexp '^word[1-3]$'

หรือ

select * from table where name in ('word1','word2','word3')

3
SQL มาตรฐาน "regexp" คืออะไร
Peter Mortensen

2
สำหรับข้อความค้นหาที่สองคำนั้นไม่ควรถูกนำมาอ้างอิง?
Peter Mortensen

1
รหัสนี้ดูเหมือนว่าจะตรวจสอบว่าคอลัมน์เท่ากับหนึ่งในสามคำ คำถามเกี่ยวกับการตรวจสอบว่าคอลัมน์มีคำ ทั้งหมดสามคำ
Sam

7
Hiya นี่อาจช่วยแก้ปัญหาได้ ... แต่มันจะดีถ้าคุณสามารถแก้ไขคำตอบของคุณและให้คำอธิบายเล็ก ๆ น้อย ๆ เกี่ยวกับวิธีการและวิธีการทำงาน :) อย่าลืม - มีกองหน้าใหม่ในกองล้นมากเกินไป และพวกเขาสามารถเรียนรู้สิ่งหนึ่งหรือสองอย่างจากความเชี่ยวชาญของคุณ - สิ่งที่ชัดเจนสำหรับคุณอาจไม่เป็นเช่นนั้นสำหรับพวกเขา
Taryn East
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.