คำถามติดแท็ก full-text-search

การค้นหาข้อความแบบเต็มเกี่ยวข้องกับการค้นหาเอกสารโดยปกติจะเกี่ยวข้องกับข้อความที่ไม่มีโครงสร้างซึ่งต่างจากการค้นหาช่องข้อความในฐานข้อมูลที่มีโครงสร้าง

8
เปรียบเทียบเครื่องมือค้นหาข้อความแบบเต็ม - Lucene, Sphinx, Postgresql, MySQL?
ฉันกำลังสร้างเว็บไซต์ Django และฉันกำลังมองหาเครื่องมือค้นหา ผู้สมัครไม่กี่: Lucene / Lucene พร้อมเข็มทิศ / Solr บุคคลลึกลับ Postgresql ในตัวการค้นหาข้อความแบบเต็ม การค้นหาข้อความแบบเต็มในตัว MySQl เกณฑ์การคัดเลือก: ความเกี่ยวข้องของผลลัพธ์และการจัดอันดับ การค้นหาและการจัดทำดัชนีความเร็ว ใช้งานง่ายและใช้งานง่ายด้วย Django ข้อกำหนดด้านทรัพยากร - ไซต์จะโฮสต์บนVPSดังนั้นเครื่องมือค้นหาจึงไม่จำเป็นต้องใช้ RAM และ CPU จำนวนมาก ความยืดหยุ่น คุณสมบัติพิเศษเช่น "คุณหมายถึงอะไร" การค้นหาที่เกี่ยวข้อง ฯลฯ ทุกคนที่เคยมีประสบการณ์กับเครื่องมือค้นหาด้านบนหรือเครื่องมืออื่น ๆ ที่ไม่ได้อยู่ในรายชื่อ - ฉันชอบที่จะได้ยินความคิดเห็นของคุณ แก้ไข: สำหรับความต้องการการจัดทำดัชนีในขณะที่ผู้ใช้ป้อนข้อมูลลงในเว็บไซต์ข้อมูลเหล่านั้นจะต้องได้รับการจัดทำดัชนีอย่างต่อเนื่อง ไม่จำเป็นต้องเป็นแบบเรียลไทม์ แต่ข้อมูลใหม่ ๆ จะปรากฏในดัชนีโดยมีความล่าช้าไม่เกิน 15 - 30 นาที

10
เศษและแบบจำลองใน Elasticsearch
ฉันพยายามที่จะเข้าใจว่าชิ้นส่วนที่ลอกเลียนแบบนั้นอยู่ใน Elasticsearch แต่ฉันไม่สามารถเข้าใจได้ หากฉันดาวน์โหลด Elasticsearch และเรียกใช้สคริปต์จากสิ่งที่ฉันรู้ว่าฉันได้เริ่มต้นคลัสเตอร์ด้วยโหนดเดียว ตอนนี้โหนดนี้ (พีซีของฉัน) มี 5 shards (?) และบาง replicas (?) พวกเขาคืออะไรฉันมีดัชนี 5 รายการซ้ำกันหรือไม่ ถ้าเป็นเช่นนั้นทำไม ฉันต้องการคำอธิบายบางอย่าง

13
วิธีค้นหาเนื้อหาของไฟล์ PDF หลายไฟล์?
ฉันจะค้นหาเนื้อหาของไฟล์ PDF ในไดเรกทอรี / ไดเรกทอรีย่อยได้อย่างไร ฉันกำลังมองหาเครื่องมือบรรทัดคำสั่ง ดูเหมือนว่าgrepไม่สามารถค้นหาไฟล์ PDF

4
คู่มือสำหรับผู้เริ่มต้นสู่ ElasticSearch [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังคำตอบที่จะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน7 ปีที่ผ่านมา ยังไม่มีหนังสือเกี่ยวกับ ElasticSearch (ที่ฉันรู้จัก) และดูเหมือนว่าhttp://www.elasticsearch.org/guide/มีการอ้างอิงเท่านั้น มีคู่มือหรือแบบฝึกหัดสำหรับผู้เริ่มต้นที่ดีที่แนะนำโดยเฉพาะอย่างยิ่งในแง่ของกลยุทธ์การทำแผนที่และการจัดทำดัชนีต่าง ๆ ?

5
การเลือกเซิร์ฟเวอร์ค้นหาข้อความแบบเต็มแบบสแตนด์อะโลน: สฟิงซ์หรือ SOLR [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังว่าคำตอบจะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน8 ปีที่ผ่านมา ฉันกำลังมองหาเซิร์ฟเวอร์การค้นหาข้อความแบบสแตนด์อโลนที่มีคุณสมบัติต่อไปนี้: ต้องดำเนินการเป็นเซิร์ฟเวอร์แบบสแตนด์อโลนที่สามารถให้บริการการร้องขอการค้นหาจากไคลเอนต์หลาย ต้องสามารถทำ "การทำดัชนีจำนวนมาก" โดยการจัดทำดัชนีผลลัพธ์ของแบบสอบถาม SQL: พูดว่า "SELECT id, text_to_index จากเอกสาร"; ต้องเป็นซอฟต์แวร์เสรีและต้องทำงานบน Linux ที่มี MySQL เป็นฐานข้อมูล ต้องเร็ว (กฎการค้นหาข้อความแบบเต็มภายในของ MySQL) ทางเลือกที่ฉันพบว่ามีคุณสมบัติเหล่านี้คือ: Solr (ขึ้นอยู่กับ Lucene) ElasticSearch (ขึ้นอยู่กับ Lucene) บุคคลลึกลับ คำถามของฉัน: พวกเขาเปรียบเทียบอย่างไร ฉันพลาดทางเลือกอื่นหรือไม่? ฉันรู้ว่าแต่ละกรณีการใช้งานแตกต่างกัน แต่มีบางกรณีที่ฉันไม่ต้องการใช้แพคเกจแน่นอนหรือไม่?

6
เครื่องมือในการค้นหาสตริงภายในไฟล์โดยไม่สร้างดัชนี [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน5 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันต้องเปลี่ยนสายเชื่อมต่อบางส่วนในแอปพลิเคชันรุ่นเก่าที่เก่าแก่อย่างไม่น่าเชื่อและโปรแกรมเมอร์ที่ทำให้มันคิดว่ามันจะเป็นความคิดที่ดีในการพลาสเตอร์แอปทั้งหมดด้วยสายเชื่อมต่อทั่วสถานที่ การค้นหา "โครงการปัจจุบัน" ของ Visual Studio ช้าอย่างไม่น่าเชื่อและฉันไม่เชื่อถือการค้นหาของ Windows ดังนั้นเครื่องมือค้นหาข้อความที่ฟรีและไม่มีการจัดทำดัชนีที่ดีที่สุดคืออะไร สิ่งที่ควรทำคือส่งคืนรายการพร้อมไฟล์ที่มีสตริงที่ต้องการภายในโฟลเดอร์และโฟลเดอร์ย่อย ฉันใช้ Windows 2003 Server

6
Full Text Search vs LIKE คืออะไร
ฉันเพิ่งอ่านโพสต์ที่กล่าวถึง "การค้นหาข้อความแบบเต็ม" ใน SQL ฉันแค่สงสัยว่าความแตกต่างระหว่าง FTS และ LIKE คืออะไร ฉันอ่านบทความสองสามบทความ แต่ไม่พบสิ่งใดที่อธิบายได้ดี

16
ค้นหาประวัติการโค่นล้ม (ข้อความเต็ม)
มีวิธีค้นหาข้อความแบบเต็มของที่เก็บการโค่นล้มรวมถึงประวัติทั้งหมดหรือไม่ ตัวอย่างเช่นฉันได้เขียนคุณสมบัติที่ฉันใช้ที่ไหนสักแห่ง แต่แล้วมันก็ไม่จำเป็นดังนั้นฉันจึงต้องใช้ไฟล์ แต่ตอนนี้ฉันต้องหามันอีกครั้งเพื่อใช้อย่างอื่น บันทึก svn อาจจะบอกว่า "ลบสิ่งที่ไม่ได้ใช้ออก" และมีเช็คอินจำนวนมากเช่นนั้น แก้ไข 2016/04/15:โปรดทราบว่าสิ่งที่ถามนี่โดยคำว่า "ค้นหาข้อความเต็ม" คือการค้นหา diffs ที่เกิดขึ้นจริงของประวัติศาสตร์กระทำและไม่ได้ชื่อไฟล์และ / หรือการกระทำข้อความ ฉันชี้ให้เห็นสิ่งนี้เนื่องจากวลีของผู้เขียนข้างต้นไม่ได้สะท้อนให้เห็นถึงสิ่งนั้นได้เป็นอย่างดี - เนื่องจากในตัวอย่างของเขาเขาอาจกำลังมองหาชื่อไฟล์และ / หรือส่งข้อความเท่านั้น ดังนั้นsvn logคำตอบและความคิดเห็นมากมาย

7
ไม่สามารถใช้เพรดิเคต CONTAINS หรือ FREETEXT บนตารางหรือมุมมองที่จัดทำดัชนีได้เนื่องจากไม่ได้จัดทำดัชนีข้อความแบบเต็ม
ฉันได้รับข้อผิดพลาดต่อไปนี้ในฐานข้อมูล SQL Server 2008 R2 ของฉัน: ไม่สามารถใช้CONTAINSหรือFREETEXTกริยาบนโต๊ะหรือมุมมองที่จัดทำดัชนี 'tblArmy' เพราะมันไม่ได้ข้อความเต็มรูปแบบการจัดทำดัชนี

9
ค้นหาแบบเต็มข้อความด้วย InnoDB
ฉันกำลังพัฒนาเว็บแอปพลิเคชันปริมาณมากโดยที่ส่วนหนึ่งเป็นฐานข้อมูล MySQL ของโพสต์การสนทนาที่จะต้องเพิ่มเป็น 20M + แถวอย่างราบรื่น เดิมทีฉันวางแผนที่จะใช้ MyISAM สำหรับตาราง (สำหรับความสามารถในการค้นหาแบบเต็มข้อความในตัว ) แต่ความคิดของตารางทั้งหมดถูกล็อคเนื่องจากการเขียนเพียงครั้งเดียวทำให้ฉันชัตเตอร์ การล็อกระดับแถวมีความหมายมากขึ้น (ไม่ต้องพูดถึงข้อดีด้านความเร็วอื่น ๆ ของ InnoDB เมื่อจัดการกับโต๊ะขนาดใหญ่) ด้วยเหตุนี้ฉันจึงค่อนข้างตั้งใจที่จะใช้ InnoDB ปัญหาคือ ... InnoDB ไม่มีความสามารถในการค้นหาแบบเต็มข้อความในตัว ฉันควรใช้ระบบค้นหาของบุคคลที่สามหรือไม่? เช่นLucene (c ++) / Sphinx ? นินจาฐานข้อมูลของคุณมีข้อเสนอแนะ / แนวทางหรือไม่?zoieของ LinkedIn (จาก Lucene) ดูเหมือนจะเป็นตัวเลือกที่ดีที่สุดในขณะนี้... ถูกสร้างขึ้นจากความสามารถแบบเรียลไทม์ (ซึ่งค่อนข้างสำคัญสำหรับแอปพลิเคชันของฉัน) ฉันลังเลเล็กน้อยที่จะกระทำโดยไม่มีข้อมูลเชิงลึก ... (FYI: จะอยู่ใน EC2 พร้อมแท่นขุดเจาะหน่วยความจำสูงโดยใช้ PHP เพื่อให้บริการส่วนหน้า)

3
การค้นหาแบบเหลี่ยมเพชรพลอยคืออะไร?
การค้นหาแบบเหลี่ยมเพชรพลอยในบริบทของการค้นหาแบบเต็มคืออะไร? ฉันอ่านเกี่ยวกับเรื่องนี้จากWikipediaแต่ฉันไม่เข้าใจการใช้ / ประโยชน์ของมันอย่างสมบูรณ์ หวังว่าชุมชนจะสามารถตอบ / ขยายความและอธิบายด้วยตัวอย่างที่ดี หมายเหตุ:เรากำลังอยู่ในขั้นตอนการประเมิน / ค้นคว้าเครื่องมือค้นหาข้อความเต็มการค้นหาแบบเปิดที่แตกต่างกันและส่วนใหญ่ฉันเห็นการค้นหาแบบเหลี่ยมเพชรพลอยอยู่ในรายการหนึ่งในคุณลักษณะอื่น ๆ ดังนั้นฉันจึงพยายามประเมินว่าสิ่งนี้จะเป็นประโยชน์สำหรับข้อกำหนดการสมัครของเราหรือไม่

2
ตัวอย่างการค้นหาข้อความแบบเต็มใน Android
ฉันมีปัญหาในการทำความเข้าใจวิธีใช้การค้นหาข้อความแบบเต็ม (FTS) กับ Android ฉันได้อ่านเอกสาร SQLite ส่วนขยาย และฉันรู้ว่ามันเป็นไปได้ที่จะทำบน Android อย่างไรก็ตามฉันมีช่วงเวลาที่ยากลำบากในการค้นหาตัวอย่างใด ๆ ที่ฉันสามารถเข้าใจได้ แบบจำลองฐานข้อมูลพื้นฐาน ตารางฐานข้อมูล SQLite (ชื่อexample_table) มี 4 คอลัมน์ อย่างไรก็ตามมีเพียงคอลัมน์เดียว (ชื่อtext_column) ที่ต้องจัดทำดัชนีสำหรับการค้นหาข้อความแบบเต็ม ทุกแถวtext_columnมีข้อความที่มีความยาวแตกต่างกันตั้งแต่ 0 ถึง 1,000 คำ จำนวนแถวทั้งหมดมากกว่า 10,000 คุณจะตั้งค่าตารางและ / หรือตารางเสมือน FTS อย่างไร คุณจะดำเนินการค้นหา FTS text_columnอย่างไร? หมายเหตุเพิ่มเติม: เพราะเพียงหนึ่งความต้องการคอลัมน์การจัดทำดัชนีเพียงแค่ใช้ตาราง FTS (และลดลงexample_table) จะไม่มีประสิทธิภาพสำหรับการค้นหาที่ไม่ FTS- สำหรับตารางขนาดใหญ่เช่นนี้การจัดเก็บรายการที่ซ้ำกันtext_columnในตาราง FTS จะไม่เป็นที่พึงปรารถนา โพสต์นี้แสดงให้เห็นการใช้ตารางเนื้อหาภายนอก ตารางเนื้อหาภายนอกใช้ FTS4 แต่ …

3
FTS ไม่ทำงานอย่างที่คาดไว้กับอีเมลที่มีจุด
เรากำลังพัฒนาการค้นหาซึ่งเป็นส่วนหนึ่งของระบบที่ใหญ่กว่า เรามีMicrosoft SQL Server 2014 - 12.0.2000.8 (X64) Standard Edition (64-bit)การตั้งค่านี้: CREATE TABLE NewCompanies( [Id] [uniqueidentifier] NOT NULL, [Name] [nvarchar](400) NOT NULL, [Phone] [nvarchar](max) NULL, [Email] [nvarchar](max) NULL, [Contacts1] [nvarchar](max) NULL, [Contacts2] [nvarchar](max) NULL, [Contacts3] [nvarchar](max) NULL, [Contacts4] [nvarchar](max) NULL, [Address] [nvarchar](max) NULL, CONSTRAINT PK_Id PRIMARY KEY (Id) ); Phone …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.