คำถามติดแท็ก lucene

คำว่า Lucene หมายถึงไลบรารีของเครื่องมือค้นหา Java fulltext แบบโอเพนซอร์ส แต่ยังรวมถึงระบบนิเวศทั้งหมดที่เติบโตขึ้นรอบ ๆ รวมถึง lucene.net, solr, elasticsearch และ zend-search-lucene

12
Solr vs. ElasticSearch [ปิด]
ปิด คำถามนี้เป็นคำถามความคิดเห็นตาม ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดเมื่อปีที่แล้ว อะไรคือความแตกต่างทางสถาปัตยกรรมระหว่างเทคโนโลยีเหล่านี้? นอกจากนี้กรณีการใช้งานใดที่เหมาะสมกว่าสำหรับแต่ละกรณี

9
ElasticSearch, สฟิงซ์, Lucene, Solr, Xapian ซึ่งเหมาะกับการใช้งานใด [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังคำตอบที่จะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน7 ปีที่ผ่านมา ฉันกำลังดูวิธีการค้นหาอื่น ๆ มากกว่าที่จะมีการสืบค้น SQL จำนวนมาก ฉันเห็นElasticSearchเมื่อเร็ว ๆ นี้และเล่นกับwhoosh (Python ใช้เครื่องมือค้นหา) คุณสามารถให้เหตุผลกับการเลือกของคุณได้หรือไม่?

8
เปรียบเทียบเครื่องมือค้นหาข้อความแบบเต็ม - Lucene, Sphinx, Postgresql, MySQL?
ฉันกำลังสร้างเว็บไซต์ Django และฉันกำลังมองหาเครื่องมือค้นหา ผู้สมัครไม่กี่: Lucene / Lucene พร้อมเข็มทิศ / Solr บุคคลลึกลับ Postgresql ในตัวการค้นหาข้อความแบบเต็ม การค้นหาข้อความแบบเต็มในตัว MySQl เกณฑ์การคัดเลือก: ความเกี่ยวข้องของผลลัพธ์และการจัดอันดับ การค้นหาและการจัดทำดัชนีความเร็ว ใช้งานง่ายและใช้งานง่ายด้วย Django ข้อกำหนดด้านทรัพยากร - ไซต์จะโฮสต์บนVPSดังนั้นเครื่องมือค้นหาจึงไม่จำเป็นต้องใช้ RAM และ CPU จำนวนมาก ความยืดหยุ่น คุณสมบัติพิเศษเช่น "คุณหมายถึงอะไร" การค้นหาที่เกี่ยวข้อง ฯลฯ ทุกคนที่เคยมีประสบการณ์กับเครื่องมือค้นหาด้านบนหรือเครื่องมืออื่น ๆ ที่ไม่ได้อยู่ในรายชื่อ - ฉันชอบที่จะได้ยินความคิดเห็นของคุณ แก้ไข: สำหรับความต้องการการจัดทำดัชนีในขณะที่ผู้ใช้ป้อนข้อมูลลงในเว็บไซต์ข้อมูลเหล่านั้นจะต้องได้รับการจัดทำดัชนีอย่างต่อเนื่อง ไม่จำเป็นต้องเป็นแบบเรียลไทม์ แต่ข้อมูลใหม่ ๆ จะปรากฏในดัชนีโดยมีความล่าช้าไม่เกิน 15 - 30 นาที

10
NoSQL (MongoDB) vs Lucene (หรือ Solr) เป็นฐานข้อมูลของคุณ
ด้วยความเคลื่อนไหว NoSQL ที่เพิ่มขึ้นตามฐานข้อมูลที่ใช้เอกสารฉันได้ดู MongoDB เมื่อเร็ว ๆ นี้ ฉันได้สังเกตเห็นความคล้ายคลึงกันที่น่าทึ่งกับวิธีการปฏิบัติต่อรายการเป็น "เอกสาร" เช่นเดียวกับ Lucene (และผู้ใช้ของ Solr) ดังนั้นคำถาม: ทำไมคุณต้องการใช้ NoSQL (MongoDB, Cassandra, CouchDB ฯลฯ ) เหนือ Lucene (หรือ Solr) เป็น "ฐานข้อมูล" ของคุณ? สิ่งที่ฉัน (และฉันแน่ใจว่าคนอื่นกำลังมองหา) ในคำตอบคือการเปรียบเทียบลึกของพวกเขา มาข้ามการอภิปรายฐานข้อมูลเชิงสัมพันธ์กันไปพร้อม ๆ กันเพราะมันมีจุดประสงค์ที่แตกต่างกัน Lucene ให้ประโยชน์อย่างมากเช่นการค้นหาที่มีประสิทธิภาพและระบบน้ำหนัก ไม่ต้องพูดถึงแง่มุมใน Solr (ซึ่ง Solr จะถูกรวมเข้ากับ Lucene เร็ว ๆ นี้ใช่!) คุณสามารถใช้เอกสาร Lucene เพื่อจัดเก็บ ID และเข้าถึงเอกสารเช่น …

5
การเลือกเซิร์ฟเวอร์ค้นหาข้อความแบบเต็มแบบสแตนด์อะโลน: สฟิงซ์หรือ SOLR [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังว่าคำตอบจะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน8 ปีที่ผ่านมา ฉันกำลังมองหาเซิร์ฟเวอร์การค้นหาข้อความแบบสแตนด์อโลนที่มีคุณสมบัติต่อไปนี้: ต้องดำเนินการเป็นเซิร์ฟเวอร์แบบสแตนด์อโลนที่สามารถให้บริการการร้องขอการค้นหาจากไคลเอนต์หลาย ต้องสามารถทำ "การทำดัชนีจำนวนมาก" โดยการจัดทำดัชนีผลลัพธ์ของแบบสอบถาม SQL: พูดว่า "SELECT id, text_to_index จากเอกสาร"; ต้องเป็นซอฟต์แวร์เสรีและต้องทำงานบน Linux ที่มี MySQL เป็นฐานข้อมูล ต้องเร็ว (กฎการค้นหาข้อความแบบเต็มภายในของ MySQL) ทางเลือกที่ฉันพบว่ามีคุณสมบัติเหล่านี้คือ: Solr (ขึ้นอยู่กับ Lucene) ElasticSearch (ขึ้นอยู่กับ Lucene) บุคคลลึกลับ คำถามของฉัน: พวกเขาเปรียบเทียบอย่างไร ฉันพลาดทางเลือกอื่นหรือไม่? ฉันรู้ว่าแต่ละกรณีการใช้งานแตกต่างกัน แต่มีบางกรณีที่ฉันไม่ต้องการใช้แพคเกจแน่นอนหรือไม่?

7
ความแตกต่างระหว่าง solr และ lucene
ฉันรู้ว่า Lucene และ Solr เป็น 2 โครงการ Apache ที่แตกต่างกันซึ่งทำงานร่วมกัน แต่ฉันไม่เข้าใจว่าเป้าหมายของแต่ละโครงการคืออะไร สำหรับสิ่งที่ฉันเข้าใจจนถึงตอนนี้คือ Lucene ใช้เพื่อสร้างดัชนีการค้นหาและ Solr ใช้ดัชนีนี้เพื่อทำการค้นหา ฉันถูกหรือว่าเป็นแนวทางที่แตกต่างอย่างสิ้นเชิง?
163 java  solr  lucene 


7
จะสอบถาม SOLR สำหรับช่องว่างได้อย่างไร?
ฉันมีดัชนีโซลขนาดใหญ่และฉันสังเกตเห็นว่าบางฟิลด์ไม่ได้รับการอัปเดตอย่างถูกต้อง (ดัชนีเป็นแบบไดนามิก) ซึ่งส่งผลให้บางช่องมีฟิลด์ "id" ว่าง ฉันได้ลองใช้คำถามเหล่านี้แล้ว แต่ไม่ได้ผล: id:'' id:NULL id:null id:"" id: id:['' TO *] มีวิธีสอบถามช่องว่างไหม ขอบคุณ
112 solr  lucene 

8
Elasticsearch vs Cassandra กับ Elasticsearch กับ Cassandra
ฉันกำลังเรียนรู้ NoSQL และกำลังดูตัวเลือกต่างๆสำหรับความต้องการของลูกค้า ฉันได้อ่านแหล่งข้อมูลต่างๆก่อนที่จะตั้งคำถามนี้ (เป็นคนที่ไม่ค่อยมีความรู้ใน NoSQL) ฉันต้องการจัดเก็บข้อมูลในอัตราที่เร็วขึ้นและอ่านข้อมูล ปลอดภัยอย่างสมบูรณ์และปรับขนาดได้ง่าย สามารถค้นหาข้อมูลสำหรับ Analytics ฉันลงเอยด้วยรายการสั้น ๆ ของ: Cassandra and Elasticsearch สิ่งที่ฉันเข้าใจคือ Cassandra เป็นโซลูชันการจัดเก็บ NoSQL ที่สมบูรณ์แบบสำหรับฉันเพราะฉันสามารถเขียนข้อมูลและอ่านข้อมูลโดยใช้ดัชนีได้ จุดไหนที่ล้มเหลวหรืออาจล้มเหลวอยู่ที่ Analytics ในอนาคตหากฉันต้องการรับข้อมูลfrom_date to to_dateหรือวิธีอื่น ๆ ในการรับข้อมูลสำหรับการวิเคราะห์หากฉันไม่ออกแบบโมเดลข้อมูลอย่างเหมาะสมหรือมองเห็นได้ในระยะยาวซึ่งอาจจะค่อนข้างยากในโลกที่เปลี่ยนแปลงตลอดเวลา แม้ว่าElastic Searchจะดีที่สุดในการจัดทำดัชนี (สนับสนุนโดย Lucene) และสามารถค้นหาข้อมูลแบบสุ่มโดยการส่งข้อความแบบสุ่ม แต่มันใช้งานได้เหมือนกันแม้ว่าฉันต้องการดึงข้อมูลfrom_date to to_date(ฉันคาดว่ามันอาจจะเป็น) แต่คำถามที่แท้จริงคือ Search Engine หรือที่เก็บข้อมูล NoSQL ที่สมบูรณ์แบบเช่น Cassandra หรือไม่? ถ้าใช่ทำไมเราถึงยังต้องการ Cassandra? หากทั้งสองสิ่งนี้อยู่คนละโลกโปรดอธิบายว่า! เราจะรวมเข้าด้วยกันเพื่อให้ได้โซลูชันที่มีประสิทธิภาพมากขึ้นได้อย่างไร

2
การเปรียบเทียบเครื่องวิเคราะห์ Lucene
ใครช่วยอธิบายความแตกต่างระหว่างเครื่องวิเคราะห์ต่างๆภายใน Lucene ได้ไหม ฉันได้รับข้อยกเว้น maxClauseCount และฉันเข้าใจว่าฉันสามารถหลีกเลี่ยงปัญหานี้ได้โดยใช้ KeywordAnalyzer แต่ฉันไม่ต้องการเปลี่ยนจาก StandardAnalyzer โดยไม่เข้าใจปัญหารอบตัววิเคราะห์ ขอบคุณมาก ๆ.
105 lucene  analyzer 

4
เอกสารดัชนีลูซีนอย่างไร?
ฉันอ่านเอกสารเกี่ยวกับ Lucene; ฉันอ่านเอกสารในลิงค์นี้ด้วย ( http://lucene.sourceforge.net/talks/pisa ) ฉันไม่เข้าใจจริงๆว่า Lucene ทำดัชนีเอกสารอย่างไรและไม่เข้าใจว่า Lucene ใช้อัลกอริทึมใดในการจัดทำดัชนี ในลิงค์ด้านบนกล่าวว่า Lucene ใช้อัลกอริทึมนี้ในการจัดทำดัชนี: อัลกอริทึมที่เพิ่มขึ้น: รักษาสแต็กของดัชนีเซ็กเมนต์ สร้างดัชนีสำหรับเอกสารขาเข้าแต่ละฉบับ ดันดัชนีใหม่ไปยังสแต็ก ให้ b = 10 เป็นปัจจัยผสาน M = 8 for (size = 1; size < M; size *= b) { if (there are b indexes with size docs on top of the stack) …

4
Lucene ทำงานอย่างไร
ฉันต้องการทราบว่าการค้นหาลูซีนทำงานได้รวดเร็วเพียงใด ฉันไม่พบเอกสารที่มีประโยชน์บนเว็บ หากคุณมีอะไร (ย่อมาจากรหัสแหล่งที่มาของลูซีน) เพื่ออ่านโปรดแจ้งให้เราทราบ ข้อความค้นหาโดยใช้การค้นหาข้อความ mysql5 ด้วยดัชนีใช้เวลาประมาณ 18 นาทีในกรณีของฉัน การค้นหาลูซีนสำหรับข้อความค้นหาเดียวกันใช้เวลาไม่ถึงหนึ่งวินาที
90 lucene 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.