วิศวกรรมซอฟต์แวร์ search-engine

1

การเรียนรู้ของเครื่องรวมอยู่ในการออกแบบเครื่องมือค้นหาอย่างไร

ขณะนี้ฉันกำลังสร้างเครื่องมือค้นหาภายในองค์กรขนาดเล็กโดยใช้ Apache Lucene จุดประสงค์ของมันคือเรียบง่าย - จากคำหลักบางคำมันจะแนะนำบทความที่เขียนภายใน บริษัท ของเรา ฉันใช้การให้คะแนน TF-IDF ที่ค่อนข้างเป็นมาตรฐานในฐานะตัวชี้วัดพื้นฐานและสร้างกลไกการให้คะแนนของฉันเองอยู่ด้านบน สิ่งเหล่านี้ดูเหมือนจะทำงานได้อย่างยอดเยี่ยมยกเว้นในบางกรณีที่การจัดอันดับดูยุ่งเหยิง ดังนั้นสิ่งที่ฉันวางแผนจะทำคือการเพิ่มลิงค์ที่เกี่ยวข้อง / ไม่เกี่ยวข้องขนาดเล็กลงในหน้าผลการค้นหาเพื่อให้ผู้ใช้สามารถคลิกที่ลิงค์ใดลิงก์หนึ่งขึ้นอยู่กับการรับรู้ของพวกเขาว่าควรรวมผลลัพธ์นั้นไว้ด้วยหรือไม่ ความคิดของฉัน ปฏิบัติต่อป้ายกำกับที่เกี่ยวข้อง / ไม่เกี่ยวข้องเหล่านี้และสร้างข้อมูลการฝึกอบรม ใช้ข้อมูลนี้เพื่อฝึกฝนลักษณนาม (เช่น SVM) รวมโมเดลนี้ลงในเครื่องมือค้นหาเช่นผลลัพธ์ใหม่ทุกรายการจะผ่านตัวแยกประเภทและจะได้รับการกำหนดป้ายกำกับว่าเกี่ยวข้องหรือไม่ วิธีนี้ดูเหมือนง่ายสำหรับฉัน แต่ฉันไม่แน่ใจว่าจะใช้งานได้จริงหรือไม่ ฉันมีคำถามสองข้อ: คุณสมบัติทั้งหมดที่ฉันควรแยกคืออะไร มีวิธีที่ดีกว่าในการรวมส่วนประกอบการเรียนรู้ของเครื่องเข้ากับเครื่องมือค้นหาหรือไม่ เป้าหมายสุดท้ายของฉันคือ "เรียนรู้" ฟังก์ชั่นการจัดอันดับตามตรรกะทางธุรกิจเช่นเดียวกับความคิดเห็นของผู้ใช้

15 search language-agnostic lucene machine-learning search-engine

6

จะค้นหาข้อมูลที่เกี่ยวข้องกับภาษาโปรแกรม Go ได้อย่างไร?

หากมีบางสิ่งที่จะฆ่าภาษาโกก็เป็นชื่อ ฉันพบว่ามันยากมากที่จะพบสิ่งใดในเว็บที่เกี่ยวข้องเพียงแค่ใช้ "ไป" ในแบบสอบถาม คำนี้ใช้บ่อยที่สุดในภาษาอังกฤษ ดังนั้นฉันเห็นทุกอย่างในผลลัพธ์ยกเว้นสิ่งที่เกี่ยวข้องกับ Go แม้แต่ Google ที่เป็นผู้สนับสนุนภาษาและมีชื่อเสียงในการติดตามสิ่งที่ฉันค้นหาไม่สามารถติดตามได้ว่าฉันเป็นโปรแกรมเมอร์จึงสนใจภาษาการเขียนโปรแกรมไม่ใช่ไวยากรณ์ภาษาอังกฤษ จะค้นหาข้อมูลที่เกี่ยวข้องกับภาษาการเขียนโปรแกรมได้อย่างไรโดยไม่รวมผลลัพธ์ที่เกี่ยวข้องกับไวยากรณ์ภาษาอังกฤษ ลองนึกภาพตัวอย่างเช่นโพสต์บล็อกที่มีคนกล่าวถึงการสังเกตของเขาเกี่ยวกับ Go เขาอาจจะไม่ใช้ประโยคที่ง่ายต่อการค้นหาเช่น "ใช้ภาษาเขียนโปรแกรม" บางทีอาจเป็นบางสิ่ง "มีสิ่งหนึ่งที่ฉันชอบเกี่ยวกับ Go"

15 search-engine go

4

ถ้าฉันต้องการสร้างเครื่องมือค้นหาฉันจะเริ่มอย่างไร [ปิด]

ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน5 ปีที่ผ่านมา ใครสามารถชี้ให้ฉันไปในทิศทางที่ถูกต้องได้ไหม? ฉันไม่มีประสบการณ์ในการเขียนรหัส แต่ฉันเป็นผู้เรียนเร็ว ฉันไม่ได้พยายามจะบอกว่ามันจะง่าย แต่ฉันหวังว่าจะมีคนช่วยฉัน ...

9 search-engine

คำถามติดแท็ก search-engine