Lucene ทำงานร่วมกับความถี่ระยะเวลาและความถี่ในเอกสารผกผัน สร้างการแมปดัชนีแต่ละคำกับเอกสารและนับความถี่ซึ่งไม่มีอะไรนอกจากดัชนีผกผันในเอกสาร
ตัวอย่าง :
ไฟล์ 1: Random Access Memory เป็นหน่วยความจำหลัก
ไฟล์ 2: ฮาร์ดดิสก์เป็นหน่วยความจำรอง
Lucene สร้างดัชนีย้อนกลับบางอย่างเช่น
ไฟล์ 1:
ระยะ: สุ่ม
ความถี่: 1
ตำแหน่ง: 0
ระยะ: หน่วยความจำ
ความถี่: 2
ตำแหน่ง: 3
ตำแหน่ง: 6
ดังนั้นจึงสามารถค้นหาและดึงเนื้อหาที่ค้นหาได้อย่างรวดเร็ว เมื่อมีการจับคู่คำค้นหามากเกินไประบบจะแสดงผลลัพธ์ตามน้ำหนัก พิจารณาคำค้นหา"หน่วยความจำหลัก"ซึ่งค้นหาทั้ง 4 คำทีละคำและผลลัพธ์จะเป็นอย่างไร
หลัก
ไฟล์ 1: ความถี่ - 1
หน่วยความจำ
ไฟล์ 1: ความถี่ - 2
ไฟล์ 2: ความถี่ - 1
ผลที่ตามมาจะเป็นFile1ตามFile2 หากต้องการหยุดการชั่งน้ำหนักของคำที่ใช้บ่อยที่สุดเช่น 'และ', 'หรือ' 'ให้พิจารณาความถี่ของเอกสารผกผัน (กล่าวคือ' จะลดน้ำหนักของคำที่เป็นที่นิยมมากที่สุดในชุดเอกสาร)