ฉันกำลังอ่าน:
https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition
แต่ฉันไม่สามารถเข้าใจได้อย่างชัดเจนว่าทำไมสูตรจึงสร้างในแบบที่มันเป็น
ฉันเข้าใจอะไร:
iDF ควรที่จะวัดระดับความบ่อยครั้งที่คำ S ปรากฏในเอกสารแต่ละฉบับลดลงตามมูลค่าเมื่อคำนั้นปรากฏบ่อยขึ้น
จากมุมมองนั้น
นอกจากนี้ความถี่เทอมสามารถอธิบายได้อย่างถูกต้องว่า
ดังนั้นการวัด
เป็นวิธีการตามสัดส่วนกับความถี่ที่คำปรากฏในเอกสารที่กำหนดและความพิเศษของคำนั้นอยู่เหนือชุดเอกสาร
สิ่งที่ฉันไม่เข้าใจ
แต่สูตรที่ให้อธิบายมันเป็น
ฉันต้องการเข้าใจความต้องการลอการิทึมที่อธิบายไว้ในคำจำกัดความ ทำไมพวกเขาถึงอยู่ที่นั่น? พวกเขาเน้นเรื่องอะไร