"A" เกี่ยวข้องกับ "B" และ "C" ฉันจะแสดงให้เห็นว่า "B" และ "C" อาจเกี่ยวข้องกับบริบทนี้ได้อย่างไร
ตัวอย่าง:
นี่คือหัวข้อข่าวบางส่วนเกี่ยวกับละครบรอดเวย์ล่าสุด:
- Glengarry Glen Ross ของ David Mamet นำแสดงโดย Al Pacino เปิดบรอดเวย์
- Al Pacino ใน 'Glengarry Glen Ross': นักวิจารณ์คิดอย่างไร
- Al Pacino ได้รับบทวิจารณ์ที่ไม่สดใสสำหรับบทละครบรอดเวย์
- รีวิวโรงละคร: Glengarry Glen Ross กำลังขายดาวของมันอย่างหนัก
- Glengarry Glen Ross; เฮ้ใครฆ่าไฟ Klieg?
ปัญหา:
การเรียกใช้ฟัซซี่ - สตริงที่ตรงกันกับระเบียนเหล่านี้จะสร้างความสัมพันธ์บางอย่าง แต่ไม่ใช่อื่น ๆ แม้ว่าผู้อ่านของมนุษย์สามารถเลือกพวกเขาออกจากบริบทในชุดข้อมูลที่มีขนาดใหญ่กว่ามาก
ฉันจะค้นหาความสัมพันธ์ที่แนะนำ # 3 เกี่ยวข้องกับ # 4 ได้อย่างไร ทั้งคู่สามารถเชื่อมต่อกับ # 1 ได้อย่างง่ายดาย แต่ไม่สามารถเชื่อมต่อกันได้
มีชื่อ (Googlable) สำหรับข้อมูลหรือโครงสร้างประเภทนี้หรือไม่? ฉันกำลังมองหาอัลกอริทึมชนิดใด
เป้าหมาย:
เมื่อได้รับ 1,000 หัวข้อข่าวระบบที่แนะนำโดยอัตโนมัติว่ารายการทั้งห้านี้อาจเป็นเรื่องเดียวกัน
พูดตามตรงแล้วมันก็นานมากแล้วที่ฉันได้ตั้งโปรแกรมฉันกำลังสูญเสียวิธีที่จะพูดคุยปัญหานี้อย่างถูกต้อง (ฉันไม่รู้ว่าฉันไม่รู้อะไรถ้ามันสมเหตุสมผล)
นี่เป็นโครงการส่วนบุคคลและฉันกำลังเขียนใน Python ขอบคุณล่วงหน้าสำหรับความช่วยเหลือคำแนะนำและตัวชี้!