ฉันมีชุดข้อมูลขนาดใหญ่ของต้นไม้และฉันต้องการค้นหาโดยระบุtreelet (กราฟย่อยที่เชื่อมต่อ) แบบสอบถามควรส่งคืนการเกิดทั้งหมดของ treelet ในชุดข้อมูล
มีอัลกอริทึมที่มีประสิทธิภาพในการทำเช่นนั้นหรือไม่?
ฉันกำลังคิดถึงบางสิ่งเช่นอาร์เรย์ต่อท้ายอย่างไรก็ตามการเข้ารหัสต้นไม้อย่างไร้เดียงสาเป็นสตริง (โดยการเรียงลำดับการส่งผ่านโหนดคงที่) จะไม่ทำงานเนื่องจากการค้นหา Treelet อาจมีรูปร่างที่ไม่เจาะจง
UPDATE:
รายละเอียดบางอย่างเกี่ยวกับอินสแตนซ์ทั่วไปที่ฉันคาดหวัง:
ชุดข้อมูลจะประกอบด้วยต้นไม้อย่างน้อยหลายหมื่นต้นแต่ละชุดประกอบด้วยโหนดประมาณยี่สิบถึงสามสิบ ต้นไม้จะไม่ได้เป็นแบบไบนารี แต่จำนวนเด็กทั่วไปต่อโหนดจะมีขนาดเล็ก (โดยปกติจะไม่ใหญ่กว่าสี่หรือห้าแม้ว่าในบางกรณีที่เลวร้ายก็สามารถเข้าถึงประมาณสามสิบ) จำนวนฉลากจะอยู่ในหลักหมื่น
ฉันต้องการสิ่งนั้นสำหรับแอปพลิเคชัน NLP: ต้นไม้แต่ละต้นจะแยกการพึ่งพาของประโยคแต่ละโหนดแสดงคำที่เกิดขึ้นซ้ำและแต่ละคำมีคำในพจนานุกรม (มีการตกแต่งบางอย่าง)