ชื่อของคำถามนี้เป็นคำถามแยกต่างหากสำหรับข้อความของมันดังนั้นฉันจะตอบทั้งสองอย่างแยกกัน
- ฉันจะอนุมานประโยคที่มองไม่เห็นได้อย่างไร:
# ... trained model stored in var model
list_of_words = ["this", "is", "a", "new","unseen", "sentence"]
inferred_embedding = model.infer_vector(list_of_words)
W∈RN×PD∈RM×Rk
1M∑i=1M1|Di|∑t=k|Di−1|−klog(p(wit|wit−k,...,wit+k,Di))
Diith|Di|wittthithD
WD
- เราสามารถอนุมานได้ว่าประโยคที่มองไม่เห็นอาจตรงกับประโยคในชุดการฝึกอบรมหรือไม่?
D
แม้การแก้ไขเมล็ดสุ่มอาจไม่ทำงานมีตัวแปรอื่น ๆ อีกมากมายที่สามารถส่งผลกระทบต่อการบรรจบกันของโปรดดูคำตอบแรกในhttps://github.com/RaRe-Technologies/gensim/issues/374
ไม่ว่าในกรณีใดคุณสามารถค้นหาป้ายกำกับที่คล้ายกันมากที่สุดในชุดข้อมูลของคุณเป็นประโยคที่อนุมานได้เพียงแค่วนซ้ำชุดฝึกอบรมของคุณและเปรียบเทียบความคล้ายคลึงกับเวกเตอร์ที่อนุมาน แต่ทำไมคุณถึงต้องการจับคู่แบบตรงกับบางอย่างในชุดฝึกอบรม นั่นคือสิ่งที่นิพจน์ทั่วไปมีไว้เพื่อจุดประสงค์ในการฝังเอกสารเหล่านี้สำหรับงานการเรียนรู้แบบมีผู้สอนหรือไม่มีผู้ดูแล (เช่นการจำแนกและการจัดกลุ่ม)