ผมพยายามที่จะโหลด fastText รุ่น pretrained จากที่นี่รุ่น Fasttext ฉันใช้wiki.simple.en
from gensim.models.keyedvectors import KeyedVectors
word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True)
แต่มันแสดงข้อผิดพลาดดังต่อไปนี้
Traceback (most recent call last):
File "nltk_check.py", line 28, in <module>
word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True)
File "P:\major_project\venv\lib\sitepackages\gensim\models\keyedvectors.py",line 206, in load_word2vec_format
header = utils.to_unicode(fin.readline(), encoding=encoding)
File "P:\major_project\venv\lib\site-packages\gensim\utils.py", line 235, in any2unicode
return unicode(text, encoding, errors=errors)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 0: invalid start byte
คำถามที่ 1ฉันจะโหลดโมเดล fasttext ด้วย Gensim ได้อย่างไร
คำถามที่ 2นอกจากนี้หลังจากโหลดแบบจำลองฉันต้องการค้นหาความคล้ายคลึงกันระหว่างสองคำ
model.find_similarity('teacher', 'teaches')
# Something like this
Output : 0.99
ฉันจะทำสิ่งนี้ได้อย่างไร
DeprecationWarning: Call to deprecated `load_fasttext_format` (use load_facebook_vectors
ฉันได้รับ ดังนั้นฉันจึงใช้from gensim.models.fasttext import load_facebook_model