我已经Word2vec在“棕色语料库”上训练了一个模型。我想将矢量化的单词应用于一个新的文本文档,然后我想通过方式将其句子聚类Affinity Propagation。import gensimimport nltkfrom nltk.corpus import brownsentences = brown.sents()model = gensim.models.Word2Vec(sentences, min_count=1)model.save('brown_model')model = gensim.models.Word2Vec.load('brown_model')我的文本文档包含一个请求列表,例如:"I want to go to the store""I want the president to help me""Clean up my house"我的问题是:我如何将矢量化Brown corpus应用于我自己的文本数据以进行后续聚类?
1 回答

守候你守候我
TA贡献1802条经验 获得超10个赞
如果我理解得很好,后续聚类目的的问题可以解决如下:
words = set(brown.words())
print (len(words))
...
word_presented = words.intersection(model.vocab.keys())
看看这篇文章
添加回答
举报
0/150
提交
取消