已解决430363个问题，去搜搜看，总会有你想问的

向量化新的文本数据

首页猿问向量化新的文本数据

向量化新的文本数据

Python

撒科打诨 2021-11-09 20:45:51

我已经Word2vec在“棕色语料库”上训练了一个模型。我想将矢量化的单词应用于一个新的文本文档，然后我想通过方式将其句子聚类Affinity Propagation。import gensimimport nltkfrom nltk.corpus import brownsentences = brown.sents()model = gensim.models.Word2Vec(sentences, min_count=1)model.save('brown_model')model = gensim.models.Word2Vec.load('brown_model')我的文本文档包含一个请求列表，例如："I want to go to the store""I want the president to help me""Clean up my house"我的问题是：我如何将矢量化Brown corpus应用于我自己的文本数据以进行后续聚类？

查看完整描述

1 回答

守候你守候我

TA贡献1802条经验获得超10个赞

如果我理解得很好，后续聚类目的的问题可以解决如下：

words = set(brown.words())

print (len(words))

...

word_presented = words.intersection(model.vocab.keys())

看看这篇文章

反对回复 2021-11-09

1 回答
0 关注
206 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

向量化新的文本数据

向量化新的文本数据

1 回答

添加回答