为了账号安全,请及时绑定邮箱和手机立即绑定

如何合并两个 Word2Vec 文件

如何合并两个 Word2Vec 文件

蝴蝶刀刀 2021-10-19 10:23:38
我使用 Word2Vec 创建了我的模型。但结果并不好。所以我想补充一句。我第一次创建的代码Creation是可以的,但是不能添加。请告诉我如何添加。createModel.pytoken = loadCsv("test_data")embeddingmodel = []for i in range(len(token)):temp_embeddingmodel = []for k in range(len(token[i][0])):    temp_embeddingmodel.append(token[i][0][k])embeddingmodel.append(temp_embeddingmodel)embedding = Word2Vec(embeddingmodel, size=300, window=5, min_count=3, iter=100, sg=1,workers=4, max_vocab_size = 360000000)embedding.save('post.embedding')loadWord2Vec.pytokens = W2V.tokenize(sentence)embedding = Convert2Vec('Data/post.embedding', tokens)zero_pad = W2V.Zero_padding(embedding, Batch_size, Maxseq_length, Vector_size)告诉我如何添加或合并 Word2Vec 的结果
查看完整描述

1 回答

?
跃然一笑

TA贡献1826条经验 获得超6个赞

没有简单的方法来合并两个Word2Vec模型。

只有一起训练的词向量“在同一空间中”,因此具有可比性。

最好的策略是组合两个文本训练语料库,并在组合数据上训练一个新模型,从而从同一训练会话中获得所有单词的词向量。


查看完整回答
反对 回复 2021-10-19
  • 1 回答
  • 0 关注
  • 207 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信