为了账号安全,请及时绑定邮箱和手机立即绑定

如何在网页上训练我自己的自定义词嵌入?

如何在网页上训练我自己的自定义词嵌入?

白猪掌柜的 2021-10-19 10:35:38
我在多个网页上有大量关于我有兴趣出售给客户的产品的文本数据。我尝试使用在 Wikipedia 上训练的预训练 fasttext 词嵌入,但它没有给我分类任务的好结果。可能是因为网站上的文本数据包含很多技术细节,与维基百科中的文本数据不同。所以我想做一些词嵌入的迁移学习,以预训练的 fasttext 词嵌入为基础。如何使用 Keras 在这些网页上训练我自己的自定义词嵌入?如何使用 fasttext 预训练嵌入和训练初始化自定义词嵌入?这种初始化真的有助于提供更好的词嵌入吗?我更喜欢使用 Keras 来训练词嵌入的解决方案。我知道 Embedding 有 trainable=True 选项不知道如何使用它。Embedding(voc_size, emb_dim, weights=[embedding_matrix], input_length, trainable=True)为这个 Keras 或 Gensim 推荐哪个框架,为什么?
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 216 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号