2 回答
TA贡献1911条经验 获得超7个赞
在accuracy()
一个方法gensim
字向量模型(现在的冷遇相比evaluate_word_analogies()
)不会把你的文本输入-它需要的字,类推挑战专门格式的文件。这个文件通常被命名为questions-words.txt
.
这是一种测试通用词向量的流行方法,可以追溯到 Google 的原始 Word2Vec 论文和代码发布。
但是,此评估不一定表明哪些词向量最适合您的需求。(例如,一组词向量可能在这些类比上得分更高,但对于特定分类或信息检索目标则更糟。)
为了您自己的目的的良好向量,您应该设计一些特定于任务的评估,它给出与您的最终目标的成功相关的分数。
另请注意,作为无监督算法,词向量不一定需要保留测试集才能进行评估。您通常希望使用尽可能多的数据来训练词向量——确保最大的词汇覆盖率,每个词的示例最多。然后,您可能会根据某个外部标准测试词向量——比如类比问题,它们根本不是训练集的一部分。
或者,您只需将词向量用作您正在测试的某些下游任务的附加输入,并且在该下游任务中,您将保留用于训练某些监督算法的测试集。这确保您的监督方法不仅仅是记住/过度拟合标记的输入,并且为您提供关于该词向量集是否有助于下游任务的间接质量信号。(而且,该词向量集可以根据它们对其他监督任务的帮助程度与其他词向量集进行比较,而不是与它们自己相同的无监督训练步骤进行比较。)
TA贡献1884条经验 获得超4个赞
Gensim 具有用于测试数据的各种其他指标,使用它们,您可能可以在几行代码中定义自己的函数。例如,除了models.wv.analogy()
和evaluate_word_analogies
,也有类似的功能evaluate_word_pairs
,closer_than()
,distance()
,most_similar()
等(请参阅该文档的models.keyedvector
更多细节。)这些功能,也许单独或作为更大的功能部分用来评估你的话的嵌入。希望这可以帮助!
添加回答
举报