现在我有这样的需求..不知道怎么实现.当网络编辑在录入文章时.. 我需要从标题提取二个重要的词.从正文中提取出现5个频率最高的词(不是一个单词.而是两个以上,因为一篇文章中"的"这个字是出现次数是最高的)... 也就是找大概7个词作为TAG用... 各位教教我.. 再三感谢,
2 回答
www说
TA贡献1775条经验 获得超8个赞
这个好像很困难,我觉得让编辑在录入时将关键词一并录入的好,我工的随便一选都是比较准确的
而让程序来选关键词,很难。首先得分词,可以看下有关搜索引擎的资料,分词完了之后还要比较各个词的频率和相似度,还要排除一些常见词,比如你说的那个“的”等……
总之很麻烦,计算机无法完全代替人工
- 2 回答
- 0 关注
- 841 浏览
添加回答
举报
0/150
提交
取消