现在要做的项目里也会有问答模块,所以参考了一下百度知道,发现它有个“其他类似问题”,不明白百度是通过什么算法来找出类似问题的,求思路……
2 回答
慕虎7371278
TA贡献1802条经验 获得超4个赞
说下我的思路吧
1 提问通常都是会分类,所以第一次就可以大致确定,所提出的问题属于哪一类,
2 提取问题关键字 比如 "C#如何使用反射" 通过算法去除不相关字段“如何” "使用",最后只留下 "C# 反射" 再根据这个关键词去已有题库中去匹配这样得到的结果都是与提出的问题相关的贴子了。 这里有难度的就是提取关键字的算法了。
添加回答
举报
0/150
提交
取消