已采纳回答 / David
您好,取了top几个物品是由于有时效性,推荐过程中,我们不可能把用户去年操作过的物品也拿过来做itemcf。因为随着时间推移。可能早已经不喜欢之前的物品了。所以召回过程中考虑到这一点。谢谢。
2018-12-11
最赞回答 / qq_兜兜风_1
应该是ml-latest-small.zip,只有1M的这个文件,rating.csv里面的数据会有不同,应该是更新过,movies.csv文件的数据是一样的
2018-12-09
已采纳回答 / David
您好,我理解您所说的物品间相关性是稳定的是指的物品的属性计算,比如我们两个都是讲宫斗的电视剧,两个不同品牌但都是薯片的零食等等。我们这里cf得到的item sim矩阵是基于用户的行为来体现的。用户的兴趣会随时间变化。比如我一年之前喜欢篮球,我爱看科比。现在我喜欢综艺,我爱看爸爸去哪儿。这两个物品都被我行为过,如果不加时间衰减,那么我就给这俩物品的相似度计算过程中分子贡献1,如果算了时间衰减,也许我的贡献就是0.01.如果用户中存在很多这样的‘我’,不衰减岂不是 爸爸去哪儿 和科比成了很相似的。您理解一下看...
2018-10-28
讲师回答 / David
您好,是在recom_result 装载之前需要判断一下itemid_j 是否是tmp_dict的key。谢谢您的问题。原视频代码中好像这个地方有点问题。
2018-09-29