-
map-reduce
查看全部 -
mapreduce
查看全部 -
这是一个笔记
查看全部 -
mapreduce
查看全部 -
数据经过Map端输入后会进行网络混写,经过Shuffle后进入Reduce,在大数据量的情况下可能会造成巨大的网络开销。故可以在本地先按照key先行一轮排序与合并,再进行网络混洗,这个过程就是Combine。
查看全部 -
多维向量的余弦相似度:
查看全部 -
HDFS架构图
DataNode:数据节点,作用(存放文件和文件的副本,最小存储单元是块(Block) 64MB)
NameNode:名称节点,存放的数据分2个部分,1个是块信息,起到地址映射的作用,能让NameNode快速定位到某个文件的位置
Secondary NameNode:辅助名称节点;在NameNode运行时,辅助名称节点会通过镜像文件和变更日志,备份NameNode原数据,若NameNode挂了,可通过Secondary NameNode备份的原数据进行恢复
查看全部 -
HDFS。
查看全部 -
基于内容的推荐算法
步骤:
查看全部 -
基于内容的推荐算法
算法思想:给用户推荐和他们之前喜欢的物品在内容上相似的其他物品
查看全部 -
基于用户的协同过滤推荐算法
步骤:
查看全部 -
基于用户的协同过滤推荐算法
算法思想:给用户推荐和他兴趣相似的其他用户喜欢的物品
查看全部 -
基于物品的推荐算法
Map Reduce步骤:
查看全部 -
基于物品的协同过滤推荐算法
步骤:
1、根据用户行为列表计算用户、物品的评分矩阵
2、根据用户、物品的评分矩阵计算物品与物品的相似度矩阵
3、相似度矩阵 x 评分矩阵 = 推荐列表
4、将推荐列表与评分矩阵进行比较,在推荐列表中置零已经评过分的物品,剩下的数据就是要给客户推荐结果
查看全部 -
基于物品的协同过滤推荐算法
算法思想:给用户推荐那些和他们之前喜欢的物品相似的物品
查看全部
举报