-
机器离线
学习
查看全部 -
常见算法:FP-Growth LDA 逻辑回归
Word2vector RF.GBDT
推荐算法
查看全部 -
概率论是基石, 统计学去找规律 传统的统计学,抽取一定量的样本然后 进行概率统计,然后得到结论 之后进行假设检验 传统的统计学受运算能力的限制,所以是用抽样的方式; 传统统计:抽样-描述统计-结论-假设检验-推断 求均值 统计学: 抽样, 求均值, 每次结果可能不一样 机器学习: 计算机运算能力已经提高, 可以进行直接运算, 不必抽样 做数据分析要对数据进行量化,才方便计算、比较。
查看全部 -
机器学习常见算法一览
查看全部 -
FP-Growth,关联分析Apriori的改进版,华人发明的。
逻辑回归,推荐,搜索结果的排序。
RF随机森林,梯度提升决策树GBDT,与AdaBoost都属于对决策树的改进。
LDA,文本分析,自然语言处理。
Word2Vector,文本挖掘,最终是一个结果。
HMM隐马尔可夫模型,CRF条件随机场,自然语言处理,文本挖掘。
查看全部 -
各种分类算法
查看全部 -
生成模型:不会明确的告诉结果Y,而是给出可能结果的概率
判别模型:给一个X,返回一个明确的Y。
查看全部 -
机器学习和数据分析的区别:
1)处理数据类型:行为数据(搜索历史、浏览历史等),交易数据(与钱相关,有用户订单,账单等)
2)数据量:海量数据,少量数据
3)分析方法:全量分析,采样分析
查看全部 -
生成模型,告诉你属于各个类的概率,判别模型,像法官直接告诉你结果,有罪还是无罪
查看全部 -
半监督学习,也叫强化学习
查看全部 -
无监督学习,聚类,就是把数据分成哪几类
查看全部 -
有监督学习,数据是有标签的,就是这些数据是什么类型的数据,有分类算法和回归算法等
查看全部 -
机器学习解决问题的框架
一、确定目标
业务需求
数据
特征工程(数据预处理,提取特征,很重要,影响最终产出)
二、训练模型
定义模型(参数)
定义损失函数(预测结果和真实结果之间的差异,关心的是绝对值或者平方等)
优化算法(为了让损失函数取最小)
三、模型评估
交叉验证
效果评估
查看全部 -
机器学习解决问题的框架
一、确定目标
业务需求
数据
特征工程(数据预处理,提取特征,很重要,影响最终产出)
查看全部 -
FP-Growth,关联分析Apriori的改进版,华人发明的。
逻辑回归,推荐,搜索结果的排序。
RF随机森林,梯度提升决策树GBDT,与AdaBoost都属于对决策树的改进。
LDA,文本分析,自然语言处理。
Wod2Vector,文本挖掘,最终是一个结果。
HMM隐马尔可夫模型,CRF条件随机场,自然语言处理,文本挖掘。
查看全部
举报