-
先有一个业务需求,然后是数据收集,最后是特征工程,特征工程工作量大概占70%(数据转换和数据清洗),相对于算法提升更容易提高最后成果的质量
查看全部 -
机器学习:数据质量决定结果,不同算法不会造成太大的偏差,目标用户是个体客户。
数据分析:数据分析师的能力及经验决定质量,目标用户是公司高层。
查看全部 -
什么是机器学习查看全部
-
常见算法一览
查看全部 -
常见算法列表
查看全部 -
在线机器学习
查看全部 -
特征工程:将文字文本图片转化为向量形式
特征工程转化之后,做聚类
查看全部 -
数据挖掘:关联规则(关联算法)
案例:啤酒+纸尿裤
查看全部 -
1. 机器学习的典型应用
关联规则(啤酒+尿片)
聚类(全球通,动感地带,神州行)
朴素贝叶斯(垃圾邮件)
决策树(信用卡欺诈)
CTR 预估(互联网广告)
协同过滤(推荐系统)
自然语言处理(情感分析,实体识别)
图像识别(深度学习)
更多应用……
2. 数据分析和机器学习的区别
(1) 从数据角度
交易数据 vs 行为数据
交易数据:银行存取款账单;电商用户订单;电信运营商花费账单
行为数据:搜索历史,点击历史,浏览历史,评论……
少量数据 vs 海量数据
采样分析 vs 全量分析
(2) 从解决业务问题角度
报告过去的事情 vs 预测未来的事情
(3) 从技术手段角度
用户驱动,交互式分析 vs 数据驱动,自动进行知识发现
(4) 从参与者角度
分析师 vs 数据+算法
3. 机器学习算法分类
分类一
监督学习:分类算法(Y类:垃圾邮件,Y值已知;X类:正常邮件),回归算法
无监督学习:聚类(Y值未知)
半监督学习:小孩子学走路(Y值逐渐强化)
分类二:
分类与回归
聚类
标注:我在 努力地(副词)学习(动词)《机器学习》(名词)
分类三(重要):
生成模型
判别模型
查看全部 -
机器学习找规律查看全部
-
机器学习定义:
利用计算机从历史数据钟找出规律,并把这些规律用到对未来不确定场景的决策。
查看全部 -
分类算法同时也是回归算法?
!!SVM算法
AdaBoost
Naive Bayes
查看全部 -
机器学习常见算法:
查看全部 -
算法分类:有没有Y值
有监督学习:(有)训练数据被提前打好了标签。典型的就有分类算法和回归算法。
无监督学习:(没有)聚类算法。
半监督学习 :强化学习。
算法分类:根据要解决的问题进行分类。
分类与回归
聚类
标注
算法分类:算法的本质分类。
生成模型
判别模型
查看全部 -
机器学习解决问题的框架:
训练模型:定义模型、定义损失函数、优化算法、模型评估、效果评估
查看全部
举报