-
《集体编程智慧》
周志华的《机器学习》
查看全部 -
Python机器学习影印版,东南大学出版社
斯坦福公开课机器学习,在网易公开课上可以找到
《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C++》、《数据结构》等
查看全部 -
常见算法查看全部
-
生成模型:%属于A类,%属于B类,%属于C类
判别模型:属于A/B/C类
查看全部 -
机器学习解决问题的框架:
二、训练模型
STEP1:定义模型(形成目标公式)
STEP2:定义损失函数(数学的方式定义预测值与现实值的差异)
STEP3:优化算法(寻找确定损失函数极小值)
三、模型评估(标准)
STEP1:交叉验证
STEP2:效果评估
查看全部 -
机器学习解决问题的框架:
一、目标的确立STEP1:确定目标(业务需求)
STEP2:收集(历史)数据,决定项目质量高度
STEP3:特征工程(清理整合数据,提取特征)结构化,时间占比70%
查看全部 -
机器学习常见算法:
决策树算法(有监督):解决分类、回归问题;C4.5、kNN(不常用)
聚类:K-Means算法(无监督)
统计学习:SVM算法
关联分析及规则:Apriori(淘汰)——需多次扫描庞大数据库
FP-Growth——仅需两次扫描数据库
链接挖掘:PageRank算法(Google)
集装与推进:AdaBoost(人脸识别)(决策树改进版,有监督学习)(本质上解决分类问题)
逻辑回归:google、百度搜索结果排
推荐算法:产品推荐等
文本分析&挖掘、自然语言处理:LDA、Word2Vector、HMM、CRF
深度学习:图像识别
查看全部 -
机器学习算法分类:
一、算法分类(1)
有监督学习
无监督学习
半监督学习
算法分类(2)(根据解决的问题类型)
1、分类与回归
2、聚类
3、标注(打标签)
算法分类(3)(算法本质)
1、生成模型(进行数据应属类别的概率统计)
2、判别模型(直接进行数据分类)
查看全部 -
二、解决业务问题不同
机器学习:预测未来事件(未来趋势)
数据分析:报告过去事件(历史总结)
三、技术手段、方法不同
机器学习:数据挖掘;数据(算法)驱动;规模大
数据分析:OLAP;用户驱动(企业数据分析师的经验等);规模小;交互式分析
缺点:受限于分析师的经验,分类的多样化受限制
四、参与(驱动)者不同
机器学习:数据+算法,数据质量决定结果
数据分析:数据分析师,能力&经验决定结果
五、服务用户不同
机器学习:个体用户
数据分析:公司高层
查看全部 -
机器学习和数据分析的区别:
一、数据特点不同(数据类别、数据量、数据分析方法)
机器学习:行为数据(如搜索历史、浏览历史、点击历史、评论等);海量分析,一致性要求相对不高;全量分析
数据分析:交易数据(与钱相关,如用户订单、存取款账单、话费账单等)少量数据,一致性要求严格(如银行存取款,数据精准);采样分析
查看全部 -
机器学习两种使用场景 离线学习和在线学习。
离线学习:批处理的方式,对以前的数据进行学习,从而运用到后面的指导中
在线学习:对实时产生的数据进行学习,再对实时得业务进行指导
查看全部 -
利用模型去拟合规律
查看全部 -
利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景得决策
例如预测天气 公司业绩
查看全部 -
机器学习的典型应用:自然语言处理 情感分析 实体识别
图像识别 深度学习
更多应用 : 语音识别 个性化医疗 情感分析 人脸识别 自动驾驶 智慧型机器人 私人虚拟助理 手势控制 视频内容自动识别
查看全部 -
机器学习的典型应用:互联网广告 ctr预估
推荐系统 协同过滤
查看全部
举报