-
机器学习领域查看全部
-
机器学习,预测问题(类别-离散 ,数值 -连续),聚类问题 确定目标:业务需求,数据,特征工程(数据预处理,提取特征 70%-数据的提取非常重要),数据可以直接就喂给算法,数据对模型的影响非常大,数据决定了最终的预测结果查看全部
-
TP-Growth,只需要对数据库进行两次访问,属于关联分析(Apriori 目前普遍不适用) AdaBoost, 人脸识别问题主要应用 逻辑回归:搜索排序 RF、GBDT: (RF)随机森林 推荐算法:电商网站主要使用对用户进行推荐 LDA:文本分析 Word2Vector:谷歌,文本挖掘 HMM 、CRF:文本挖掘 深度学习:图象识别查看全部
-
机器学习算法分类: 算法分类 -----有监督学习(分类算法、回归算法),无监督学习(训练数据没有y值-聚类),半监督学习(强化学习,随样本增多数据结果越理想) -----分类与回归 聚类 标注(文本切词,给每一个文本添加标签) ------生成模型 判别模型————重点 -------------主要用于分类问题,生成模型用于解决分类问题的概率,判别模型直接出----------------结果非1即2查看全部
-
自然语言处理(情感分析,实体识别) 图像识别——深度学习,根据图片解析图片的内容查看全部
-
互联网广告——ctr预估,用户点击率的评估,线性的逻辑回归 推荐系统——协同过滤查看全部
-
用户细分精准营销 ——聚类,全是有计算机进行的分类查看全部
-
训练模型 定义模型 定义损失函数(定义偏差的大小):评价真实结果与模型的预测结果的相似程度和差异度 优化算法 模型评估 交叉验证 效果评估查看全部
-
机器学习解决问题的框架 确定目标 业务需求 数据 特征工程(最重要的,数据提取,清洗等)查看全部
-
Apriori濒临淘汰的算法查看全部
-
机器学习算法一览查看全部
-
机器学习算法分类 一、有监督学习(已经打上标签了,即Y已知了) 无监督学习(聚类) 半监督学习(强化学习) 二、分类与回归 聚类 标注(有点像分类,给元素打标签) 三、生成模型 判别模型查看全部
-
机器学习和数据分析的区别 行为数据vs交易数据 海量数据vs少量数据 全量分析vs采样分析 NoSQL:not only SQL NoSQL可用来处理行为数据,分布式数据库查看全部
-
典型应用-互联网广告(如百度广告) ctr预估 线性逻辑回归 -推荐系统 协同过滤查看全部
-
典型应用-信用卡欺诈,决策树查看全部
举报
0/150
提交
取消