-
课程小结查看全部
-
Demo-胺片按色彩聚类 k-means聚类查看全部
-
机器学习常见算法(2)著名算法 1.FP-Growth---关联分析方法Apriori的改进。 2.逻辑回归---应用非常多,多用于百度、Google搜索结果的排序。 3.RF(随机森林)、GBDT---和AdaBoost类似,都属于决策树算法。 4.推荐算法---电商标配 5.LDA---用于文本分析、自然语言处理。有一定的难度。 6.Word2Vector---google出品,耳熟能详,用于文本挖掘。 7.HMM(隐马尔科夫)、CRF(条件分析)---文本挖掘。 8.深度学习---目前最火的算法查看全部
-
机器学习常见算法(1)ICDM 1.分类---C4.5使用决策树算法,可以解决【分类】&【回归】问题; 2.聚类---K-Means算法,属于无监督方法,解决电信用户分类问题; 3.统计学习---SVM(支持向量机)可以解决分类(主)和回归问题,有很好的表现和深厚的数学理论支撑,曾经被认为是最好的分类算法。现在光芒被【深度学习】掩盖了。有一定的数学门槛,面试中经常被问。 4.关联分析---Apriori应用于“尿片和纸尿裤”案例,最早解决了频繁项集问题。由于需要频繁访问数据库,已被淘汰。取代它的是华人开的【FP-Growth】算法。应用:电商的推荐系统,但目前有更好的替代方法。 5.统计分析---EM算法是一个算法框架,用于解决一系列问题。 6.连接挖掘---PageRank。Google使用的网页排序算法,很著名。 7.集装与推进---AdaBoosts算法,应用于人脸识别,本质为改进的决策树算法,属于有监督的分类算法。 8.分类---kNN。相对简单的分类算法,有监督。 9.分类---Naive Bayes朴素贝叶斯算法,用于识别垃圾邮件。 目前不常用的算法:Apriori和CART。查看全部
-
机器学习算法分类(3)——按算法的本质【重要!!】 生成模型---给出属于A/B/C类的概率,类似陪审团; 判别模型---通过给定函数判断Y/N,类似大法官裁决;查看全部
-
机器学习算法分类(2)——按要解决的问题 分类与回归 聚类 标注---打标签查看全部
-
机器学习算法分类(1)——按数据情况:Y有没有确定 有监督学习---已知分类(标签)---分类,回归 无监督学习---未知分类(无标签)---聚类 半监督学习---强化学习,随着样本数据量上升,分类标准清晰查看全部
-
机器学习和数据分析的区别 - 目标用户不同 1.数据分析 - 公司高层。主要目标是供领导层决策。 2.机器学习 - 用户个体查看全部
-
机器学习和数据分析的区别 - 参与者不同 1.数据分析 - 公司的数据分析师。分析师能力决定结果。 2.机器学习 - 数据 + 算法查看全部
-
机器学习和数据分析的区别 - 技术手段不同 数据分析(OLAP,联机分析)-用户(数据分析师)驱动,交互式分析。 机器学习-数据+算法驱动,自动进行识别。查看全部
-
机器学习和数据分析的区别 - 解决的问题不同 数据分析 - 侧重历史的总结; 机器学习 - 侧重未来的预测;查看全部
-
机器学习和数据分析的区别 数据分析:交易数据、少量数据、采样分析。对数据一致性要求严格,使用关系型数据库sql serve、mysql、oracle。 机器学习:行为数据、海量数据、全量分析。需要保证数据吞吐量,数据一致性可以打折扣,所以用NoSQL数据库(MongoDB、nosql)和分布式数据分析平台(Hadoop、Spark)。查看全部
-
NoSQL数据库只能用来处理【行为数据】,在保证吞吐量的前提下,会对数据的一致性打一定的折扣。查看全部
-
机器学习使用 - 行为数据(互联网公司)查看全部
-
数据分析使用 交易数据查看全部
举报
0/150
提交
取消