-
用所有的数据进行训练可能会适得其反,不仅模型复杂化,且准确度不一定更高
评估思想:将训练数据和测试数据分离
判断模型的准确率:比较预测结果和实际结果,正解的比例占到多少
from sklearn.metrics import accuracy_scoreprint(accuracy_score(y,y_pred))
查看全部 -
分类问题场景:垃圾邮件、三类或两类以下的品种的分类
分类算法:K近邻、逻辑回归、决策树、朴素贝叶斯
调用KNN模型:from sklearn.neighbors import KNeighborsclassifier
创建一个KNN模型实例knn = KNeighborsClassifier(n_neighbors=1)
模型训练(学习):knn.fit(X,y)
模型预测:knn.predict([[1,2,3,4]])
)
查看全部 -
加载数据集:from sklearn import datasets
加载数据集中的iris:iris = datasets.load_iris()
查看全部 -
为什么不能自动保存。。。。
查看全部 -
scikit-learn 是python 专门针对机器学习的开源框架
jupyter notebook 是基于web的应用程序,可视化强,可单独测试某个代码块
查看全部 -
监督式学习:有固定结果
非监督式学习:无固定结果
查看全部 -
绘制图表,进行数据可视化
pandas:基础数据分析套件
scikit-learn:强大的数据分析建模库
keras:人工神经网络
查看全部 -
好先进查看全部
-
监督式学习
非监督式学习
强化学习
查看全部 -
python安装
3.7.4最新版本
anaconda
Anaconda Distribution
查看全部 -
安装python
安装Anaconda
新建开发环境,安装numpy,scikit-learn库
新建开发环境conda create -n env_name
安装numpy库pip(conda) install package_name
Jupyter notebook界面优化
https://github.com/dunovank/jupyter-themes
界面设置
jt -t oceans16 -f fira -fs 17 -cellw 90% -ofs 14 -dfs 14 -T
查看全部 -
Jupyter notebook
开源的web应用程序,旨在方便开发者创建和共享代码文档。用户可以在里面写代码,运行代码,查看结果,并在其中可视化数据
特点:
允许把代码写入独立的cell中,然后单独执行。用户可以在测试项目时单独测试特定代码块,无需从头开始执行代码
基于web进行交互开发,非常方便
查看全部 -
Scikit-learn
Python语言中专门针对机器学习应用而发展起来的一款开源框架(算法库),可以实现数据预处理,分类,回归,降维,模型选择等常用的机器学习算法
特点:
集成了机器学习中各类成熟的算法,容易安装和使用,样例丰富,教程和文档也非常详细
不支持Python外的语言,不支持深度学习和强化学习
https://scikit-learn.org/stable/
查看全部 -
面向过程:所有的过程全部走一遍 面向对象:每一部分模块化调用
查看全部 -
准确率 (TP+TN)/(TP+TN+FP+FN)
错误率 (FP+FN)/(TP+TN+FP+FN)
召回率 TP/(TP+FN)
特异度 TN/(TN+FP)
精确率 TP/(TP+FP)
F1分数 2*精确率*召回率/(精确率+召回率)
查看全部
举报