-
模型评估
#模型训练之全数据集
from sklearn.neighbors import KNeighborsClassifier
knn_1 = KNeighborsClassifier(n_neighbors=1)
knn_1.fit(X,y)
y1_pre = knn_1.predict(X)
print(y1_pre.shape)
#模型评估之准确率
from sklearn.metrics import accuracy_score
print(accuracy_score(y,y1_pre))
查看全部 -
sklearn建模四步骤
调用需要使用的模型类
模型初始化(创建一个实例)
模型训练
模型预测
from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target
print(X.shape)
print(y.shape)
knn_1 = KNeighborsClassifier(n_neighbors=1)
knn_1.fit(X,y)
knn_1.predict([[1,2,3,4]])
查看全部 -
iris数据加载
from sklearn import datasets
iris = datasets.load_iris()
数据展示
iris.data
iris.feature_name
iris.target
iris.target_name
确认数据类型与数据维度
print(type(iris.data))
print(type(iris.target))
print(iris.data.shape)
print(iris.target.shape
查看全部 -
装python,记得勾选add to path
安装anaconda
在anaconda中新建开发环境并安装numpy,sklearn
1)conda create -n sklearn
2)conda install numpy
3)conda install scikit-learn
在新开发环境中安装jupyter notebook并优化界面(使用github中的一个开源库)
查看全部 -
安装python记得勾选add to path,不然后面要自己改环境变量
查看全部 -
jupyter notebook的特点
查看全部 -
sklearn针对机器学习一款开源框架
查看全部 -
机器学习的主要类别:
监督式学习(有标签数据,数据有对应的正确答案,比如垃圾邮件你检测)
非监督式学习(有一种优化准则,一般是自动聚类,自动推荐)
强化学习
查看全部 -
人工智能,机器学习与深度学习的关系
机器学习是实现人工智能的一种方法
深度学习是实现机器学习的一种技术
此处还需要一个通俗的额例子
查看全部 -
#在一定范围内寻求最优解
k_range = list(range(1,26))
#print(k_range)
scores_train = []
scores_test = []
for k in k_range:
knn = KNeighborsClassifier(n_neighbors=k)
knn.fit(X_train,y_train)
y_train_pred = knn.predict(X_train)
y_test_pred = knn.predict(X_test)
scores_train.append(accuracy_score(y_train,y_train_pred))
scores_test.append(accuracy_score(y_test,y_test_pred))
for k in k_range:
print(k,scores_train[k-1])
查看全部 -
数据分离
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.5)
查看全部 -
import matplotlib.pyplot as plt
#在该界面展示
%matplotlib inline
plt.plot(k_range,score_train)
plt.xlabe('K(KNN mode)')
plt.ylable('Training Accuracy')
K越小复杂度越高,所以K=1时训练集的准确率是1
查看全部 -
开发环境部署
查看全部 -
机器学习的基本原理
查看全部 -
机器学习的基本原理
查看全部
举报