-
Iris数据集
查看全部 -
开发环境部署步骤
查看全部 -
环境安装:
查看全部 -
非监督学习
查看全部 -
基本原理:
查看全部 -
22222
查看全部 -
111111
查看全部 -
就截个图吧
查看全部 -
import pandas as pd
path = 'data/pima-indians-diabetes.csv'
pima=pd.read_csv(path)
pima.head()
#X,y赋值
feature_name=['pregnant','insulin','bmi';age']
X = pima[feature_names]
y =pima.label
#确认维度
print(X.shape)
print(y.shape)
#数据分离
from sklearn.model_selection import train_test_split
X_trian,X_test,y_train,y_test = train_test_split(X,y,random_state=0)
#模型训练
from sklearn.linear_model import logisticregression
logReg = logisticRegression()
logReg.fit(X_train,y_train)
y_pred = logReg.predict(X_test)
from sklearn import metric
print("metrics.accuracy_score(y_test,y_pred)
##确认正负样本的数据量以及空准确率
y_test.value_counts()
y_test.mean()
1-y_test.mean()
max(y_test.mean(),1-y_test.mean())
#展示部分书记结果与预测结果
print(y_test.value[0:25]
pritn(y_pred[0:25]
#计算并展示混淆矩阵
confusion = metrics.confusion_metrix(y_test,y_pred)
#四个因子赋值
TN = confusion[0][0]
FP = confusion[0][1]
FN = confusion[1][0]
TP = confusion[1][1]
#指标计算
accuracy = (TP+TN)/(TP+TN+FP+FN)
mis_rate =(FP+FN)/(TP+TN+FP+FN)
recall =TP/(TP+FN)
specificity =TN(TN+FP)
precision = TP/(TP+FP)
f1_score = 2*precison*recall/(precision+recall)
查看全部 -
匹马印第安人数据集
数据来源:
Pima Indians Diabetes dataset
查看全部 -
混淆矩阵的应用举例
查看全部 -
混淆矩阵的指标
查看全部 -
混淆矩阵的定义
查看全部 -
使用准确率进行模型评估的局限性
不能体系那数据的实际分布情况
没有体现模型错误预测的类型
空准确率的概念
查看全部 -
逻辑回归模型
准确率进行模型评估有其局限性,只能看到整体,而不知细节。
比如1000个数据(900个1,100个0),全部预测为1 ,整体准确率是90%,而实际上0全部预测为1,错误率100%,而1的准确率是100%
逻辑回归模型主要应用场景就是二分类问题:比如是不是垃圾邮件,是猫还是狗
神经网络模型也是基于此原理实现的
查看全部
举报