一、 数据集
Iris(鸢尾花)数据集是多重变量分析的数据集。
数据集包含150行数据,分为3类,每类50行数据。
每行数据包含4个属性:Sepal Length(花萼长度)、Sepal Width(花萼宽度)、Petal Length(花瓣长度)和Petal Width(花瓣宽度)。可通过这4个属性预测鸢尾花卉属于三个种类(Setosa,Versicolour,Virginica)中的哪一类。
样本数据局部截图:
Iris.png
完整的样本数据请自行下载Iris.csv
二、算法代码
from sklearn.tree import DecisionTreeClassifierfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import accuracy_score iris = datasets.load_iris() iris_feature = iris.data iris_target = iris.target feature_train, feature_test, target_train, target_test = train_test_split(iris_feature, iris_target, test_size=0.33, random_state=56) dt_model = DecisionTreeClassifier() dt_model.fit(feature_train, target_train) predict_results = dt_model.predict(feature_test) scores = dt_model.score(feature_test, target_test)print (predict_results)print (target_test)print (accuracy_score(predict_results, target_test))print (scores)
运行结果:
[2 1 2 2 2 2 2 0 0 2 1 0 0 0 2 0 0 0 2 1 0 2 1 1 0 2 2 1 1 1 2 2 2 0 0 0 2 2 2 0 1 2 2 2 1 1 2 2 1 0] [2 1 1 2 2 2 2 0 0 2 1 0 0 0 1 0 0 0 2 1 0 2 1 1 0 2 2 1 1 1 2 2 1 0 0 0 2 2 2 0 1 2 2 1 1 1 2 2 1 0]0.920.92
作者:海天一树X
链接:https://www.jianshu.com/p/c09beac9f955
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦