为了账号安全,请及时绑定邮箱和手机立即绑定

Python数据处理从零开始----第三章(pandas)⑤pandas与R

标签:
Python

Python数据处理从零开始----第四章(可视化)①③多变量绘图

  • 关联矩阵点图

科研工作中我们经常需要把每两个变量之间的关系计算, 然后可以得到一个相关矩阵。 如果两个变量的变化趋势一样, 那么这个值就会大于零, 表明连个变量正相关,值越大代表相关性越强。 相反的话,如果两个变量的变化趋势相反, 这个值就会小于零。我们经常需要关注这个值,是因为在许多机器学习算法中,强相关的变量会导致算法能力下降。

  • 1.导入数据

%clear
%reset -f# In[*]# 加载Python库import numpy as npfrom numpy import loadtxtimport xgboost as xgbfrom xgboost import XGBClassifierfrom matplotlib import pyplotimport osfrom sklearn.model_selection import train_test_splitimport pandas as pdimport numpy as np
os.chdir("D:\\train")# In[*]from matplotlib import pyplotfrom pandas import read_csv
filename = 'pima-indians-diabetes.csv'names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(filename, names=names)
  • 绘制相关关系图

correlations = data.corr()# plot correlation matrixfig = pyplot.figure()
ax = fig.add_subplot(111)
cax = ax.matshow(correlations, vmin=-1, vmax=1)
fig.colorbar(cax)
ticks = np.arange(0,9,1)
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.set_xticklabels(names)
ax.set_yticklabels(names)
pyplot.show()

webp


  1. 密度图

data.plot(kind='density', subplots=True, layout=(3,3), sharex=False)
pyplot.show()

webp

-4.散点图

from pandas.plotting import scatter_matrix
scatter_matrix(data)
pyplot.show()

webp



作者:夜神moon
链接:https://www.jianshu.com/p/19cb08c79589


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消