首页手记 Python数据处理从零开始----第四章（可视化）(...

Python数据处理从零开始----第四章（可视化）(9)线性相关曲线

标签：

Python

通过python我们可以绘制两个变量的相关图，我所使用的是皮尔森相关，主要的参数是：①r相关系数②P值。一般对P值的评判标准是P< 0.05

简单的相关系数的分类
0.8-1.0 极强相关
0.6-0.8 强相关
0.4-0.6 中等程度相关
0.2-0.4 弱相关
0.0-0.2 极弱相关或无相关
r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间，若r>0，表明两个变量是正相关，即一个变量的值越大，另一个变量的值也会越大；若r<0，表明两个变量是负相关，即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强，要注意的是这里并不存在因果关系。

基础拟合曲线绘制

# -*- coding: utf-8 -*-"""
Created on Mon Nov 19 00:57:53 2018

@author: czh
"""# In[*]#导入各种需要的包#import numpy as npimport matplotlib.pyplot as pltfrom scipy import optimizeimport seaborn as sns
sns.set()# In[*]import seaborn as sns
sns.set(style="darkgrid")

tips = sns.load_dataset("tips")
g = sns.jointplot("total_bill", "tip", data=tips, kind="reg",
                  xlim=(0, 60), ylim=(0, 12), color="m", height=7)

这是通过python语言绘制的线性相关曲线拟合图，感觉比R语言在代码上更简洁，且图片能展示的信息更多。

多分组拟合曲线绘制

# -*- coding: utf-8 -*-"""
Created on Mon Nov 19 00:57:53 2018

@author: czh
"""# In[*]#导入各种需要的包#import numpy as npimport matplotlib.pyplot as pltfrom scipy import optimizeimport seaborn as sns
sns.set()# In[*]# Load the iris datasetiris = sns.load_dataset("iris")# Plot sepal with as a function of sepal_length across daysg = sns.lmplot(x="sepal_length", y="sepal_width",hue='species',
               truncate=True, height=5, data=iris)# Use more informative axis labels than are provided by defaultg.set_axis_labels("Sepal length (mm)", "Sepal width (mm)")

多变量子图拟合曲线绘制

# -*- coding: utf-8 -*-"""
Created on Wed Dec 26 11:17:56 2018

@author: czh
"""%reset -f
%clear# In[*]from matplotlib import pyplot as pltimport numpy as npimport pandas as pdimport lifelines as llfrom IPython.display import HTML
%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snsimport plotly.plotly as pyimport plotly.tools as tls   
from plotly.graph_objs import *import osfrom scipy import statsfrom lifelines.estimation import KaplanMeierFitter
kmf = KaplanMeierFitter()from lifelines.statistics import logrank_testfrom sklearn.preprocessing import StandardScaler
os.chdir("D:\\Rwork\\third\\Fig2")# In[*]# Import Datadf = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/mpg_ggplot2.csv")
df_select = df.loc[df.cyl.isin([4,8]), :]# Each line in its own columnsns.set_style("white")
gridobj = sns.lmplot(x="displ", y="hwy", 
                     data=df_select, 
                     height=7, 
                     robust=True, 
                     palette='Set1', 
                     col="cyl",
                     scatter_kws=dict(s=60, linewidths=.7, edgecolors='black'))# Decorationsgridobj.set(xlim=(0.5, 7.5), ylim=(0, 50))
plt.show()

作者：赛乾
链接：https://www.jianshu.com/p/c53fe1ad15be
x

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

幕布斯6054654

手记
篇

粉丝

219

获赞与收藏

1011

关注作者，订阅最新文章

阅读免费教程

Python 办公自动化教程

17个小节 25913 878

Python 算法入门教程

15个小节 27656 1081

Python 进阶应用教程

38个小节 66324 1042

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

Python数据处理从零开始----第四章（可视化）(9)线性相关曲线

基础拟合曲线绘制

多分组拟合曲线绘制

多变量子图拟合曲线绘制

阅读免费教程