为了账号安全,请及时绑定邮箱和手机立即绑定

使用数据框中的 matplotlib 并排绘制多个箱线图

使用数据框中的 matplotlib 并排绘制多个箱线图

一只名叫tom的猫 2022-12-27 16:36:57
我正在尝试从一个数据框中并排绘制 60 多个箱线图,我想知道是否有人可以提出一些可能的解决方案。目前我有df_new一个包含 66 列的数据框,我用它来绘制箱线图。我发现绘制箱线图的最简单方法是使用 pandas 中的箱线图包:boxplot = df_new.boxplot(column=x, figsize = (100,50))这给了我一个非常非常小的图表,轴难以辨认,我似乎无法更改字体大小,所以我试图在 matplotlib 中本地执行此操作,但我想不出一种有效的方法。我试图避免使用类似以下内容创建 66 个单独的箱线图:fig, ax = plt.subplots(nrows = 1,                        ncols = 66,                         figsize = (10,5),                        sharex = True) ax[0,0].boxplot(#insert parameters here)我实际上不知道如何将数据从 df_new.describe() 获取到箱线图函数中,所以任何关于此的提示将不胜感激!文档令人困惑。不确定 x 向量应该是什么。理想情况下,我只想为箱线图函数提供数据框,并让它通过动态计算所有四分位数、列分隔等来自动创建所有箱线图——这甚至可能吗?
查看完整描述

1 回答

?
桃花长相依

TA贡献1860条经验 获得超8个赞

我尝试将 the 替换为boxplotridge plot,它占用的空间更少,因为:

  1. 它需要宽度的一半

  2. 你可以部分重叠山脊

  3. 它是垂直发展的,所以你可以向下滚动所有的情节

我从seaborn 文档中获取代码并对其进行了一些调整,以便拥有 60 个不同的正态分布的脊;这里的代码:

import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

import itertools

sns.set(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})


# # Create the data

n = 20

x = list(np.random.randn(1, 60)[0])

g = [item[0] + item[1] for item in list(itertools.product(list('ABCDEFGHIJ'), list('123456')))]

df = pd.DataFrame({'x': n*x,

                   'g': n*g})


# Initialize the FacetGrid object

pal = sns.cubehelix_palette(10, rot=-.25, light=.7)

g = sns.FacetGrid(df, row="g", hue="g", aspect=15, height=.5, palette=pal)


# Draw the densities in a few steps

g.map(sns.kdeplot, "x", clip_on=False, shade=True, alpha=1, lw=1.5, bw=.2)

g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw=.2)

g.map(plt.axhline, y=0, lw=2, clip_on=False)



# Define and use a simple function to label the plot in axes coordinates

def label(x, color, label):

    ax = plt.gca()

    ax.text(0, .2, label, fontweight="bold", color=color,

            ha="left", va="center", transform=ax.transAxes)



g.map(label, "x")


# Set the subplots to overlap

g.fig.subplots_adjust(hspace=-.25)


# Remove axes details that don't play well with overlap

g.set_titles("")

g.set(yticks=[])

g.despine(bottom=True, left=True)


plt.show()

这是我得到的结果:


//img1.sycdn.imooc.com//63aaaedd0001ca9a03151288.jpg

我不知道它是否适合您的需求,无论如何请记住,将如此多的发行版彼此相邻放置总是需要大量空间(和非常大的屏幕)。也许您可以尝试将分布分成更小的组并一次绘制一点?



查看完整回答
反对 回复 2022-12-27
  • 1 回答
  • 0 关注
  • 206 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信