我正在尝试将一个大型合并数据集显示到散点图中,以找出人均 GDP 与孩子数量之间的关系。数据框看起来像这样。如何删除具有 Nan 值的行并绘制散点图?或者我只是直接绘制图形,它会忽略所有具有 NaN 值的行?任何帮助都会非常感谢:) 另外,在计算第二列和第三列的平均值时,我是否在另一列上显示结果?Country | Number of kids | GDP per capita A | 4 | 2345 B | 2 | 2156 C | NaN | 1156 D | 5 | 958 E | NaN | NaN F | 8 | NaN... Z | 3 | 2
1 回答

慕仙森
TA贡献1827条经验 获得超8个赞
使用 pandas 的dropna()函数删除 nan,然后用scatter()matplotlib 绘图。
import pandas as pd
import matplotlib.pyplot as plt
enter code here
df = <your dataset>
plot_df = df.dropna()
plt.scatter(plot_df['Number of kids'], plot_df['GDP per capita'])
如果您的数据集非常大,请考虑使用 sample 函数对数据进行随机采样:
df = df.sample(1000)
添加回答
举报
0/150
提交
取消