为了账号安全,请及时绑定邮箱和手机立即绑定

Pyspark - 计算每个数据框列中空值的数量

Pyspark - 计算每个数据框列中空值的数量

胡子哥哥 2021-06-15 09:04:24
我有一个包含许多列的数据框。我的目标是生成一个列出每个列名称的数据框,以及该列中空值的数量。例子:+-------------+-------------+| Column_Name | NULL_Values |+-------------+-------------+|  Column_1   |      15     ||  Column_2   |      56     ||  Column_3   |      18     ||     ...     |     ...     |+-------------+-------------+我已经设法获得一列的空值数量,如下所示:df.agg(F.count(F.when(F.isnull(c), c)).alias('NULL_Count'))其中c是数据框中的一列。但是,它不显示列的名称。输出是:+------------+| NULL_Count |+------------+|     15     |+------------+有任何想法吗?
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 190 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信