为了账号安全,请及时绑定邮箱和手机立即绑定

如何基于值pyspark创建band列

如何基于值pyspark创建band列

四季花海 2021-03-30 14:25:43
我是PySpark的新手,在遇到困难时,我要完成以下任务。我尝试了很少的方法,但是没有一个能正常工作。数据如下:id|numb_of_count|1|3|2|5|3|6|4|2|5|0|6|15|7|8|8|99|我想要达到以下结果:id|numb_of_count|banding|1|3|3-5|2|5|3-5| 3|6|6-10|4|2|2|5|0|0|6|15|+11|7|8|6-10|8|99|+11|由于我拥有大量数据集,如何以最有效的方式实现这一目标?
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 131 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信