我想将PySpark数据框的多列合并到的一列中StructType。假设我有一个像这样的数据框:columns = ['id', 'dogs', 'cats']vals = [(1, 2, 0),(2, 0, 1)]df = sqlContext.createDataFrame(vals, columns)我希望得到的数据框类似于此(不是像它实际打印的那样,而是让您了解如果您还不熟悉StructType的意思):id | animals1 | dogs=2, cats=02 | dogs=0, cats=1现在,我可以完成以下任务:StructType( [StructField('dogs', IntegerType(), True), [StructField('cats', IntegerType(), True))udf但是,在我的代码末尾,我宁愿只使用一个函数来完成它。如果不存在,我会感到惊讶。
添加回答
举报
0/150
提交
取消