如何透视DataFrame?我开始使用SparkDataFrames,我需要能够将数据转到多个行的1列中创建多列。在烫伤中有内置的功能,我相信Python中的Pandas,但是我无法为新的SparkDataframe找到任何东西。我想我可以写一些自定义函数来实现这一点,但我甚至不知道如何开始,特别是因为我是一个星火新手。我知道如何使用内置的功能或关于如何在Scala中编写东西的建议来完成这一任务,这是非常值得赞赏的。
3 回答
翻过高山走不出你
TA贡献1875条经验 获得超3个赞
id tag value 1 US 50 1 UK 100 1 Can 125 2 US 75 2 UK 150 2 Can 175
id US UK Can 1 50 100 125 2 75 150 175
val countries = List("US", "UK", "Can")val numCountries = countries.length - 1var query = "select *, "for (i <- 0 to numCountries-1) { query += """case when tag = """" + countries(i) + """" then value else 0 end as """ + countries(i) + ", "}query += """case when tag = """" + countries.last + """" then value else 0 end as """ + countries.last + " from myTable"myDataFrame.registerTempTable("myTable")val myDF1 = sqlContext.sql(query)
添加回答
举报
0/150
提交
取消