为了账号安全,请及时绑定邮箱和手机立即绑定

如下,想要统计词频前五的,请问这行top5=代码的参数如何修改?

如下,想要统计词频前五的,请问这行top5=代码的参数如何修改?

噜噜哒 2022-05-07 14:10:24
#!/bin/pythonfrom pyspark import SparkConf, SparkContextif __name__ == "__main__":conf = SparkConf().setMaster("local").setAppName("Challenge")sc = SparkContext(conf = conf)sc.setLogLevel("ERROR")input = sc.textFile("/home/shiyanlou/data/")words = input.flatMap(lambda line: line.split(' '))counts = words.map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)top5 = counts.sortBy(xxxxx, ascending = False).take(5)for x in top5:print(x)sc.stop()想要统计词频前五的,请问这行top5 = counts.sortBy(xxxxx, ascending = False).take(5)代码的参数如何修改
查看完整描述

1 回答

?
哈士奇WWW

TA贡献1799条经验 获得超6个赞

首先打开“Microsoft Sql Server Management Studio”,然后再打开“Tool->SQL Server Profiler”,如图:
如果应用比较多的话,界面可能一下子就满了,不好找对应的SQL,你可以按照下面的步骤做:
1、先将程序运行到数据库操作的前一步。
2、清除界面内容。
3、继续运行源码,直到数据库相关操作的源码执行完。
4、暂停‘SQL Server Profiler’的运行。
5、Ctrl+F,输入你想查找的表名、存储过程名等。
选中该行,在最下面就可以看到生成的SQL语句了。

查看完整回答
反对 回复 2022-05-10
  • 1 回答
  • 0 关注
  • 167 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信