为了账号安全,请及时绑定邮箱和手机立即绑定

spark word count环境搭建(scala)

标签:
Spark

安装InteliJ软件

新建工程,如下图

webp

屏幕快照 2018-12-26 23.16.31.png

配置build.sbt

name := "ScalaHelloWorld"version := "1.0"scalaVersion := "2.12.2"libraryDependencies += "org.apache.spark" %% "spark-sql" % "2.4.0"

这里的scala版本需要与系统安装的一致,否则后面sbt编译会报错。
lib依赖配置了,sbt会自动下载需要的包。

准备数据

例如如下简单的文本

hello word count hello

新建scala object

package com.helloimport org.apache.spark.{SparkConf, SparkContext}

object wordCount {  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
      .setMaster("local")
      .setAppName("wordCount")
    val sc = new SparkContext(conf)
    val data = sc.textFile("./example.txt")
    val result = data.flatMap(_.split(" "))
      .map((_,1))
      .reduceByKey(_+_)
      .collect()

    result.foreach(println)

  }

}

运行


webp

屏幕快照 2018-12-26 23.35.11.png


结果如下


webp

屏幕快照 2018-12-26 23.36.14.png


这就是spark word count的最简单的入门环境了。



作者:霖雨07
链接:https://www.jianshu.com/p/0d9613dae620


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消