首页手记使用Zeppelin代替spark-shell

使用Zeppelin代替spark-shell

标签：

Spark

部署

把下载的bin-all.tgz上传到服务器，解压放到自己常用的目录下。
为了使用spark.read.jdbc功能，需要上传一份mysql connector jar到lib/interpreter下，否则spark执行会报错。

启动

使用bin/zeppelin-daemon.sh start启动后台服务
然后使用bin/zeppelin.sh启动web端

这样在服务器的8080端口就可以看见应用界面

设置

我们需要设置到spark的连接，通过右上方的下拉菜单“Interpreter”进入适配器管理界面，设置好到spark集群的连接，然后把这个适配器重启一下。

使用

通过“Create new note”建立一个便签，便签的执行单位是段，每段的右上角都有执行、展示\隐藏代码、展示\隐藏输出，更多操作的工具条。这里每段的代码就和写在spark-shell里面的一样。

最后输出的时候需要注意，为了使用zeppelin的数据可视化功能，推荐以table形式输出，同时组织好输出数据的关系，以便直接展示。现在数据可视化的功能还不是太强大，只可以在settings里面调整数据展示的逻辑。

最后效果展示，这是某系统中各个地点的重量级别发生次数的分布图。

图示略有交互性，可以选择展示的和隐藏的groups，通过图示上方的小圆圈选中与否控制，为了保护数据隐私，这里不作展示。

安全

zeppelin默认任何人都可以访问，这样太不安全了，所以需要加上一点保障，一方面是用户登录权限，一方面是文档的读写权限。
官方的说明页面在此：登录权限,文档权限
首先在zeppelin/conf目录下，把zeppelin-site.xml.template复制成zeppelin-site.xml，把shiro.ini.template复制成shiro.ini。
修改zeppelin-site.xml，把zeppelin.anonymous.allowed的值改成false

保存退出。
然后修改shiro.ini。在[users]段中，按照登录名=密码，角色1，角色2，...角色N的格式添加登录账户，保存退出。
终端里面执行脚本，重启后台服务：
zeppelin-daemon.sh restart
然后刷新网页就可以看到需要登录了。
文档的权限是进入zeppeline后在文档的编辑界面上设置的，参见官方文档的图示，非常简单。

作者：见丰
链接：https://www.jianshu.com/p/16f262e08c88

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

幕布斯6054654

手记
篇

粉丝

219

获赞与收藏

1011

关注作者，订阅最新文章

相关文章推荐

Spark &amp; Zeppelin

美团使用Spark的实践

美团使用Spark的实践

美团使用Spark的实践

Zeppelin连接SqlServer

阅读免费教程

后端通用面试教程

41个小节 30273 342

网络编程入门教程

20个小节 12461 235

Pandas 入门教程

25个小节 18362 330

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

使用Zeppelin代替spark-shell

部署

启动

设置

使用

安全

相关文章推荐

阅读免费教程