首页手记从Linux服务器本地写文件到hdfs

从Linux服务器本地写文件到hdfs

标签：

Linux

使用python中的impala package中的executemany方法向hive table写入数据十分慢。

可以使用pyhdfs向 hdfs文件系统中写入文件，然后加载到table的分区实现。

环境：ubuntu 16.04, anaconda3，python3.6

安装： pip install pyhdfs (先which pip，看一下是否对应anaconda3下的bin中的pip)

连接hdfs:

from pyhdfs import HdfsClient

client = HdfsClient(hosts='10.10.10.10:50070',timeout=60, max_tries=20,user_name=default)

端口号是50070，或者对应hdfs设置的webhdfs的端口号，需要用户名，无需密码

用client.mkdirs(path)，然后用client.copy_from_local(localfile,path)把本地文件拷贝到hdfs中，如果中途报错，

确保：

1.hdfs服务器上的webhdfs打开

Figure. 1

2. 将hdfs各个节点ip和domain加入到本地系统的hosts中：

Figure. 2

最后别忘了，用alter table把分区加载到hdfs table中。

作者：cosine90
链接：https://www.jianshu.com/p/2ed7def34529

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕的地10843

手记
篇

粉丝

202

获赞与收藏

964

关注作者，订阅最新文章

阅读免费教程

Linux 入门教程

50个小节 101048 1432

后端通用面试教程

41个小节 31417 348

网络编程入门教程

20个小节 12893 243

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

从Linux服务器本地写文件到hdfs

阅读免费教程