已解决430363个问题，去搜搜看，总会有你想问的

hadoop读取GBK编码文件，中文乱码问题求助?

关注

首页猿问 hadoop读取GBK编码文件，中...

hadoop读取GBK编码文件，中文乱码问题求助?

Hadoop

宝慕林4294392 2018-11-18 08:04:30

hadoop读取GBK编码文件，中文乱码问题求助

查看完整描述

1 回答

MMMHUHU

TA贡献1834条经验获得超8个赞

1、hadoop内部默认的文本读取编码设置为utf-8，你的源文件为gbk，在读取时遇到中文时是肯定要出现乱码。
解决方法有二：
（1）将你的GBK编码的文件在生成时，统一成utf-8,这是最好的方式，方便国际化。
（2）重写一个你的hadoop读文件的FileInputFormat对象，在其中进行传相应的编码值与编码转换的工作，这个是比较麻烦，实际当中用得很少。

反对回复 2018-12-08

1 回答
0 关注
1406 浏览

关注

添加回答

举报

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号