为了账号安全,请及时绑定邮箱和手机立即绑定

Java HTTP Client 抓取网页,这个网页无论用什么编码都是乱码?

Java HTTP Client 抓取网页,这个网页无论用什么编码都是乱码?

红糖糍粑 2018-12-07 08:41:51
代码 大概是这样 ,采集其他网页没有问题    ................              client.executeMethod(get);             //             String statusText = get.getStatusText();             //System.out.println("Test.main():--->" + statusText);             System.out.println("Test.main():--->" + new String(get.getResponseBodyAsString().getBytes("GB2312"), "UTF-8"));             InputStream in = get.getResponseBodyAsStream();             BufferedReader br = new BufferedReader(new InputStreamReader(in, charset));             String tempbf;             html = new StringBuffer(100);            ........................
查看完整描述

5 回答

?
ABOUTYOU

TA贡献1812条经验 获得超5个赞

谢谢,其实是网页使用的GZIP压缩,使用GZIPInputSteam接收就可以了

查看完整回答
反对 回复 2018-12-16
?
动漫人物

TA贡献1815条经验 获得超10个赞

@assasszt: 确实,以前貌似有人也遇到过。

查看完整回答
反对 回复 2018-12-16
?
繁星淼淼

TA贡献1775条经验 获得超11个赞

推荐看一下这个系列博文:

Java中文乱码解决之道

查看完整回答
反对 回复 2018-12-16
  • 5 回答
  • 0 关注
  • 519 浏览

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号