为了账号安全,请及时绑定邮箱和手机立即绑定

html输出乱码,全是下面这样的

<html><body><table><tr><td>http://baike.baidu.com/view/21087.htm</td><td>b'Python'</td><td>b'\nPython\xef\xbc\x88\xe8\x8b\xb1\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x9a/\xcb\x88pa\xc9\xaa\xce\xb8\xc9\x99n/ \xe7\xbe\x8e\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x9a/\xcb\x88pa\xc9\xaa\xce\xb8\xc9\x91\xcb\x90n/\xef\xbc\x89, \xe6\x98\xaf\xe4\xb8\x80\xe7\xa7\x8d\xe9\x9d\xa2\xe5\x90\x91\xe5\xaf\xb9\xe8\xb1\xa1\xe3\x80\x81\xe8\xa7\xa3\xe9\x87\x8a\xe5\x9e\x8b\xe8\xae\xa1\xe7\xae\x97\xe6\x9c\xba\xe7\xa8\x8b\xe5\xba\x8f\xe8\xae\xbe\xe8\xae\xa1\xe8\xaf\xad\xe8\xa8\x80\xef\xbc\x8c\xe7\x94\xb1Guido van

正在回答

3 回答

已经解决啦  我在html_downloader下的read()后加了response.read().decode('utf8',errors='replace')

把html_outputer里面的encode()去掉就好了

0 回复 有任何疑惑可以回复我~
#1

文小丽 提问者

非常感谢!
2017-03-24 回复 有任何疑惑可以回复我~

谢谢楼主,完美解决了我的问题。

0 回复 有任何疑惑可以回复我~

您好,我用的python3.4 修改了之后还是存在乱码问题。。。。。啥情况

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

html输出乱码,全是下面这样的

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信