为了账号安全,请及时绑定邮箱和手机立即绑定

为什么output.html输出的是编码格式,不是中文

输出非中文,如:\xc2\xa0\n\xef\xbc\x88\xe8\x8b\xb1\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x9a/\xcb\x88pa\xc9\xaa\xce\xb8\xc9\x99n/ \xe7\xbe\x8e\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x9a/\xcb\x88pa\xc9\xaa\xce\xb8\xc9\x91\xcb\x90n/\xef\xbc\x89,怎么解决


正在回答

2 回答

看你提问时间感觉你应该在用python3,最后输出到html页面后标题和摘要两部分如果有中文显示出来都是 b'anfdsfsfds'这样的字节串,解决办法是在outputer.html中修改两个地方:
1. 打开文件时直接指定编码
fout = open('output.html', 'w', encoding='utf-8')
2.写如内容时取消编码
fout.write('<td>%s</td>' % data['title'])
fout.write('<td>%s</td>' % data['summary'])

6 回复 有任何疑惑可以回复我~
#1

qq_好急好急_0

这个赞
2017-05-08 回复 有任何疑惑可以回复我~
#2

人生苦短何时乐

厉害啊
2018-11-19 回复 有任何疑惑可以回复我~

由于中文需要 特殊处理一下

如: fout.write('<td>%s</td>'%data[title]) 输出汉字的语句改为

fout.write('<td>%s</td>'%data[title].encoding('utf-8'))

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么output.html输出的是编码格式,不是中文

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信