去掉.encode('utf-8') 出错 不去掉显示\xc2\xa0\n\xef\xbc\x88\xe8\x8b\xb1\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x
去掉.encode('utf-8') 出错 不去掉显示 \xc2\xa0\n\xef\xbc\x88\xe8\x8b\xb1\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x
怎么解决?
去掉.encode('utf-8') 出错 不去掉显示 \xc2\xa0\n\xef\xbc\x88\xe8\x8b\xb1\xe5\x9b\xbd\xe5\x8f\x91\xe9\x9f\xb3\xef\xbc\x
怎么解决?
2017-07-20
在HTML中需要告诉浏览器使用何种编码
fout.write('<html><head><meta charset="UTF-8"></head>')
data['title']是str类型,需要先将str转化为utf-8,再将utf-8转化为Unicode
fout.write("<td>%s</td>" % data['title'].encode('utf-8').decode('utf-8'))
fout.write("<td>%s</td>" % data['summary'].encode('utf-8').decode('utf-8'))
在windows下面,新文件的默认编码是gbk,python解释器会用gbk编码去解析我们的网络数据流txt,然而txt此时已经是decode过的unicode编码,这样的话就会导致解析不了,解决的办法就是,改变目标文件的编码:
fout = open('output.html', 'w', encoding='utf-8')
举报