使用pycharm时输出结果在浏览器上访问时现实乱码
我是使用pycharm进行爬虫的,输出结果在pycharm里浏览是显示正常的中文,但是在用chrom浏览器打开访问却显示乱码,这是什么原因?
我是使用pycharm进行爬虫的,输出结果在pycharm里浏览是显示正常的中文,但是在用chrom浏览器打开访问却显示乱码,这是什么原因?
2017-04-12
我也遇到了这个问题,很好解决。你们可以看一下任何一个网站的源码 例如本网站
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>使用pycharm时输出结果在浏览器上访问时现实乱码..._慕课问答</title>
他会有这一句句话 <meta charset="utf-8">
这就是 html 编码的约束 。
所以在 html_outputer.py 的这句话
for date in self.datas:
前面 添加
fout.write("<meta charset='utf-8'>")
output_html() 方法应为:
def output_html(self): fout = open('output.html','w') fout.write("<html>") fout.write("<body>") fout.write("<table>") fout.write("<meta charset='utf-8'>") for data in self.datas: fout.write("<tr>") fout.write("<td>%s</td>" % data['url']) fout.write("<td>%s</td>" % data['title'].encode('utf-8')) fout.write("<td>%s</td>" % data['summary'].encode('utf-8')) fout.write("</tr>") fout.write("</table>") fout.write("</body>") fout.write("</html>") fout.close()
举报