为了账号安全,请及时绑定邮箱和手机立即绑定

输出的文件,中文乱码

 for data in self.datas:
            fout.write("<tr>")
            print data['url']
            print data['title']
            print data['summary']
            fout.write("<td>%s</td>" % data['url'])
            fout.write("<td>%s</td>" % data['title'].encode('gbk'))
            fout.write("<td>%s</td>" % data['summary'].encode('gbk'))

输出到控制器正常显示。

输出到文件的时候:

(1)若将编码形式改成utf-8能正常编译,但文件内中文都是乱码。

(2)若将编码形式改成gbk,在summary一行不能编译成功。而title一行正常编译,文件内中文也正常显示


求解答。

正在回答

1 回答

建议使用utf-8编码,毕竟这个编码强大。另外是建议你规定一下html的编码格式,代码可以如下修改。

http://img1.sycdn.imooc.com//57a8096200016ff905060297.jpg


望采纳~

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

输出的文件,中文乱码

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信