为了账号安全,请及时绑定邮箱和手机立即绑定

.html文件中乱码是怎么回事?

.html文件中乱码是怎么回事?

正在回答

2 回答

http://img1.sycdn.imooc.com//57a72ca50001e12018830209.jpg显示这样???

0 回复 有任何疑惑可以回复我~

1、在将root_url 作为unicode来处理

    root_url = u"http://baike.baidu.com/view/21087.htm"

2、在获得output.html的输出的时候,指定字符编码

    def output_html(self):
        fout = open('output.html', mode='w',encoding='gb18030')

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

.html文件中乱码是怎么回事?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信