为了账号安全,请及时绑定邮箱和手机立即绑定

为什么我的html文件里还是显示乱码啊

https://img1.sycdn.imooc.com//5b27c9480001e4a019201080.jpg

https://img1.sycdn.imooc.com//5b27c98700018baf19201080.jpg

就像这样,在程序里print输出正常,但是输出到文件里就是乱码

正在回答

3 回答

解析主要通过parser,你注意现在的百度百科的url和老师的并不同,还有class样式,也要换

0 回复 有任何疑惑可以回复我~
#1

无谓亦无畏

换成啥样的
2018-12-05 回复 有任何疑惑可以回复我~

我也是这个毛病,是怎么回事? 楼上那个方法并不好使

0 回复 有任何疑惑可以回复我~
在一开始打开output.html页面时候就设置编码格式

fout = open('output.html', 'w', encoding='utf-8')
然后在write的时候就不用在encode了。


0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么我的html文件里还是显示乱码啊

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信