为了账号安全,请及时绑定邮箱和手机立即绑定

爬虫爬出来的内容是b'\n\xe6\x8e\xa5\xe5\x8f\xa3\xe6\ 这样的字符是什么原因?

我已经在前面加了#coding=utf-8 没用

正在回答

3 回答

(response.read(),'utf-8')
0 回复 有任何疑惑可以回复我~

我自己也有同样的问题,后来自己给自己解决了,也是参考了别的问题的答案。我再复制一份给你

方法一:

fout.write("<html><meta charset=\"utf-8\" />")

下面这些不需要再写encode('utf-8')

fout.write('<td>%s</td>'%data['url'])

   fout.write('<td>%s</td>'%data['title'])

  fout.write('<td>%s</td>'%data['summary'])


方法二:

fout.write("<html>")

下面这些需要再写encode('utf-8')和decode

fout.write('<td>%s</td>'%data['url'].encode('utf-8').decode('utf-8'))

   fout.write('<td>%s</td>'%data['title'].encode('utf-8').decode('utf-8'))

  fout.write('<td>%s</td>'%data['summary'].encode('utf-8').decode('utf-8'))


原因不懂,但解决了问题


1 回复 有任何疑惑可以回复我~

字体编码问题 可以在最开头加上#-*- coding: UTF-8 -*-试试

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

爬虫爬出来的内容是b'\n\xe6\x8e\xa5\xe5\x8f\xa3\xe6\ 这样的字符是什么原因?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信