为了账号安全,请及时绑定邮箱和手机立即绑定

为什么我使用read()出来的结果不正确

打印网页内容不正确,第一种出来 b' ',第二种不显示,请教一下怎么处理。使用的Python3

代码为:

url = ()
response1 = request.urlopen(url)
(response1.getcode())
((response1.read()))
((response1.read()))

()
req = request.Request(url)
req.add_header()
response2 = request.urlopen(req)
(response2.getcode())
((response2.read()))
(response2.read().decode())

()
cj = cookiejar.CookieJar()
opener = request.build_opener(request.HTTPCookieProcessor(cj))
request.install_opener(opener)
response3 = request.urlopen(url)
(response3.getcode())
((response3.read()))
(cj)
(response3.read().decode())

结果如图:

https://img1.sycdn.imooc.com//5aefc92d00011b8808470224.jpg


正在回答

1 回答

resp2 = response2.read()
((resp2))
(resp2.decode())

同样处理第一种和第三种就可以了。如果不加decode的话,出来的是b'<!DOCTYPE html>\n<!--STATUS OK-->\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n...这样的

1 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么我使用read()出来的结果不正确

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信