为了账号安全,请及时绑定邮箱和手机立即绑定

请问为什么我的最后一行代码显示的结果很奇怪?


# -*- coding:utf-8 -*-
from urllib import request
import http.cookiejar

url="http://www.baidu.com"

print("第一种方法")
response1 = request.urlopen(url)
print(response1.getcode())
print(len(response1.read()))

print("第二种方法")
req=request.Request(url)
req.add_header("user-agent","Mpzilla/5.0")
response2=request.urlopen(req)
print(response2.getcode())
print(len(response2.read()))


print("第三种方法")
cj=http.cookiejar.CookieJar()
opener=request.build_opener(request.HTTPCookieProcessor(cj))
request.install_opener(opener)
response3=request.urlopen(url)
print(response3.getcode())
print(cj)
print(response3.read())

http://img1.sycdn.imooc.com//57c5b2f300012f8110040758.jpg

去掉最后一行代码的结果是正常的

http://img1.sycdn.imooc.com//57c5b33e00011be810040758.jpg


正在回答

2 回答

read()是读取的网页原码,所以看着就没那么爽了


0 回复 有任何疑惑可以回复我~

response3.read()  前面没有加len() 所以直接对request(也就是下载的本地页面)进行了读取  

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

请问为什么我的最后一行代码显示的结果很奇怪?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信