为了账号安全,请及时绑定邮箱和手机立即绑定

输出结果和老师的不一样啊

import urllib
from pip._vendor.requests.packages import urllib3
from http.cookiejar import Cookie
from http import cookiejar
url = 'http://www.baidu.com/'

print("the first")
response1 = urllib.request.urlopen(url)
print (response1.getcode())
print (len(response1.read()))

print('the second')
request = urllib.request.Request(url)
request.add_header("user-agent", "Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print( response2.getcode())
print (len(response2.read()))

print('the third')
cj = cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print (response3.getcode())
print (cj)
print (len(response3.read()))

输出的结果是:

the first
200
2783
the second
200
98558
the third
200
<CookieJar[<Cookie qh[360]=1 for .baidu.com/>]>
2783

正在回答

1 回答

我得到的结果跟老师的也不一样,跟你的也不一样,估计是页面链接是动态生成的吧,是变化的!

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

输出结果和老师的不一样啊

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信