为了账号安全,请及时绑定邮箱和手机立即绑定

这里的page_url是干什么用的?

def parse(self, page_url, html_cont):

      pass



正在回答

6 回答

视频引用的是2.7的python,在3.*里面大量写法全部改变了

0 回复 有任何疑惑可以回复我~

urljoin函数,哈哈  其实老师在视频里面都说的很清楚啦

0 回复 有任何疑惑可以回复我~

终于懂了~_~

0 回复 有任何疑惑可以回复我~

用help查看发现

http://img1.sycdn.imooc.com//56e8c02e00013e4916370507.jpghttp://img1.sycdn.imooc.com//56e8bf380001077207180177.jpg

0 回复 有任何疑惑可以回复我~
#1

JoshuaShang

不太理解,能够查看一下我的问题吗?最新提的,同一个问题
2016-12-03 回复 有任何疑惑可以回复我~

问题在于urlparse.urljoin(page_url, new_url),是如何将当前爬取得url,和从这个url爬取出的新的不完整的url拼接起来的呢?

0 回复 有任何疑惑可以回复我~

懂了,是spider_main中传入的url

0 回复 有任何疑惑可以回复我~
#1

mirrornighthehe 提问者

当前爬取得url
2016-03-16 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

这里的page_url是干什么用的?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信