课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

这里的page_url是干什么用的？

def parse(self, page_url, html_cont):

pass

mirrornighthehe

2016-03-16

源自：Python开发简单爬虫 7-5

关注问题我要回答

1470

操作

收起

6 回答

V阿哲
2016-04-24

视频引用的是2.7的python，在3.*里面大量写法全部改变了

0 回复有任何疑惑可以回复我~

啊B
2016-04-24

urljoin函数，哈哈其实老师在视频里面都说的很清楚啦

0 回复有任何疑惑可以回复我~

mirrornighthehe 提问者
2016-03-16

终于懂了~_~

0 回复有任何疑惑可以回复我~

mirrornighthehe 提问者
2016-03-16

用help查看发现

0 回复有任何疑惑可以回复我~

#1

不太理解，能够查看一下我的问题吗？最新提的，同一个问题

2016-12-03 回复有任何疑惑可以回复我~

mirrornighthehe 提问者
2016-03-16

问题在于urlparse.urljoin(page_url, new_url)，是如何将当前爬取得url,和从这个url爬取出的新的不完整的url拼接起来的呢？

0 回复有任何疑惑可以回复我~

mirrornighthehe 提问者
2016-03-16

懂了，是spider_main中传入的url

0 回复有任何疑惑可以回复我~

#1

mirrornighthehe 提问者

当前爬取得url

2016-03-16 回复有任何疑惑可以回复我~

举报

0/150

提交

取消

Python开发简单爬虫

参与学习 227557 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

这里的page_url是干什么用的？

我要回答关注问题

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号