课程
/后端开发
/Python
/Python开发简单爬虫
看了代码之后我一直有一个问题,page_url一直是参数,但是作为参数他好像并没有在那个地方传给了soup,那么在soup不知道url的情况下,soup是怎么在相应地址的网页上爬取到新的url的
2017-11-29
源自:Python开发简单爬虫 7-5
正在回答
soup的参数html.cont就是下载器下载到的当前page_url的内容,所以查找当前页的内容时就不再需要page_url了,只用来组成新的url
举报
本教程带您解开python爬虫这门神奇技术的面纱