在 _get_new_urls方法中,links = soup.find_all('a',href=re.compile(r"/item/*?"))中的links为列表,new_url = link['href']但是却可以这样赋值,这是什么原因贴上代码:def _get_new_urls(self,page_url,soup): new_urls = set() links = soup.find_all('a',href=re.compile(r"/item/*?")) #返回一个list for link in links: new_url = link['href'] new_full_url = urllib.parse.urljoin(page_url,new_url) new_urls.add(new_full_url) return new_urls
添加回答
举报
0/150
提交
取消