为了账号安全,请及时绑定邮箱和手机立即绑定

一个Python的爬虫,有一个地方不懂,望大神解答

一个Python的爬虫,有一个地方不懂,望大神解答

蛊毒传说 2018-07-17 15:08:11
for link in links:    if('href'in dict(link.attrs)):            url = urljoin(page,link['href'])        if url.find("'")!=-1:continue #就是这就话,为什么要找"'"?        url=url.split('#')[0]        if url[0:4]=='http' and not self.isindexed(url):            ewpages.add(url)        LinkText=self.gettextonly(link)        self.addlinkref(page,url,LinkText) <span></span>还是这段话,下面这段话if('href'in dict(link.attrs))这里面dict的作用是什么,没有dict会怎么样?
查看完整描述

2 回答

?
阿晨1998

TA贡献2037条经验 获得超6个赞

这里dict是python中的一个标准函数,意思是将link标记中的属性转换成一个字典(k,v),而这里in的意思是看看href这个属性是否在attrs里出现,默认的link.attrs应该返回的是一个list来的(我猜的)

查看完整回答
反对 回复 2018-07-18
?
繁星淼淼

TA贡献1775条经验 获得超11个赞

如果link.attrs返回的是属性和值组合的list,那么查找起来就相对麻烦一点,如果转换成dict查找就会方便很多

查看完整回答
反对 回复 2018-07-18
  • 2 回答
  • 0 关注
  • 525 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信