为了账号安全,请及时绑定邮箱和手机立即绑定

这个node是怎么来的?soup.findall方法得到的是列表啊

这个get_text()方法是soup的,但是那个字典是怎么回事,对象到底是什么?

正在回答

1 回答

在获取全部链接的循环后面加上代码:

    print type(link),type(links)

结果为:<class 'bs4.element.Tag'> <class 'bs4.element.ResultSet'>

说明soup.find_all的返回结果links是一个自定义的类,node也是一种自定义的类

for i in range(3):
    print links[i].name, links[i]['href'],links[i].get_text(),links[i]
    print type(links[i]),type(links)

由于上面代码可行,说明links虽然不是列表,但是了类似列表,也可以看出node是links(类似列表)的元素,而且node的类里面应该是有一个将字符串储存为字典的部分,后面的node['href']才可行

0 回复 有任何疑惑可以回复我~
#1

ToBeCTO 提问者

非常感谢!结果我看到下一节就有答案了
2016-06-13 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

这个node是怎么来的?soup.findall方法得到的是列表啊

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信