这个node是怎么来的?soup.findall方法得到的是列表啊
这个get_text()方法是soup的,但是那个字典是怎么回事,对象到底是什么?
这个get_text()方法是soup的,但是那个字典是怎么回事,对象到底是什么?
2016-06-09
在获取全部链接的循环后面加上代码:
print type(link),type(links)
结果为:<class 'bs4.element.Tag'> <class 'bs4.element.ResultSet'>
说明soup.find_all的返回结果links是一个自定义的类,node也是一种自定义的类
for i in range(3):
print links[i].name, links[i]['href'],links[i].get_text(),links[i]
print type(links[i]),type(links)
由于上面代码可行,说明links虽然不是列表,但是了类似列表,也可以看出node是links(类似列表)的元素,而且node的类里面应该是有一个将字符串储存为字典的部分,后面的node['href']才可行
举报