Beautiful Soup 4.2.0 文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html
2021-07-19
for t in soup.find_all('a'): # for循环遍历所有a标签,并把返回列表中的内容赋给t
print('t的值是:', t) # link得到的是标签对象
print('t的类型是:', type(t))
print('a标签中的href属性是:', t.get('href')) # 获取a标签中的url链接
print('t的值是:', t) # link得到的是标签对象
print('t的类型是:', type(t))
print('a标签中的href属性是:', t.get('href')) # 获取a标签中的url链接
2020-01-14
之前讲过的这个方式
html = urlopen("https://en.wikipedia.org/robots.txt").read().decode("utf-8")
print(html)
爬出来的结果,似乎还更有秩序一些?
html = urlopen("https://en.wikipedia.org/robots.txt").read().decode("utf-8")
print(html)
爬出来的结果,似乎还更有秩序一些?
2019-11-30
我测试使用story = soup.find( {'class':'story'}) 返回None,使用
story = soup.find( class_='story') 可以正常返回结果
用的是python 3.7
story = soup.find( class_='story') 可以正常返回结果
用的是python 3.7
2018-09-30
如果安装完毕后还是找不到bs4 直接在 PyCharm 的terminal命令行里面输入 pip install bs4 完美解决
2018-09-23