为了账号安全,请及时绑定邮箱和手机立即绑定

在线等!xpath下怎么提取包含某个字符串的属性值各位有什么建议?

在线等!xpath下怎么提取包含某个字符串的属性值各位有什么建议?

森林海 2019-07-27 00:45:34
1.最近在爬取某个网站时,遇到了一个问题,怎么提取包含了某个字符串的属性值?2.大致内容是这样的:

2 回答

?
慕少森

TA贡献2019条经验 获得超9个赞

不知道题主用BeautifulSoup可不可以?类似这种。
In[1]:frombs4importBeautifulSoup
In[2]:soup=BeautifulSoup("""
...:
...:
...:""")
In[3]:res_list=[]
...:foriteminsoup.find_all("a"):
...:if"thread"initem["href"]:
...:res_list.append(item["href"])
...:
In[4]:res_list
Out[4]:['thread-115861-1-1.html']
                            
查看完整回答
反对 回复 2019-07-27
?
陪伴而非守候

TA贡献1757条经验 获得超8个赞

已经找到了答案,之前是自己没有了解语法,可以用xpath下的语法,用starts-with或者contains都可以。具体语法如下://a[starts-with(@href,"thread")]/@href//a[contains(@href,"thread")]/@href
                            
查看完整回答
反对 回复 2019-07-27

添加回答

代码语言

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号