为了账号安全,请及时绑定邮箱和手机立即绑定

请各位大佬指点!xpath下怎么提取包含某个字符串的属性值求老司机指点!

请各位大佬指点!xpath下怎么提取包含某个字符串的属性值求老司机指点!

隔江千里 2019-09-26 10:45:32
1.最近在爬取某个网站时,遇到了一个问题,怎么提取包含了某个字符串的属性值?2.大致内容是这样的:
查看完整描述

2 回答

?
拉风的咖菲猫

TA贡献1995条经验 获得超2个赞

不知道题主用BeautifulSoup可不可以?类似这种。
In[1]:frombs4importBeautifulSoup
In[2]:soup=BeautifulSoup("""
...:
...:
...:""")
In[3]:res_list=[]
...:foriteminsoup.find_all("a"):
...:if"thread"initem["href"]:
...:res_list.append(item["href"])
...:
In[4]:res_list
Out[4]:['thread-115861-1-1.html']
                            
查看完整回答
反对 回复 2019-09-26
?
婷婷同学_

TA贡献1844条经验 获得超8个赞

已经找到了答案,之前是自己没有了解语法,可以用xpath下的语法,用starts-with或者contains都可以。具体语法如下://a[starts-with(@href,"thread")]/@href//a[contains(@href,"thread")]/@href
                            
查看完整回答
反对 回复 2019-09-26
  • 2 回答
  • 0 关注
  • 417 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信