为了账号安全,请及时绑定邮箱和手机立即绑定

如何提取标签的这类属性,即含有' - ' 的属性

<li   data-cid="2" data-rid="233">
<li   data-cid="3" data-rid="567512">

如何提取li标签里面的第一个标签,即第一行

正在回答

1 回答

不是把"data-cid"当成其中一个属性来看就行了么,课程中不是有根据"href"属性来提取<a>标签的例子么,把"href"换成"data-cid"试试.如果目标页面的<li data-cid="x">有不定个,就外面套个while循环,循环到该第i个元素找不到为止

0 回复 有任何疑惑可以回复我~
#1

单位瑞文 提问者

如果是用find_all('li' , data-rid='233')会语法报错,而且有些属性名中间有空格,也是会有语法错误,不过我现在用jsoup了,谢了
2016-05-06 回复 有任何疑惑可以回复我~
#2

Haitao_biology 回复 单位瑞文 提问者

你可以尝试一下结合python自带的正则表达式函数来用,匹配属性名后面的数字
2016-05-11 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

如何提取标签的这类属性,即含有' - ' 的属性

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信