python怎么使用xpath获取标签属性
4 回答
![?](http://img1.sycdn.imooc.com/5458692c00014e9b02200220-100-100.jpg)
幕布斯7119047
TA贡献1794条经验 获得超8个赞
先导入包
from lxml import etree
然后
tree=etree.HTML(detailHtml)
detailHtml是网页内容
dataNoteList=tree.xpath(u'//td')
td 表示标记名称
![?](http://img1.sycdn.imooc.com/54584d6100015f5802200220-100-100.jpg)
繁星点点滴滴
TA贡献1803条经验 获得超3个赞
XPath='//*[@id="j-nav-menu-container"]/div/div/div/div/div/div[2]/div[1]/a/@href'
获得a标签的href
XPath='//*[@id="j-nav-menu-container"]/div/div/div/div/div/div[2]/div[1]/a/text()'
获得a标签内容
![?](http://img1.sycdn.imooc.com/533e4c3300019caf02000200-100-100.jpg)
呼如林
TA贡献1798条经验 获得超3个赞
response.xpath('//h3/a/descendant-or-self::text()[normalize-space()]')
descendant-or-self表明当前node和子代nodes
normal-space()去掉whitespace-only nodes的子代nodes
添加回答
举报
0/150
提交
取消