python怎么使用xpath获取标签属性
4 回答
幕布斯7119047
TA贡献1794条经验 获得超8个赞
先导入包
from lxml import etree
然后
tree=etree.HTML(detailHtml)
detailHtml是网页内容
dataNoteList=tree.xpath(u'//td')
td 表示标记名称
繁星点点滴滴
TA贡献1803条经验 获得超3个赞
XPath='//*[@id="j-nav-menu-container"]/div/div/div/div/div/div[2]/div[1]/a/@href'
获得a标签的href
XPath='//*[@id="j-nav-menu-container"]/div/div/div/div/div/div[2]/div[1]/a/text()'
获得a标签内容
呼如林
TA贡献1798条经验 获得超3个赞
response.xpath('//h3/a/descendant-or-self::text()[normalize-space()]')
descendant-or-self表明当前node和子代nodes
normal-space()去掉whitespace-only nodes的子代nodes
添加回答
举报
0/150
提交
取消