python中的re可以识别<span>标签吗
2 回答

偶然的你
TA贡献1841条经验 获得超3个赞
这个要看你使用的是什么页面解析工具了
html = """ <span class='red'>item1</span> <div> <span id='s1'>item2</span> </div> """ # 使用 scrapy 的Selector from scrapy.selector import Selector # scrapy 的选择器支持 css和xpath选择。下面是css选择器。如果你了解前端JQuery的知识, # 会发现 Selector(text = html).css( 'span::text' ).extract() # 输出 : ['item1','item2'] Selector(text = html).css( 'span#s1::text' ).extract() # 输出 : ['item2'] Selector(text = html).css( 'div>span::text' ).extract() # 输出 : ['item2'] # 使用bs4 from bs4 import BeautifulSoup soup = BeautifulSoup(html, 'html.parser' ) sl = soup.find_all( "span" ) result = [span.get_text() for span in sl] print (result) # ['item1', 'item2'] |
添加回答
举报
0/150
提交
取消