为了账号安全,请及时绑定邮箱和手机立即绑定

来求HTML标签正则匹配。

来求HTML标签正则匹配。

jeck猫 2018-11-13 18:12:58
匹配以下代码中<FONT id=Zoom>........</FONT>之间的内容,因为中间有多个font标签,所以需要成对匹配,其实<FONT id=Zoom>........</FONT>之间的内容就是新闻内容,所以存在不确定的HTML标签个数。谢各位高人帮忙!谢谢......<TR>    <td width="5%"></td>     <td style="......" vAlign=top width="90%">        <FONT id=Zoom>        ........        <p><span><FONT style="FONT-SIZE: 10.5pt">这里是文字内容1。。。。。</FONT></SPAN></p>        <p><Font styel=".....">这里是文字内容2。。。。</Font></p>        <div style="....."><font sytle=".....">这里是文字3。。。。</font></div>        ........        </FONT>    </td></TR>......
查看完整描述

2 回答

?
慕沐林林

TA贡献2016条经验 获得超9个赞

<(?<HtmlTag>[\w]+)[^>]*\sid=(?<Quote>["']?)Zoom(?(Quote)\k<Quote>)["']?[^>]*>
(((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*)</\k<HtmlTag>>

这个绝对可以,我的爬虫就是用这个。


查看完整回答
反对 回复 2018-11-17
  • 2 回答
  • 0 关注
  • 639 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信