匹配以下代码中<FONT id=Zoom>........</FONT>之间的内容,因为中间有多个font标签,所以需要成对匹配,其实<FONT id=Zoom>........</FONT>之间的内容就是新闻内容,所以存在不确定的HTML标签个数。谢各位高人帮忙!谢谢......<TR> <td width="5%"></td> <td style="......" vAlign=top width="90%"> <FONT id=Zoom> ........ <p><span><FONT style="FONT-SIZE: 10.5pt">这里是文字内容1。。。。。</FONT></SPAN></p> <p><Font styel=".....">这里是文字内容2。。。。</Font></p> <div style="....."><font sytle=".....">这里是文字3。。。。</font></div> ........ </FONT> </td></TR>......
2 回答
慕沐林林
TA贡献2016条经验 获得超9个赞
<(?<HtmlTag>[\w]+)[^>]*\sid=(?<Quote>["']?)Zoom(?(Quote)\k<Quote>)["']?[^>]*> (((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*)</\k<HtmlTag>>
这个绝对可以,我的爬虫就是用这个。
- 2 回答
- 0 关注
- 639 浏览
相关问题推荐
添加回答
举报
0/150
提交
取消