<P>最近做一个下载网页的程序,下载后想要把网页中的无用内容都过滤掉。</P><P>想找一个过滤javascript脚本块的正则表达式。</P><P>让我崩溃的是,在网上找了三天,竟找不到一个能用的。</P><P>比如这个:"<script[\s\S]+</script *>"</P><P>它会把"<script"和"</script>"中所有都替换掉。<BR>如果页头部分有个脚本块,然后页面底部也有一个脚本块,它就把这之间所有内容给匹配了。这显然是不正确的。<BR></P><P>期待高人...</P>
2 回答
- 2 回答
- 0 关注
- 964 浏览
添加回答
举报
0/150
提交
取消