4 回答
TA贡献1818条经验 获得超3个赞
java中利用HtmlAgilityPack API就可以把html解析成xml了。
在HtmlAgilityPack中常用到的类有HtmlDocument、HtmlNodeCollection、
HtmlNode和HtmlWeb等。
其流程一般是先获取HTML,这个可以通过HtmlDocument的Load()或LoadHtml()来加载静态内容,或者也可以HtmlWeb的Get()或Load()方法来加载网络上的URL对应的HTML。
得到了HtmlDocument的实例之后,就可以用HtmlDocument的DocumentNode属性,这是整个HTML文档的根节点,它本身也是一个HtmlNode,然后就可以利用HtmlNode的SelectNodes()方法返回多个HtmlNode的集合对象HtmlNodeCollection,也可以利用HtmlNode的SelectSingleNode()方法返回单个HtmlNode。
HtmlAgilityPack确实是一个功能强大、体积小的开源HTML解析类库,在本篇仅仅是介绍了其中几个类的用法,但光这些就足以供周公快速实现了许久没有实现的功能,如果让周公用正则表达式来实现类似的功能,时间肯定要比用这个长得多。
TA贡献1785条经验 获得超4个赞
先把你要转换的文件放到我的电脑!就我的文档C吧(比如)。然后点文档C,再点“文件夹”上的“工具”。点“文件夹选项(O)”再点上面的“查看”然后点“隐藏受保护的操作系统文件”最后把你要换的文件名称最后的字不是格式吗(HTML,什么的)把原先删掉,换成你要的比如XML就行了,不过不是每个文件都适合任何格式的。
添加回答
举报