为了账号安全,请及时绑定邮箱和手机立即绑定

使用JAVA解析网站HTML

使用JAVA解析网站HTML

凤凰求蛊 2019-10-10 14:26:45
我想解析一个简单的网站,并从该网站中抓取信息。我曾经用DocumentBuilderFactory解析XML文件,但我尝试对html文件做同样的事情,但是它总是陷入无限循环。    URL url = new URL("http://www.deneme.com");    URLConnection uc = url.openConnection();    InputStreamReader input = new InputStreamReader(uc.getInputStream());    BufferedReader in = new BufferedReader(input);    String inputLine;     FileWriter outFile = new FileWriter("orhancan");     PrintWriter out = new PrintWriter(outFile);    while ((inputLine = in.readLine()) != null) {        out.println(inputLine);    }    in.close();    out.close();    File fXmlFile = new File("orhancan");    DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();    DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();    Document doc = dBuilder.parse(fXmlFile);    NodeList prelist = doc.getElementsByTagName("body");    System.out.println(prelist.getLength());有什么问题吗?或者,有没有更简单的方法可以从网站中获取给定html标签的数据?
查看完整描述

3 回答

?
慕桂英4014372

TA贡献1871条经验 获得超13个赞

绝对可以找到JSoup。;-)


查看完整回答
反对 回复 2019-10-10
  • 3 回答
  • 0 关注
  • 1279 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信