讲师回答 / Peter
一般来说curl下载下来的内容关注的是数据,而html的解析放到浏览器里面对齐很有可能是不同的,因为css也会影响页面布局,不同的浏览器也会有不同。但是,显示在页面上面的数据应该是没问题的。
2014-08-29
讲师回答 / Peter
只能够单独抓取,这个是硬伤。比如页面当中的数据如果是通过Ajax来动态获取的话,curl也是无法拿到这些动态数据的。这两点应该说是curl的使用限制。对于你这个情况,如果能够知道这个frame的url,那么直接抓取它也许就能够帮助你解决这个问题了。如果完整数据是合并起来的,也就是一部分数据在当前页面,一部分在frame里面。那么就只能先抓取当前页面,然后解析当前页面的html,找到这个frame的src,然后再次抓取这个frame的page,最后把两个页面的数据合并起来。
2014-08-17