现在有个需求需要抓取一个网站的文章,包括js,css.html所有文件,然后保存下来变成自己的文章,文章是通过ajax异步加载的。所以想请问下,这种需求,采用哪种方式实现比较好一点,scrapy splash和puppeteer好像原理差不多。除了上面两种还有没其他的框架适合我现在的这个需求的,语言就在node和ptyhon中选,求指教。
添加回答
举报
0/150
提交
取消