我正在寻找一种方法来使用puppeteer有效地抓取以下列方式格式化的信息。 假设我有一个网站上的内容列表,如下所示:<div id="list"> <div class="item" pos="0"> <a href="www.somewebsite.com"> <div class="nameToRetrieve"> Name 1 </div> </div> <div class="item" pos="1"> <a href="www.somewebsite.com"> <div class="nameToRetrieve"> Name 2 </div> </div> <div class="item" pos="2"> <a href="www.somewebsite.com"> <div class="nameToRetrieve"> Name 3 </div> </div></div>如何检索姓名的信息(姓名 1、姓名 2 和姓名 3?我曾尝试将它们放入一个对象中,然后再放入一个数组中,但我仍然对如何处理它感到困惑。const listOfStuff = document.getElementById('list').getElementsByClassName('itemResult')
2 回答

aluckdog
TA贡献1847条经验 获得超7个赞
puppeteer 中有一个特别方便的方法page.$$eval
来处理这个任务:
let result = await page.$$eval('.nameToRetrieve', names => names.map(name => name.textContent)); console.log(result);
此方法在页面内运行 Array.from(document.querySelectorAll(selector)) 并将其作为第一个参数传递给 pageFunction。
结果将是:
[ ' Name 1 ', ' Name 2 ', ' Name 3 ' ]
添加回答
举报
0/150
提交
取消