我一直在使用调试器工具 Inspect element 在 Firefox 上手动收集来自谷歌图书和亚马逊的图书预览,在带有图像过滤器的网络选项卡下。这很乏味,所以如果可以的话,我想自动化。我找到了一个用 C 语言编写的便捷工具 (getxbook),它具有三个实用程序:一个用于 google,另一个用于 amazon,第三个用于 barnes and noble。只有 google 实用程序似乎有效。我试图了解亚马逊图片的请求 URL,以便我可以在 Node.js 中实现自动化。这是高分辨率书籍图片的 URL:https://d1b14unh5d6w7g.cloudfront.net/1405193557.01.S00R.JUMBOXXX.jpg?Expires=1596719655&Signature=N69M9pndwI5lhb35vd2XNBC/DAxYpGKIqG+gvhHrY7icH3DxB+DZ8oOZT/pqLJbRiJeHVkBiOTWOqA7wpNctg4fa/MwnvLiZ8jBIOKEJsJ1jhT9Lma4KGCaUapyji3oqz0p/qf42OuGISoKeXjoCX9d9ghbKU1QiIPq6evaLypc=&Key-Pair-Id=APKAIUO27P366FGALUMQ从该页面可以清楚地看出,亚马逊正在使用 CloudFront 签名 URL 来保护交易。首先是我理解的部分:1405193557 是 ISBN10S00R 是页码(在本例中为第 14 页),接下来是 S00S(第 15 页)等。JUMBOXXX 提供高分辨率 (800x1205) [XXXXXXXX 提供低分辨率 (600x903)]Key-Pair-Id:所有页面都一样过期时间:以秒为单位的时间增量签名:172个字符,总是以'='结尾,好像是base64编码我需要了解的部分仍然是:签名:在加载的某个时刻,库 (sitb-library-js.js) 从服务器获取所有图像 url,并预先生成签名我想要的是一种插入代码的方法,该代码在填充后打印 jumboImageUrls[] 列表。我不知道如何推进这个 - greasemonkey?任何想法或经验表示赞赏。
添加回答
举报
0/150
提交
取消