为了账号安全,请及时绑定邮箱和手机立即绑定

scrapy 解析js代码或正则?

scrapy 解析js代码或正则?

holdtom 2018-07-16 14:14:39
用scrapy爬取某网站,数据由js生成,用xpath提取script,获取到如下:define("page_data",         {            "uiConfig": {                "type": "root",                "items":[                     {                        "comid": "itemBasic",                        "items":[                             {                                "id":123,                                "data":我所需的数据                             }                         ]                     }                 ]             }         }     );有什么办法能获取到吗?由于请求数比较多,所以暂时不考虑selenium.有办法能像js一样操作这段数据吗,例如a'uiConfig''items'这样.或者正则的话如何匹配呢?
查看完整描述

2 回答

?
慕慕森

TA贡献1856条经验 获得超17个赞

如果你获得的文本这么有规律的话,那就十分简单了,正则都不需要,去掉第一行,去掉最后一行。然后 data = json.loads(content) ,在通过 data['uiConfig']['items'][0]['items'][0]['data'] 就能拿到了。

查看完整回答
反对 回复 2018-07-20
  • 2 回答
  • 0 关注
  • 1319 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信