我有大量的大型 json 文件可供使用。不幸的是,并非所有的 json 数据都是结构良好的。简而言之,数据的形状类似于[ { A1:va1, B:[ {B1:vb1, ...}, {B2...}, {...} ] }, { A2 ....}, {....} ]一个A对象数组,其中包含一个由非对多B对象组成的内部数组。不幸的是,在随机情况下,给定的B对象会出现结构违规。我想要做的是遍历A级别但强制B对象被视为单独的字符串,而不是由 json.loads() 解析 - 或 - 导致 json.loads() 将 a 的每个实例B视为字符串,所以我可以记录B字符串以进行第一手检查。正如我所说,上面的数据形状只是简而言之。在真实数据中,顶层还有很多模棱两可的事情A~因此我认为我无法成功地定义模式并将其有效地应用于这些数据。至少在顶层A没有任何结构性违规。
1 回答
慕尼黑的夜晚无繁华
TA贡献1864条经验 获得超6个赞
问题是我可以确定地检查数据。在 15 分钟内,我得到了使用这种方法的答案;不是我想要的答案,但至少我现在知道我必须处理什么。
我使用 JSON Formatter 插件将一个文件加载到 Notepad++ 中。将其格式化并将其放入 Excel 工作表中。添加了几列带有方程式的列以指出感兴趣的行、几个 Ctrl-F 查找全部和排序。
现在我最糟糕的情况就在我面前。但至少我现在知道了。
添加回答
举报
0/150
提交
取消