首页猿问 Pandas Python 搜索...

Pandas Python 搜索 JSON 列表

Python

慕村9548890 2023-05-09 09:33:19

我有一个 JSON 文件结构化列表，所以：[ { "name": "first", "points": 0.5, "tags": [{ "key": "Owner", "value": "A" }] }, { "name": "first", "points": 1.5, "tags": [{ "key": "Owner", "value": "B" }] }, { "name": "first", "points": 24, "tags": [{ "key": "SomeOtherTag", "value": "XYZ" }] }]我想加载这个 JSON 数组，然后过滤特定key: value标签并计算points. 例如，过滤这个“主”列表，然后Owner: A计算应该给我结果的点数0.5我知道如何计算点数，items.points.sum()但我正在努力按标签键/值进行过滤。这是我到目前为止所拥有的：import pandas as pditems = pd.read_json('all_items.json')# Do something to filter down the listfiltered_items = ?????print(filtered_items.points.sum())根据 Rob 的解决方案进行编辑：#pipenv install pandas# pandas = 1.1.0import pandas as pditems = pd.read_json('all_items.json')pd.json_normalize(items, record_path="tags", meta=[['name'], ['points']])给TypeError: string indices must be integers。

查看完整描述

3 回答

慕虎7371278

TA贡献1802条经验获得超4个赞

您可以使用json_normalize：

df = pd.io.json.json_normalize(s)

print(df)

name points tags

0 first 0.5 [{'key': 'Owner', 'value': 'A'}]

1 first 1.5 [{'key': 'Owner', 'value': 'B'}]

2 first 24.0 [{'key': 'SomeOtherTag', 'value': 'XYZ'}]

# to filter

filter_mask = df['tags'].apply(lambda x: x[0]['value'] == 'A')

df.loc[filter_mask, "points"].sum()

反对回复 2023-05-09

慕后森

TA贡献1802条经验获得超5个赞

如果您不严格使用 Pandas，另一种方法是对生成器理解求和，假设tags每行列表中只嵌入一个字典：

sum(entry["points"] for entry in data if entry["tags"][0]["value"] == "A")
0.5

反对回复 2023-05-09

长风秋雁

TA贡献1757条经验获得超7个赞

json_normalize()为你做这一切

js = [{'name': 'first', 'points': 0.5, 'tags': [{'key': 'Owner', 'value': 'A'}]},

{'name': 'first', 'points': 1.5, 'tags': [{'key': 'Owner', 'value': 'B'}]},

{'name': 'first',

'points': 24,

'tags': [{'key': 'SomeOtherTag', 'value': 'XYZ'}]}]

pd.json_normalize(js, record_path="tags", meta=[['name'], ['points']])

输出

key value name points

Owner A first 0.5

Owner B first 1.5

SomeOtherTag XYZ first 24

补充更新

如果从文件中读取

import json

with open('all_items.json') as f: items = json.load(f)

pd.json_normalize(items, record_path="tags", meta=[['name'], ['points']])

反对回复 2023-05-09

3 回答
0 关注
171 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

Pandas Python 搜索 JSON 列表

Pandas Python 搜索 JSON 列表

3 回答

添加回答