3 回答

TA贡献1830条经验 获得超9个赞
可能有使用 base python 的解决方案,但我能想到的最简单的方法是使用 pandas 库将每个列表转换为 DataFrame,然后将它们连接/合并在一起。
import pandas as pd
dfA = pd.DataFrame(listA)
dfB = pd.DataFrame(listB)
merged_df = dfA.merge(dfB, left_on='uid', right_on='number')
这将返回一个包含比您需要的更多列的 DataFrame(即“uid”和“number”都有列),但您可以通过这种方式指定您想要的列以及您想要它们的顺序:
merged_df = merged_df[['uid', 'name', 'val1']]
要将多个 DataFrames 合并到一个主框架中,请参见此处:pandasthree -way joins multiple dataframes on columns

TA贡献1812条经验 获得超5个赞
您可以在没有 Pandas 的情况下使用列表推导式来完成此操作,该推导式构建字典字典,按“uid”对列表字典进行分组。然后使用该分组字典的 .values() 再次获取字典列表:
listA = [{"uid": "12345", "name": "John Smith"},{"uid": "67890", "name": "Jane Doe"}]
listB = [{"number": "12345", "person": "John Smith", "val1": "25"},{"number": "67890", "val1": "37"}]
listC = [{"number": "12345", "person": "John Smith", "val2": "65"},{"number": "67890", "val2": "53"}]
from collections import defaultdict
fn = { "number":"uid", "person":"name" } # map to get uniform key names
data = [ { fn.get(k,k):v for k,v in d.items() } for d in listA+listB+listC ]
result = next(r for r in [defaultdict(dict)] if [r[d["uid"]].update(d) for d in data])
print(*result.values())
{'uid': '12345', 'name': 'John Smith', 'val1': '25', 'val2': '65'}
{'uid': '67890', 'name': 'Jane Doe', 'val1': '37', 'val2': '53'}

TA贡献1780条经验 获得超1个赞
您应该将所有输入列表放在列表列表中,以便您可以构建一个映射uid到具有聚合项目值的 dict 的 dict,这样您所需的 dict 列表将只是映射的 dict 值。为了允许在不同的输入字典中对键的命名不一致,pop您不想要的那些(例如number和id在我的示例中)并使用您想要保留的键分配给字典(例如uid在示例中):
wanted_key = 'uid'
unwanted_keys = {'number', 'id'}
mapping = {}
for l in lists:
for d in l:
if wanted_key not in d:
d[wanted_key] = d.pop(unwanted_keys.intersection(d).pop())
mapping.setdefault(d[wanted_key], {}).update(d)
masterlist = list(mapping.values())
所以给出:
lists = [
[
{"uid": "12345", "name": "John Smith"},
{"uid": "56789", "name": "Joe Brown", "val1": "1"}
],
[
{"number": "12345", "name": "John Smith", "val1": "25"},
{"number": "56789", "name": "Joe Brown", "val2": "2"}
],
[
{"id": "12345", "name": "John Smith", "val2": "65"}
]
]
masterlist 变成:
[
{'uid': '12345', 'name': 'John Smith', 'val1': '25', 'val2': '65'},
{'uid': '56789', 'name': 'Joe Brown', 'val1': '1', 'val2': '2'}
]
添加回答
举报