3 回答
TA贡献1844条经验 获得超8个赞
您可以像这样使用熊猫:
import pandas as pd
df = pd.DataFrame([{'budget_id': 1, 'name': 'Maria', 'amount': 980, 'user': '10', 'gift': 'Phone', 'cost': 325}, {'budget_id': 1, 'name': 'Maria', 'amount': 980, 'user': '10', 'gift': 'Flower', 'cost': 195}, {'budget_id': 2, 'name': 'Scott', 'amount': 2100, 'user': '10', 'gift': 'Paris Trip', 'cost': 599}, {'budget_id': 2, 'name': 'Scott', 'amount': 2100, 'user': '10', 'gift': 'Ring', 'cost': 1200}])
df = df.groupby('budget_id').agg({'name': set,
'amount': set,
'cost': set ,
'user': set,
'gift': set}).reset_index()
print(df.to_dict('records'))
TA贡献1886条经验 获得超2个赞
该解决方案不会对数组的任何元素进行硬编码,但是由于您对不同的键有不同的要求,因此需要对这些键进行硬编码才能正确处理它们。在合并后的示例中,您只有 ['Maria'],而如果您有两个成本相同的项目,您肯定会期望成本为 [150, 150],而不是 [150]。
final = {} # key is budget_id, and value is the all dictionaries merged
for dict in list:
budget_id = dict['budget_id']
if budget_id in final:
# for each key you'll do something like this
dictToModify = final[budget_id]
dictToModify.append(dict['gift'])
# for each key in dictionary, add it to the list
# some will be added always to the list: e.g. cost
# some will be added only once, e.g. name and budget_id
else:
# here you're just putting everything in a list as in your final_data example
final[ budget_id ] = {key:[value] for (key,value) in dict.items()}
final_data = list(final.values())
如果元素不存在,则此循环将元素添加到最终字典,或者如果已存在具有相同 budget_id 的元素,则合并。循环的最后一步是将其转换为字典列表。
TA贡献1827条经验 获得超8个赞
这是一个解决方案,raw_data为了更好地演示而进行了扩展:
raw_data = [{'budget_id': 1, 'name': 'Maria', 'amount': 980, 'user': '10', 'gift': 'Phone', 'cost': 325}, {'budget_id': 1, 'name': 'Maria', 'amount': 980, 'user': '10', 'gift': 'Flower', 'cost': 195}, {'budget_id': 2, 'name': 'Scott', 'amount': 2100, 'user': '10', 'gift': 'Paris Trip', 'cost': 599}, {'budget_id': 2, 'name': 'Scott', 'amount': 2100, 'user': '10', 'gift': 'Ring', 'cost': 1200}, {'budget_id': 2, 'name': 'Scott', 'amount': 2100, 'user': '10', 'gift': 'Watch', 'cost': 240}]
final_data = []
for entry in raw_data:
found = False
for ind, final in enumerate(final_data):
# Look if the budget entry already exists
if entry['budget_id'] in final['budget_id']:
found = True
break
if found:
# Merge
# Everything - issue if any entry just happens
# to be the same (like cost)
#for key, value in entry.items():
#if not (entry[key] in final[key]):
# final_data[ind][key].append(entry[key])
# Alternative - specific entries only
final_data[ind]['gift'].append(entry['gift'])
final_data[ind]['cost'].append(entry['cost'])
else:
# If not yet there - add it as a new item, converting
# all values to lists
final_data.append({x:[y] for x,y in entry.items()})
print(final_data)
代码循环遍历raw_data循环中的所有字典。对于每个字典,它然后循环遍历所有现有条目以final_data跟踪索引enumerate。使用budget_id它检查是否已经遇到并存储了预算条目。如果是这种情况,它会设置一个适当的标志并中断循环。
在第二部分,如果尚未遇到该条目,则将其final_data作为字典附加到列表中,并将其所有值转换为列表。
如果它已经存在 - 数据被合并。这里有两个选项,一个,注释掉的一个,如果值不相同/不存在,它将所有内容合并在一起。这对于很容易重复的商品价格之类的东西不利,但为了完整起见,我保留了它。
在第二个当前版本中,它只是查找特定的项目键并与它们合并。这假定即使 中有重复项gifts,也应该包括它们。
添加回答
举报