为了账号安全,请及时绑定邮箱和手机立即绑定

我可以展平一个深度嵌套的 Python 字典,其中包含带有更多嵌套字典列表的值吗?

我可以展平一个深度嵌套的 Python 字典,其中包含带有更多嵌套字典列表的值吗?

RISEBY 2022-10-11 21:40:26
我正在处理一个大型 xml 文件,我一直在尝试提取键和值。此文件中的信息非常敏感,因此我无法分享。我从使用xml图书馆开始。然而,经过几个小时的挫折,我发现了xmltodict图书馆。我使用这个库将我的 xml 转换为字典(相对于 xml,我更熟悉的东西)。import xmltodict# convert xml to dictionarydict_nested = xmltodict.parse(str_xml)既然 xml 是一个字典,我想将它展平,因为它有大量的级别(我不知道有多少级别),同时创建帮助我跟踪其对应值的路径的键名。因此,我尝试了:from flatten_dict import flatten# flatten dict_nested dict_flat = flatten(dict_nested)结果可能看起来像这样,但有更多层:{'ID': '123', 'info': [{'breed':'collie'},           {'fur': [{'short':'no'},                    {'color':[{'black':'no'},                             {'brown':'yes'}]}]}]}这很好用,因为我的键是显示层路径的元组。我的值要么是字符串(即我正在寻找的最终结果),要么是OrderedDict类型的列表。由于每个列表中的每个字典都需要展平,而且我不知道这有多深,我试图找出一种以编程方式展平所有字典的方法,直到所有键对应于单个值(即,不是列表或字典) .理想情况下,输出应如下所示:{'ID':'123', 'info_breed':'collie', 'info_fur_short':'no', 'info_fur_color_black':'no', 'info_fur_color_brown':'yes'}抱歉,由于敏感信息,我无法分享更多我的输出。
查看完整描述

2 回答

?
杨__羊羊

TA贡献1943条经验 获得超7个赞

您可以通过考虑到您的 dicts 值是字符串或具有其他 dicts 的列表来使用递归方法:


dict_flat = {'ID': '123',

 'info': [{'breed':'collie'}, 

          {'fur': [{'short':'no'}, 

                   {'color':[{'black':'no'},

                             {'brown':'yes'}]}]}]}


def my_flatten(dict_flat, key_prefix=None):


    result = {}

    for k, v in dict_flat.items():

        key = f'{key_prefix}_{k}' if key_prefix is not None else k

        if isinstance(v, list):

            for d in v:

                result.update(my_flatten(d, key))

        else:

            result[key] = v

    return result


my_flatten(dict_flat)

输出:


{'ID': '123',

 'info_breed': 'collie',

 'info_fur_short': 'no',

 'info_fur_color_black': 'no',

 'info_fur_color_brown': 'yes'}


查看完整回答
反对 回复 2022-10-11
?
扬帆大鱼

TA贡献1799条经验 获得超9个赞

另一种方法是创建一个生成键/值元组的生成器。您可以简单地将其传递给字典构造函数:


d = {'ID': '123',

     'info': [{'breed':'collie'}, 

          {'fur': [{'short':'no'}, 

               {'color':[{'black':'no'},

                         {'brown':'yes'}]}]}]}


def flatten(obj, prefix=[]):

    if isinstance(obj, str):

        yield ('_'.join(prefix), obj)


    elif isinstance(obj, list):

        for o in obj:

            yield from flatten(o, prefix) 

    else:

        for k, v in obj.items():

            yield from flatten(v, prefix + [k])



dict(flatten(d))

结果:


{'ID': '123',

 'info_breed': 'collie',

 'info_fur_short': 'no',

 'info_fur_color_black': 'no',

 'info_fur_color_brown': 'yes'}

这避免了在函数中管理字典,这取决于您对事物的喜好,可能更容易推理。


查看完整回答
反对 回复 2022-10-11
  • 2 回答
  • 0 关注
  • 118 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信